給你bam文件,你會畫插入片段長度分布圖嗎?

2021-03-03 生信修煉手冊

歡迎關注」生信修煉手冊」!

對於ATAC文庫而言,其插入片段的長度分布有著非常典型的規律,示意如下

每200bp會存在一個峰,這個周期性波動反應的是核小體的個數。在ATAC_seq的數據分析中,會對插入片段長度分布進行可視化,觀察其是否符合這樣的周期性規律,一定程度可以反映文庫構建的質量,那麼如何在做這樣一張分布圖呢?

比對之後我們會得到bam文件,畫圖所需的插入片段長度就需要從bam文件中提取,需要注意,這裡的插入片段是文庫中adapter之間的插入片段,即fragment, 需要和insert size區別開來。

對於單端測序而言,只有bam文件是不夠的,需要藉助工具來預測fragment length, 這裡就不展開了。對於雙端測序而言,事情就變得簡單了。bam文件的第9列直接存儲了fragment length的信息,直接提取之後就可以用來畫圖,提取的代碼如下

samtools view input.bam | \
awk -F'\t' 'function abs(x){return ((x < 0.0) ? -x : x)} {print $1"\t"abs($9)}' | \
sort | uniq | cut -f2 > fragment.length.txt

bam文件中每一行以reads為單位,這裡去重是為了避免來自同一個fragemnts的reads重複統計。提取好之後,用R畫圖就可以了,R代碼如下

data <- read.table("fragment.length.txt", header = F)
# 設置插入片段長度的閾值,過濾掉太長的片段
length_cutoff <- 1200
fragment <- data$V1[data$V1 <= length_cutoff]
# 利用直方圖統計頻數分布,設置柱子個數
breaks_num <- 500
res <- hist(fragment, breaks = breaks_num, plot = FALSE)
# 添加坐標原點
plot(x = c(0, res$breaks),
y = c(0, 0, res$counts) / 10^2,
type = "l", col = "red",
xlab = "Fragment length(bp)",
ylab = expression(Normalized ~ read ~ density ~ 10^2),
main = "Sample Fragment sizes")

輸出結果示意如下

這種是最簡單的方式,除此之外,還有picard的CollectInsertSizeMetrics, bedtools的bamPEFragmentSize也都可以計算插入片段長度,但是在我看來,還是本文介紹的方式最為簡單直接。

原創不易,歡迎收藏,點讚,轉發!生信知識浩瀚如海,在生信學習的道路上,讓我們一起並肩作戰!本公眾號深耕耘生信領域多年,具有豐富的數據分析經驗,致力於提供真正有價值的數據分析服務,擅長個性化分析,歡迎有需要的老師和同學前來諮詢。

轉發本文至朋友圈,後臺私信截圖即可加入生信交流群,和小夥伴一起學習交流。

掃描下方二維碼,關注我們,解鎖更多精彩內容!



相關焦點

  • 一篇文章說清楚什麼是「插入片段」?
    相信許多人第一次看到這個東西的時候心中或多或少都會有類似的困惑,我曾經也有過這樣的疑問,我不明白什麼是「插入片段」,甚至不明白為什麼會有「插入片段」這種詞。所以,這一篇文章我們就主要來說說什麼是二代測序的插入片段以及它的特點都有哪些。什麼是插入片段(Insert)?
  • 教你如何在PPT中插入動畫、視頻、音頻.
    一、在PowerPoint 中插入flash 影片的方法法一:利用控制項插入法1.調出工具箱。操作步驟:啟動powerpoint,從主菜單中選擇-視圖-工具欄-控制項工具箱。2.在控制項工具箱中選擇「其他控制項」,這時會列出電腦中安裝的Active X 控制項,找到Shockw ave Flash Object 控制項。
  • PPT幻燈片中插入視頻的三種小方法...
    在製作PPT幻燈片時是不是時常會遇到需要插入視頻的情況然後瞎搗鼓半天卻還是達不到滿意的效果下面,小編就向大家分享PPT中插入視頻的三種方法這種播放方法是將事先準備好的視頻文件作為電影文件直接插入到幻燈片中,該方法是最簡單、最直觀的一種方法,使用這種方法將視頻文件插入到幻燈片中後,PPT只提供簡單的[暫停]和[繼續播放]控制,而沒有其他更多的操作按鈕供選擇。
  • 在PPT 中插入動畫、視頻、音頻、解說的方法
    2.在控制項工具箱中選擇「其他控制項」,這時會列出電腦中安裝的Active X 控制項,找到Shockw ave Flash Object 控制項。3.這時,滑鼠變成「 」,在幻燈片中需要插入flash 動畫的地方畫出一個框。4.在框中點擊滑鼠右鍵,點擊屬性,然後出現Shockwave Flash Object 屬性設置欄。
  • 如何在PPT中插入動畫、視頻、音頻、解說等
    如圖12.在控制項工具箱中選擇「其他控制項」,這時會列出電腦中安裝的Active X控制項,找到ShockwaveFlash Object控制項。如圖2。3.這時,滑鼠變成「+」,在幻燈片中需要插入flash動畫的地方畫出一個框。如圖3。4.在框中點擊滑鼠右鍵,點擊屬性,如圖4,然後出現ShockwaveFlash Object屬性設置欄,如圖5。
  • 會一次性插入多行,但批量隔行插入空白行,你會嗎?
    上次我們分享過如何一次性插入多行多列,(見:Excel一次性插入多行多列,這個方法快且好用),但在製作Excel表格過程中,我們還往往需要批量隔行插入空白行,那麼怎麼做呢?答案是肯定的,今天將分享如何批量隔行插入空白行。
  • 【值得收藏】在PPT 中插入動畫、視頻、音頻、解說的方法
    2.在控制項工具箱中選擇「其他控制項」,這時會列出電腦中安裝的Active X 控制項,找到Shockw ave Flash Object 控制項。3.這時,滑鼠變成「 」,在幻燈片中需要插入flash 動畫的地方畫出一個框。4.在框中點擊滑鼠右鍵,點擊屬性,然後出現Shockwave Flash Object 屬性設置欄。
  • 如何在PDF文件中插入另一個PDF呢?
    我們日常編輯PDF文檔時,有時需要用到另一個PDF中的內容,一般會通過插入PDF的頁面或以PDF為附件添加這兩種方式,那麼分別應該如何操作呢?一、插入另一個PDF頁面1、用極速PDF編輯器打開PDF文檔後,點擊編輯器右上角導航欄文檔中的頁面,並選擇從文件插入;2、根據頁面提示上傳另一個PDF,在彈出的插入文檔窗口中設置需要插入的頁面範圍以及被插入到現在PDF文檔的頁面後,點擊確定即可。
  • Word教程:你會在Word中插入手寫籤名嗎?
    用手機拍下BOSS的籤名圖片存入電腦,然後將籤名圖片插入到Word文檔中選中插入的籤名圖片,在【格式】選項卡下【調整】組中點【顏色】,選擇【重新著色】中的【黑白:50%】剪切圖片,粘貼為圖片,選中圖片,【格式】-【顏色】-【設置透明色】,出現一個筆的形狀,點一下圖片白色部分,就可以將白色背景刪除點圖片右方的【布局選項】,選擇【浮於文字上方】,電子版的手寫籤名就製作完成!
  • 如何在PPT中插入動畫、視頻、音頻、解說……
    四、在用PowerPoint製作課件時加入解說詞   在PPT中能插入的動畫和視頻、音頻格式動畫:swf gif視頻:avi mpg wmv    音頻:avi mpg wav mid mp3(有的不支持)一、在PowerPoint中插入flash影片的方法   法一:利用控制項插入法   1.調出工具箱。
  • word中怎麼畫填空題的下劃線
    在辦公應用中經常會用Word來編輯一些考試填空題,合同,求職表之類的文件,讓同學來填空,或者是一些求職表讓應聘者來填,但是文件中的空格下劃線是怎麼畫出來的呢?今天就來教大家哈!第一種方法是按ctrl+u快捷鍵,然後按鍵盤的空格鍵,下劃線的長度根據個人需求而定,同樣取消下劃線也是按ctrl+u。
  • 手把手教你用iMovie
    在這裡建議大家提前新建一個文件夾分類存放各種素材,文件的名稱也最好能夠標記出它的內容,在導入素材的同時按照時間先後的順序將它們排列,這樣剪輯起來便會得心應手。將上方的素材拖拽至下方的時間線中如果此時你要選擇視頻的一部分拖入時間線中,請按住R鍵並用滑鼠拖動節選視頻拖入時間線中。如果你想在一個素材的中間插入另一個素材,請單擊時間線中你想要插入的部分,再單擊所要插入的素材,在「編輯」菜單中選擇「插入」。
  • 在電腦上如何剪切音頻文件?教你兩招快收好!
    3.點擊"添加文件",將所需要進行提取的視頻添加進入進行操作4.導入音頻文件後,接下來就是剪輯音頻文件了,這裡有三種方法可以選擇,分別是平均分割、時間分割和手動分割,大家可以每一個都打開看一下,喜歡哪種方法就使用哪一種方法就可以了,選出需要剪切的音頻段,點擊"確認並添加到輸出列表"
  • 這3種打開pdf文件的方法你會哪個
    pdf文件是一種可攜式文件。它不像word文檔和excel表格那樣打開就可以編輯。而打開pdf文件的方法,大家都知道是什麼嗎?如果大家對pdf文件的打開方法不太熟悉的話,可以學習一下小編分享的3種pdf文件的打開方式。方法一:PDF編輯器PDF編輯器是可以打開pdf文件的,小編經常使用的就是【迅捷PDF編輯器】了。
  • 你真的了解打擊樂嗎?趕緊手拉手一起BAM BAM BAM!
    不要一說起打擊樂,你就不由自主的開始「動次打次」「動次打次」,好像渾身都充滿了節奏感,就連說話都是自帶音效的。沒錯,就說你呢!
  • 面試官:String長度有限制嗎?是多少?
    本人就遇到過面試的時候問這個的,而且在之前開發的中也真實地遇到過這個String長度限制的場景(將某固定文件轉碼成Base64的形式用字符串存儲,在運行時需要的時候在轉回來,當時文件比較大),那這個規範限制到底是怎麼樣的,咱們話不多說先瞜瞜去。
  • 如何在幻燈片中插入Flash動畫?
    Flash動畫一直考慮給幻燈片內容配上視頻片段,但公司對演示文稿的體積有要求,而視頻的體積又太大了。後來了解到可以在PowerPoint中插入Flash動畫,因此設計了一些Flash動畫。如何在PowerPoint 2010中插入Flash動畫並讓其正確播放呢?→ 解決方案:         使用Shockwave Flash Object控制項插入Flash動畫。
  • JP楊跟你聊聊iMovie
    原來使用PR來編輯視頻,後來接觸iMovie發現它非常簡單易用,比PR更適合延時素材編輯。注意:iMovie是把素材直接複製一份在它的目錄,所以要保證mac的硬碟空間容量。這樣的好處就是預覽和編輯會非常快而且不怕沒有連移動硬碟而失去素材連結,缺點就是佔硬碟空間。而PR只是連結,好處是保存的項目文件非常小,缺點就是經常會要求查找脫機文件(存在不同移動硬碟上)。資源庫包含整理在事件中的片段,以及您所創建的項目。