peak差異分析的工具那麼多,如何選擇?

2021-02-20 生信修煉手冊

歡迎關注」生信修煉手冊」!

對於ATAC_seq, chip_seq等抗體富集型文庫而言,peak calling是分析的第一步。通過peak calling,可以得到抗體富集的區域,這些區域有對應的生物學功能,在chip_seq中,可以是轉錄因子結合區或者發生組蛋白修飾的區域,ATAC中對應的就是開放染色質區域。

上述各種測序研究的對象都是基因的表達調控,peak calling幫助我們得到調控片段的染色體位置,可以構建潛在的調控網絡。眾所周知,基因表達調控是一個動態變化的過程,不同生長階段,不同實驗條件的樣本間,其調控元件是會存在差異的,而研究這個動態過程,其意義更加重大,對應到數據上,peak caling之後,我們要做的就是peak 的差異分析。

peak差異分析的工具很多,不同軟體的結果不盡相同,如何選擇是一個難題。在下列文章中,以chip_seq數據為例,針對已經發表的多個peak差異分析工具進行了探索

文章連結如下

http://bioinfo.sibs.ac.cn/shaolab/pdf/2017%20quantitative%20biology;%20review%20of%20chipseq%20differential%20binding%20analysis.pdf

peak 差異分析與peak caling的結果緊密相依,在上述文獻中,將peak差異分析總結為了兩大類,示意如下

第一類,類似轉錄組差異分析的策略,首先基於peak calling的結果,統計peak區域在各個樣本中的表達量,然後進行歸一化,差異分析;第二類,採用了隱馬可夫模型,將基因組的區域分為了非差異,上調,下調3種不同狀態,構建3種狀態間的轉移矩陣,二者最大的區別就在於第二類的軟體不需要依賴已有的peak calling結果。

在實驗設計中,還需要考慮到一個因素就是生物學重複,雖然大多數實驗都是有生物學重複的,但是沒有生物學重複的情況也不可避免,這在選擇對應的分析軟體時要充分考慮。為了方便選取,文獻中整理了如下所示的決策樹

首先明確是是否基於已有的peak區域進行分析,如果不基於已有的peak區域,可以選擇滑動窗口或者隱馬可夫模型, 其中基於滑動窗口的軟體如下

diffReps

PePr

基於隱馬可夫模型的軟體如下

ChIPDiff

ODIN

THOR

如果基於已有的peak結果進行分析,則需要根據有無生物學重複進行判斷,如果沒有生物學重複,可以選擇MAnorm或者GFOLD軟體,如果有生物學重複,而且統計的是raw count格式的表達量,則可以用轉錄組中常用的edgeR, DESeq進行差異分析,如果不是raw count, 則可以用DBChip, ChIPComp, voom來進行分析。

在文章中,說明了用edgeR和DESeq進行peak 差異分析的理由,將peak看做是RNA_seq中的基因,則其定量方式和差異分析可以通用。另外,文章中還提到一種很有啟發的差異分析思路,用macs和scier等peak caling軟體進行差異分析,這些軟體的常規用法是比較實驗樣本和input樣本的差異,進行peak calling, 在用其進行差異分析時,將對照組的樣本看做input, 將實驗組的樣本設置為case, 然後進行peak calling,最終鑑定到的區域,可以看做是兩組間的差異peak 區域。

這篇文章發表的比較早,一些些的差異peak分析軟體沒有包括進來,比如DiffBind, macs2的差異peak 分析功能,後續在詳細介紹各個軟體的用法。

原創不易,歡迎收藏,點讚,轉發!生信知識浩瀚如海,在生信學習的道路上,讓我們一起並肩作戰!本公眾號深耕耘生信領域多年,具有豐富的數據分析經驗,致力於提供真正有價值的數據分析服務,擅長個性化分析,歡迎有需要的老師和同學前來諮詢。

轉發本文至朋友圈,後臺私信截圖即可加入生信交流群,和小夥伴一起學習交流。

掃描下方二維碼,關注我們,解鎖更多精彩內容!



相關焦點

  • OmicShare差異分析工具上線了!
    萬眾期待的差異分析工具終於上線OmicShare Tools了!從此以後,不需要寫代碼就可以隨心所欲分析自己的數據了!想怎麼比較就怎麼比較!炒雞凍的是不是?那麼趕緊跟著小師妹學習一下如何使用這個差異分析工具吧!
  • DEBKS | 專門的環狀RNA差異分析工具
    「出道即巔峰」的edgeR或DESeq被廣泛應用於高通量測序的差異表達分析,包括環狀RNA的差異表達分析。然而,做過環狀RNA差異表達分析的老師應該都清楚,反向剪切(back-splicing)的環狀RNA並不像mRNA或lncRNA那樣馴服。
  • MEME:motif分析的綜合性工具
    MEME是一個motif分析的工具箱,提供了多種相關工具,網址如下http://meme-suite.org/index.html根據分析目的和功能,將相關工具劃分成了以下4大類別1.MoMo常見的應用場景是根據chip_seq等數據獲取到的peak序列,挖掘這些序列中存在的模式特徵。
  • 要分析組間的差異,該如何選擇正確的統計方法?
    差異分析主要用於:(1)判斷因變量在兩組或多組之間的統計學差異,各組之間可以是獨立的,也可以是非獨立的;(2)如果多組之間存在差異,進一步開展兩兩比較,分析差異來源。 比如,分析不同醫療機構醫生收入水平的差異。
  • 網站流量如何分析,流量分析工具內容分享
    網站流量如何分析,作為seoer對於流量應該都不會陌生吧,那麼在面對到網站流量情況的時候,大家是否有做好這些數據的分析呢?可以說做好網站的流量分析,可以幫助我們發現網站上存在的問題,幫助我們找到如何提高網站流量的方式,那麼流量分析要怎麼做呢?一個好用的流量分析統計工具就非常重要了,統計流量這是seoer都在做的工作,目前我們常見的流量統計工具主要為百度統計,那麼為什麼說通過流量統計分析可以幫助發現網站存在的問題呢?
  • 數據分析工具太多該怎麼選擇合適的軟體?
    SPSS可以在不需要程式語言的情況下,很好地進行回歸分析、方差分析、多變量分析等的研究。 SAS同SPSS一樣,是一個做專業統計分析的軟體。功能更強大,統計方法齊、全、新。相對SPSS來說,功能更強大,相對來講,SAS比較難學些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設計等還是SAS比較好用。
  • ​腫瘤差異分析、互作分析神器,這個資料庫到底有多好用?
    然後選擇好腫瘤類型之後,在左下框就能看到針對腫瘤的各亞組比對分析,首先這裡有cancer v.s. cancer,在這裡可以對不同分期之間進行差異分析,而且分析得到的差異mRNA和差異lncRNA都是可以下載的,這是小編覺得這個資料庫比較省心的地方
  • 數據分析的三大框架:底層技術、分析建模、工具選擇
    數據分析的三大框架數據科學的框架分為三部分:底層技術框架/數據分析框架/工具選擇框架,接下來依次給大家介紹:1.可視化的本質是面對非本領域專家,為了方便信息的傳達,用圖形直觀的方式展示分析成果(分析模型),圖形主要是各種統計圖表和邏輯框架圖.,圖形的選擇標準主要是根據變量屬性(定量數據還是定類數據),變量個數,希望達成的展示目標決定。
  • go to peak
    《go to peak》是一款十分有趣的冒險闖關小遊戲,玩家需要在遊戲中不斷控制一個引擎來讓自己躲避各種障礙物,一步步來到陰暗地牢的高出,慢慢尋找出口,在不同的地方還有小人在阻擋你,千萬要小心哦。
  • 差異基因富集分析及作圖
    前面介紹了怎麼分析差異基因,那麼肯定需要對差異基因進行功能富集分析,今天simplify老師來給大家介紹一下怎麼做差異基因富集分析。
  • ChIP-Seq數據挖掘系列-3: Motif 分析(3) - 利用ChIP-Seq結果在基因組區域中尋找富集的Motifs
    4.3 計算peak 對應序列GC/CpG含量4.4 根據設定的大小準備背景序列用於尋找motif 區域大小使用("-size <#>")設置。HOMER 一般選取基因TSS +/- 50kb區域分成設定大小;然後計算這些背景序列GC/CpG% 儲存起來用於後續分析。
  • 雲平臺在線LEfSe差異分析|OmicStudio重磅雲工具
    在大家千呼萬喚之下,聯川生物LEfSe雲工具正式上線啦,中文界面,以及最最最簡單的操作方法,無需整理表格,直接上傳咱的結果文件,LEfSe分析信手拈來。那麼就介紹下具體操作吧。首先打開聯川生物雲平臺LefSe雲工具:https://www.omicstudio.cn/tool/60選擇LefSe分析工具,然後進入分析頁面,選擇左側開始繪製按鈕。
  • 工具篇丨三大經典在線生存分析工具測評(含教程)
    大師姐在此實名推薦3個在線生存分析神器,同時也是在腫瘤相關文獻中出現率非常高的生存分析工具:GEPIA、Kaplan-Meier Plotter、OncoLnc。總結:Kaplan-Meier Plotter可調整的臨床信息全、數據使用的自由度高、能自動選擇最佳Cutoff值即分組策略、操作簡便、出圖也相對美觀;由於用的是製作者自測的資料庫,因此本網站也可以作為TCGA相關數據挖掘工具的補充。
  • RNA-seq的3的差異分析R包你選擇哪個
    在2010-2015年間,RNA-seq本身就是跟現在的單細胞差不多的當紅炸子雞的地位,無數的軟體工具,網頁資料庫,測評文章湧現出來。
  • 電鏡那麼多探測器,拍攝時我到底該如何選擇?
    那我們該如何根據樣品類型以及所關注的問題選擇合適的電鏡條件呢?前幾期我們已經介紹過加速電壓、束斑束流、工作距離該如何根據實際應用需求選擇。在開始掃描的時候儘量將明暗對比度調節至最合適的條件,如果一開始明暗對比不適合,利用軟體自帶的處理工具可以對圖像進行優化,如圖5-33。調整完的可以清楚的判別出其中至少五種灰度襯度,而調整前只能勉強分辨四種襯度。
  • 初學XPS (X射線光電子能譜)|第二期:軟體介紹,XPS peak的安裝與使用
    打開origin,將C1s的數據複製到origin中,做成曲線圖,並通過數據讀取工具來識別C1s譜中的峰值坐標(主要是結合能)。首先導入數據(複製、粘貼)通過數據讀取工具來識別C1s譜中的峰值坐標利用XPS peak軟體導入txt文件Data→Import(ASCII)→選擇上一步建立的txt文件
  • Alpha多樣性指數的計算和差異分析(差異檢驗結果可視化)
    Alpha多樣性指數計算目前可以用來計算alpha多樣性指數的工具非常的多,可以說基本上所有的微生物群落分析工具或相關的統計學軟體都包含了alpha多樣性指數的計算功能,最不濟我們還可以根據每個指數的公式進行手動計算。
  • 工具、手動大家是如何選擇的呢?
    那麼外鏈要怎麼做呢?是使用工具發還是手工發呢?這裡很從心seo就來和大家說說有關外鏈的那些事情吧。但是從質量上來說,手工自己做的外鏈的質量那就要遠遠的高於工具了,不僅如此,手工外鏈,我們可以選擇不同的平臺,可以選擇不同的方式,甚至可以使用不同的內容去做,而工具,我們在填寫相應的內容後,工具只會機械地進行發布,而這樣的質量,很明顯就要低於手工。
  • Kaleidoscope for Mac(圖片和文本差異比較工具)
    有脾氣的小女子 舉報   Kaleidoscope Mac 版是一款運行在Mac平臺上圖片和文本差異比較工具
  • 谷歌分析(Google Analytics)是很厲害的網站分析工具,可是它有那麼...
    (Google Analytics)是很厲害的網站分析工具,可是它有那麼多項數據,時間有限,我該怎麼讀懂和利用?」以上這些,谷歌分析都可以告訴你! 那麼問題又來了:為什麼要知道這些情況呢?當然是為了獲得更多的客戶或者詢盤,摸清客戶的喜好和路數,把你的廣告準確地推送到他們面前。