近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代MAnorm2計算模型。該模型能夠對多樣本ChIP/ATAC-seq數據按照特定標籤分組,進行統計建模和組間定量比較,可靠地在樣本組層面鑑定組間顯著差異的ChIP/ATAC-seq信號。
染色質免疫共沉澱測序(ChIP-seq)實驗被廣泛用於刻畫轉錄因子結合和組蛋白修飾的全基因組分布。比較來自不同細胞類型的ChIP-seq樣本是刻畫細胞分化及病變過程中動態轉錄和表觀調控的關鍵基礎。2012年,邵振與中科院分子植物科學卓越創新中心研究員張一婧等合作,在Genome Biology上發表了用於兩個ChIP-seq樣本之間進行一對一定量比較的MAnorm模型。近年來,隨著實驗技術的發展和測序成本的不斷降低,在ChIP-seq樣本組(而非單個樣本)之間進行比較分析,已成為越來越常見的研究需求。一方面,科研人員會產生同一實驗的多個生物學重複以提高實驗結果的可信度;另一方面,通過將來自不同個體的樣本根據特定標籤(如年齡、性別、患病與否、疾病亞型等)分組進行比較,研究人員能夠控制個體差異造成的影響,更可靠地識別與該標籤關聯的差異結合位點。然而,由於ChIP-seq實驗固有的高複雜度和高噪聲水平,以及不同比較場景特有的技術困難,現階段對多樣本ChIP-seq數據進行分組定量比較,仍是一個較大的計算方法學挑戰。
在ChIP-seq數據標準化這一步,MAnorm2沿用了MAnorm的核心假設,通過重構其信號強度變換體系,新發展了以參照樣本為基準的多樣本並行ChIP-seq信號標準化流程。進一步,針對多樣本分組比較的需求,MAnorm2搭建了一個理論上適應任意樹狀分組結構的層級化多樣本標準化策略。在完成標準化後,MAnorm2針對每個基因組區域上觀察到的ChIP-seq信號組間差異進行統計檢驗。在通常組內樣本數較少的局限下(2~3個重複本),為更準確地衡量每一個基因組區域上的組內樣本間ChIP-seq信號變化水平(within-groupvariability),MAnorm2設計出一個經驗貝葉斯框架,利用擬合均值-方差曲線以給單個區域的組內變化水平賦予一個先驗分布,並進一步通過平衡先驗和後驗觀測以更準確地估計ChIP-seq信號的組內變化水平,從而提高對組間差異ChIP-seq信號的靈敏度(圖1)。
與已有的其他經驗貝葉斯方法相比,MAnorm2的最大優勢在於考慮了不同樣本組的組內ChIP-seq信號變化水平可能存在系統性差別。這一情形在正常人和癌症患者之間的比較中常出現:由於腫瘤組織或血液樣本本身的異質性及癌症亞類型和不同患病階段的多樣性,癌症樣本組的組內信號變化水平高於正常樣本組。為解決該問題,MAnorm2通過在建模過程中引入一個方差比率因子,把不同樣本組的全局組內信號變化水平修正至一致,使用修正後的方差進行均值-方差曲線的擬合和參數估計(圖2)。研究人員系統比較了MAnorm2與現有的其他ChIP-seq差異分析工具,發現MAnorm2展現出更優越的使用性能,尤其是當進行比較的樣本組擁有不同組內變化水平時,如癌症和正常樣本作比較。此外,該模型的應用場景和統計模型具有良好的可擴展性。研究人員展示了MAnorm2在ATAC-seq數據差異分析上同樣適用,將其統計模型擴展至可同時比較的任意多個樣本組,發現其使用效果優於傳統的ANOVA方法。
營養與健康所博士後塗世奇為論文第一作者,邵振為論文通訊作者。張一婧、美國西南醫學中心教授徐劍、波士頓大學教授David J. Waxman對該研究工作的提出和完善做出了重要貢獻。研究工作獲得國家自然科學基金委、科技部、中科院等的支持。
論文連結
圖1.(A)在不同基因組區域間擬合均值-方差曲線(mean-variance curve;MVC)。(B)根據不同的統計指標對基因啟動子按照差異H3K4me3 ChIP-seq信號的可能性進行排序,並計算其中差異表達基因(differentially expressed genes;DEGs)啟動子所佔的比例。(C)檢查不同類型的基因啟動子上差異H3K4me3的統計顯著性。虛線對應P值為0.05
圖2.(A)對來自不同的人的H3K27ac ChIP-seq樣本進行主成分分析。這裡LCL(lymphoblastoid cell line)組包含三個源於正常人的B細胞的細胞系;CLL(chronic lymphocytic leukemia)組包含三個源於慢性淋巴細胞白血病患者的B細胞的細胞系。(B)關於來自不同組的均值和未修正的方差的散點圖。(C)關於均值和修正後的方差的散點圖,以及由此進行下一步統計建模
【來源:中國科學院科技產業網】
聲明:轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯繫,我們將及時更正、刪除,謝謝。 郵箱地址:newmedia@xxcb.cn