營養與健康所等建立MAnorm2計算模型---中國科學院

2020-12-08 中國科學院

  近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代MAnorm2計算模型。該模型能夠對多樣本ChIP/ATAC-seq數據按照特定標籤分組,進行統計建模和組間定量比較,可靠地在樣本組層面鑑定組間顯著差異的ChIP/ATAC-seq信號。

  染色質免疫共沉澱測序(ChIP-seq)實驗被廣泛用於刻畫轉錄因子結合和組蛋白修飾的全基因組分布。比較來自不同細胞類型的ChIP-seq樣本是刻畫細胞分化及病變過程中動態轉錄和表觀調控的關鍵基礎。2012年,邵振與中科院分子植物科學卓越創新中心研究員張一婧等合作,在Genome Biology上發表了用於兩個ChIP-seq樣本之間進行一對一定量比較的MAnorm模型。近年來,隨著實驗技術的發展和測序成本的不斷降低,在ChIP-seq樣本組(而非單個樣本)之間進行比較分析,已成為越來越常見的研究需求。一方面,科研人員會產生同一實驗的多個生物學重複以提高實驗結果的可信度;另一方面,通過將來自不同個體的樣本根據特定標籤(如年齡、性別、患病與否、疾病亞型等)分組進行比較,研究人員能夠控制個體差異造成的影響,更可靠地識別與該標籤關聯的差異結合位點。然而,由於ChIP-seq實驗固有的高複雜度和高噪聲水平,以及不同比較場景特有的技術困難,現階段對多樣本ChIP-seq數據進行分組定量比較,仍是一個較大的計算方法學挑戰。

  在ChIP-seq數據標準化這一步,MAnorm2沿用了MAnorm的核心假設,通過重構其信號強度變換體系,新發展了以參照樣本為基準的多樣本並行ChIP-seq信號標準化流程。進一步,針對多樣本分組比較的需求,MAnorm2搭建了一個理論上適應任意樹狀分組結構的層級化多樣本標準化策略。在完成標準化後,MAnorm2針對每個基因組區域上觀察到的ChIP-seq信號組間差異進行統計檢驗。在通常組內樣本數較少的局限下(2~3個重複本),為更準確地衡量每一個基因組區域上的組內樣本間ChIP-seq信號變化水平(within-group variability),MAnorm2設計出一個經驗貝葉斯框架,利用擬合均值-方差曲線以給單個區域的組內變化水平賦予一個先驗分布,並進一步通過平衡先驗和後驗觀測以更準確地估計ChIP-seq信號的組內變化水平,從而提高對組間差異ChIP-seq信號的靈敏度(圖1)。

  與已有的其他經驗貝葉斯方法相比,MAnorm2的最大優勢在於考慮了不同樣本組的組內ChIP-seq信號變化水平可能存在系統性差別。這一情形在正常人和癌症患者之間的比較中常出現:由於腫瘤組織或血液樣本本身的異質性及癌症亞類型和不同患病階段的多樣性,癌症樣本組的組內信號變化水平高於正常樣本組。為解決該問題,MAnorm2通過在建模過程中引入一個方差比率因子,把不同樣本組的全局組內信號變化水平修正至一致,使用修正後的方差進行均值-方差曲線的擬合和參數估計(圖2)。研究人員系統比較了MAnorm2與現有的其他ChIP-seq差異分析工具,發現MAnorm2展現出更優越的使用性能,尤其是當進行比較的樣本組擁有不同組內變化水平時,如癌症和正常樣本作比較。此外,該模型的應用場景和統計模型具有良好的可擴展性。研究人員展示了MAnorm2在ATAC-seq數據差異分析上同樣適用,將其統計模型擴展至可同時比較的任意多個樣本組,發現其使用效果優於傳統的ANOVA方法。

  營養與健康所博士後塗世奇為論文第一作者,邵振為論文通訊作者。張一婧、美國西南醫學中心教授徐劍、波士頓大學教授David J. Waxman對該研究工作的提出和完善做出了重要貢獻。研究工作獲得國家自然科學基金委、科技部、中科院等的支持。

  論文連結 

  圖1.(A)在不同基因組區域間擬合均值-方差曲線(mean-variance curve;MVC)。(B)根據不同的統計指標對基因啟動子按照差異H3K4me3 ChIP-seq信號的可能性進行排序,並計算其中差異表達基因(differentially expressed genes;DEGs)啟動子所佔的比例。(C)檢查不同類型的基因啟動子上差異H3K4me3的統計顯著性。虛線對應P值為0.05

  圖2.(A)對來自不同的人的H3K27ac ChIP-seq樣本進行主成分分析。這裡LCL(lymphoblastoid cell line)組包含三個源於正常人的B細胞的細胞系;CLL(chronic lymphocytic leukemia)組包含三個源於慢性淋巴細胞白血病患者的B細胞的細胞系。(B)關於來自不同組的均值和未修正的方差的散點圖。(C)關於均值和修正後的方差的散點圖,以及由此進行下一步統計建模

相關焦點

  • 營養與健康所等建立MAnorm2計算模型
    近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代
  • 科研人員建立MAnorm2計算模型
    近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代MAnorm2計算模型。
  • 營養與健康所等開發新的定量蛋白質組數據差異分析計算模型
    8月13日,國際學術期刊Cell Discovery 在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普計算生物學研究所)邵振課題組研究論文「MAP: model-based analysis of proteomic data to detect proteins with significant abundance changes
  • 新世界集團慈善基金資助建立「中國科學院上海生命科學研究院營養...
    10月29日下午,新世界集團慈善基金捐資建立「中國科學院上海生命科學研究院營養科學研究所癌症研究實驗室」捐贈儀式暨揭牌典禮及在滬舉行。   新世界集團慈善基金向營養所捐贈1000萬港幣,用於建立癌症研究實驗室。
  • 昆明動物所建立大樣本獼猴腦影像標準化模型
    該研究由中國科學院昆明動物研究所客座研究員、腦科學與智能技術卓越創新中心(神經科學研究所)研究員王徵團隊完成,在162隻健康食蟹猴上採集了高分辨的磁共振影像數據,製作了食蟹猴腦圖譜,並建立了標準化模型(normative model),描述單個獼猴大腦的解剖結構特徵隨年齡變化的軌跡。
  • 科學家建立大樣本獼猴腦影像標準化模型
    該研究由中國科學院昆明動物研究所客座研究員、腦科學與智能技術卓越創新中心(神經科學研究所)研究員王徵團隊完成,在162隻健康食蟹猴上採集了高分辨的磁共振影像數據,製作了食蟹猴腦圖譜,並建立了標準化模型(normative model),描述單個獼猴大腦的解剖結構特徵隨年齡變化的軌跡。
  • 科學家建立大樣本獼猴腦影像標準化模型
    該研究由中國科學院昆明動物研究所客座研究員、腦科學與智能技術卓越創新中心(神經科學研究所)研究員王徵團隊完成,在162隻健康食蟹猴上採集了高分辨的磁共振影像數據,製作了食蟹猴腦圖譜,並建立了標準化模型(normative model),描述單個獼猴大腦的解剖結構特徵隨年齡變化的軌跡。該大樣本標準化模型可用於獼猴疾病模型的參考對照,推動個體化定量統計分析實現。
  • 營養與健康所等發現乳腺癌腫瘤幹細胞調控新機制
    5月19日,國際學術期刊《自然-通訊》(Nature Communications)在線發表了中國科學院上海營養與健康研究所胡國宏研究組題為SH3RF3 promotes breast cancer stem-like properties via JNK activation and PTX3 upregulation 的最新研究成果
  • Psychological Review | 心理所構建中文閱讀的認知計算模型
    其中一個顯著特點是中文文本在詞和詞之間沒有空格,這使得現有的閱讀模型面對中文時都無能為力。以大量實驗研究為基礎,中國科學院行為科學重點實驗室李興珊研究員構建了中文閱讀過程中認知加工的計算模型(中文閱讀模型,簡稱CRM),成果發表在《Psychological Review》上。
  • 健康所、營養所、巴斯德所三所聯合開展實驗動物平臺工作人員
    為提高實驗動物平臺工作人員的專業技能及確保平臺的穩定運行,中國科學院上海生命科學研究院健康科學研究所、營養科學研究所、上海巴斯德研究所三所於11月13日起在生命科學實驗樓A座2樓會議廳聯合開展了為期兩天的實驗動物平臺工作人員聯合培訓,組織了30多位平臺工作人員參加。
  • 武漢病毒所建立新冠小鼠感染模型,有望緩解動物模型緊張問題
    近日,中國科學院武漢病毒研究所/生物安全大科學研究中心研究員、新發傳染病中心副主任張波團隊建立了一種以甲病毒為載體的、快速高效的新型冠狀病毒(SARS-CoV-2)小鼠感染模型,相關成果在線發表於國際學術期刊Cell Research (《細胞研究》)。
  • 武漢病毒所建立新冠小鼠感染模型,有望緩解動物模型緊張問題
    近日,中國科學院武漢病毒研究所/生物安全大科學研究中心研究員、新發傳染病中心副主任張波團隊建立了一種以甲病毒為載體的、快速高效的新型冠狀病毒(SARS-CoV-2)小鼠感染模型,相關成果在線發表於國際學術期刊Cell Research (《細胞研究》)。
  • 中國科學院上海營養與健康研究所人類基因組測序服務採購項目公開...
    中國科學院上海營養與健康研究所人類基因組測序服務採購項目公開招標公告 公告信息: 採購項目名稱 中國科學院上海營養與健康研究所人類基因組測序服務採購項目 品目 服務/其他服務 採購單位 中國科學院上海營養與健康研究所
  • 最新成年人群癌症預測模型:基於中國健康與營養調查(CHNS)數據!
    而腫瘤風險預測對於提高人群健康水平、降低患者經濟負擔意義重大。但隨著醫療大數據的產生,傳統的統計預測方法逐漸無法滿足需求,有必要嘗試開展機器學習等新方法在腫瘤預測領域的應用。 研究方法 數據來源於中國健康與營養調查
  • 營養與健康所等發現IGF2R調控「質子改道」賦予巨噬細胞抗炎潛能
    中國科學院上海營養與健康研究所研究員王瑩、時玉舫課題組在Science Advances上,在線發表了題為IGF2R-initiated proton rechanneling dictates an anti-inflammatory property in macrophages的研究論文。
  • 科研人員提出小鼠多發性硬化模型的營養幹預方法
    營養與免疫之間存在複雜的相互影響關係,飲食幹預措施已被證明可有效預防代謝性疾病並延緩衰老進程。近期,中國科學院上海營養與健康研究所陳雁研究組博士生白美娟等利用多發性硬化症小鼠模型,研究間歇性節食的幹預功效。該研究利用髓鞘少突膠質細胞糖蛋白的一個多肽免疫小鼠來誘導多發性硬化症的發生,並分析了間歇性節食方案對多發性硬化症的幹預功效。
  • 營養與健康所闡述血液中細胞特異性的DNA甲基化改變
    近期,中國科學院上海營養與健康研究所(中國科學院-馬克斯·普朗克科學促進學會計算生物學夥伴研究所)研究員Andrew Teschendorff課題組與研究員汪思佳課題組合作,在Nature Communications上,在線發表題為A cell-type deconvolution meta-analysis of whole blood EWAS reveals
  • 肱骨有限元模型建立及生物力學分析
    結果:建立了正常肱骨三維幾何模型和有限元模型利用ANSYS軟體,對模型進行了有效性驗證。所建模型物理特性與真實骨骼相近,能很好地反映骨骼的力學變化,實現手法的定量分析。結論:所建立的肱骨模型外形逼真、在不同載荷下的應力值與相關文獻一致,可用作中醫仿真系統中的虛擬骨折模型。
  • 新計算力學方法:交大團隊建立軸對稱問題力學分析模型
    在常規「態」基近場動力學框架下,也已從早期的三維模型發展出二維平面應力和平面應變模型。然而,有很多涉及斷裂失效的問題同樣表現出明顯的軸對稱性,而軸對稱問題在近場動力學領域的研究幾乎未見發表。因此,為了高效地分析這類問題,建立相應的軸對稱近場動力學模型是重要且必需的。
  • 營養與健康所在基於木黴的真菌毒素脫毒轉化、玉米原料中真菌毒素汙染風險預警研究中獲進展
    9月1日,Environmental Pollution在線發表了中國科學院上海營養與健康研究所研究員武愛波研究組題為Confrontation assays and mycotoxin treatment reveal antagonistic activities of Trichoderma and the fate of Fusarium mycotoxins in microbial