營養與健康所等建立MAnorm2計算模型

2021-01-15 瀟湘晨報

近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代MAnorm2計算模型。該模型能夠對多樣本ChIP/ATAC-seq數據按照特定標籤分組,進行統計建模和組間定量比較,可靠地在樣本組層面鑑定組間顯著差異的ChIP/ATAC-seq信號。

染色質免疫共沉澱測序(ChIP-seq)實驗被廣泛用於刻畫轉錄因子結合和組蛋白修飾的全基因組分布。比較來自不同細胞類型的ChIP-seq樣本是刻畫細胞分化及病變過程中動態轉錄和表觀調控的關鍵基礎。2012年,邵振與中科院分子植物科學卓越創新中心研究員張一婧等合作,在Genome Biology上發表了用於兩個ChIP-seq樣本之間進行一對一定量比較的MAnorm模型。近年來,隨著實驗技術的發展和測序成本的不斷降低,在ChIP-seq樣本組(而非單個樣本)之間進行比較分析,已成為越來越常見的研究需求。一方面,科研人員會產生同一實驗的多個生物學重複以提高實驗結果的可信度;另一方面,通過將來自不同個體的樣本根據特定標籤(如年齡、性別、患病與否、疾病亞型等)分組進行比較,研究人員能夠控制個體差異造成的影響,更可靠地識別與該標籤關聯的差異結合位點。然而,由於ChIP-seq實驗固有的高複雜度和高噪聲水平,以及不同比較場景特有的技術困難,現階段對多樣本ChIP-seq數據進行分組定量比較,仍是一個較大的計算方法學挑戰。

在ChIP-seq數據標準化這一步,MAnorm2沿用了MAnorm的核心假設,通過重構其信號強度變換體系,新發展了以參照樣本為基準的多樣本並行ChIP-seq信號標準化流程。進一步,針對多樣本分組比較的需求,MAnorm2搭建了一個理論上適應任意樹狀分組結構的層級化多樣本標準化策略。在完成標準化後,MAnorm2針對每個基因組區域上觀察到的ChIP-seq信號組間差異進行統計檢驗。在通常組內樣本數較少的局限下(2~3個重複本),為更準確地衡量每一個基因組區域上的組內樣本間ChIP-seq信號變化水平(within-groupvariability),MAnorm2設計出一個經驗貝葉斯框架,利用擬合均值-方差曲線以給單個區域的組內變化水平賦予一個先驗分布,並進一步通過平衡先驗和後驗觀測以更準確地估計ChIP-seq信號的組內變化水平,從而提高對組間差異ChIP-seq信號的靈敏度(圖1)。

與已有的其他經驗貝葉斯方法相比,MAnorm2的最大優勢在於考慮了不同樣本組的組內ChIP-seq信號變化水平可能存在系統性差別。這一情形在正常人和癌症患者之間的比較中常出現:由於腫瘤組織或血液樣本本身的異質性及癌症亞類型和不同患病階段的多樣性,癌症樣本組的組內信號變化水平高於正常樣本組。為解決該問題,MAnorm2通過在建模過程中引入一個方差比率因子,把不同樣本組的全局組內信號變化水平修正至一致,使用修正後的方差進行均值-方差曲線的擬合和參數估計(圖2)。研究人員系統比較了MAnorm2與現有的其他ChIP-seq差異分析工具,發現MAnorm2展現出更優越的使用性能,尤其是當進行比較的樣本組擁有不同組內變化水平時,如癌症和正常樣本作比較。此外,該模型的應用場景和統計模型具有良好的可擴展性。研究人員展示了MAnorm2在ATAC-seq數據差異分析上同樣適用,將其統計模型擴展至可同時比較的任意多個樣本組,發現其使用效果優於傳統的ANOVA方法。

營養與健康所博士後塗世奇為論文第一作者,邵振為論文通訊作者。張一婧、美國西南醫學中心教授徐劍、波士頓大學教授David J. Waxman對該研究工作的提出和完善做出了重要貢獻。研究工作獲得國家自然科學基金委、科技部、中科院等的支持。

論文連結

圖1.(A)在不同基因組區域間擬合均值-方差曲線(mean-variance curve;MVC)。(B)根據不同的統計指標對基因啟動子按照差異H3K4me3 ChIP-seq信號的可能性進行排序,並計算其中差異表達基因(differentially expressed genes;DEGs)啟動子所佔的比例。(C)檢查不同類型的基因啟動子上差異H3K4me3的統計顯著性。虛線對應P值為0.05

圖2.(A)對來自不同的人的H3K27ac ChIP-seq樣本進行主成分分析。這裡LCL(lymphoblastoid cell line)組包含三個源於正常人的B細胞的細胞系;CLL(chronic lymphocytic leukemia)組包含三個源於慢性淋巴細胞白血病患者的B細胞的細胞系。(B)關於來自不同組的均值和未修正的方差的散點圖。(C)關於均值和修正後的方差的散點圖,以及由此進行下一步統計建模

【來源:中國科學院科技產業網】

聲明:轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯繫,我們將及時更正、刪除,謝謝。 郵箱地址:newmedia@xxcb.cn

相關焦點

  • 營養與健康所等建立MAnorm2計算模型---中國科學院
    近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代MAnorm2計算模型。
  • 科研人員建立MAnorm2計算模型
    近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代MAnorm2計算模型。
  • 營養與健康所等開發新的定量蛋白質組數據差異分析計算模型
    8月13日,國際學術期刊Cell Discovery 在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普計算生物學研究所)邵振課題組研究論文「MAP: model-based analysis of proteomic data to detect proteins with significant abundance changes
  • 昆明動物所建立大樣本獼猴腦影像標準化模型
    該研究由中國科學院昆明動物研究所客座研究員、腦科學與智能技術卓越創新中心(神經科學研究所)研究員王徵團隊完成,在162隻健康食蟹猴上採集了高分辨的磁共振影像數據,製作了食蟹猴腦圖譜,並建立了標準化模型(normative model),描述單個獼猴大腦的解剖結構特徵隨年齡變化的軌跡。
  • 最新成年人群癌症預測模型:基於中國健康與營養調查(CHNS)數據!
    而腫瘤風險預測對於提高人群健康水平、降低患者經濟負擔意義重大。但隨著醫療大數據的產生,傳統的統計預測方法逐漸無法滿足需求,有必要嘗試開展機器學習等新方法在腫瘤預測領域的應用。 研究方法 數據來源於中國健康與營養調查
  • 科學家建立大樣本獼猴腦影像標準化模型
    該研究由中國科學院昆明動物研究所客座研究員、腦科學與智能技術卓越創新中心(神經科學研究所)研究員王徵團隊完成,在162隻健康食蟹猴上採集了高分辨的磁共振影像數據,製作了食蟹猴腦圖譜,並建立了標準化模型(normative model),描述單個獼猴大腦的解剖結構特徵隨年齡變化的軌跡。
  • 科學家建立大樣本獼猴腦影像標準化模型
    該研究由中國科學院昆明動物研究所客座研究員、腦科學與智能技術卓越創新中心(神經科學研究所)研究員王徵團隊完成,在162隻健康食蟹猴上採集了高分辨的磁共振影像數據,製作了食蟹猴腦圖譜,並建立了標準化模型(normative model),描述單個獼猴大腦的解剖結構特徵隨年齡變化的軌跡。該大樣本標準化模型可用於獼猴疾病模型的參考對照,推動個體化定量統計分析實現。
  • 營養與健康所等發現乳腺癌腫瘤幹細胞調控新機制
    5月19日,國際學術期刊《自然-通訊》(Nature Communications)在線發表了中國科學院上海營養與健康研究所胡國宏研究組題為SH3RF3 promotes breast cancer stem-like properties via JNK activation and PTX3 upregulation 的最新研究成果
  • 肱骨有限元模型建立及生物力學分析
    結果:建立了正常肱骨三維幾何模型和有限元模型利用ANSYS軟體,對模型進行了有效性驗證。所建模型物理特性與真實骨骼相近,能很好地反映骨骼的力學變化,實現手法的定量分析。結論:所建立的肱骨模型外形逼真、在不同載荷下的應力值與相關文獻一致,可用作中醫仿真系統中的虛擬骨折模型。
  • 新計算力學方法:交大團隊建立軸對稱問題力學分析模型
    在常規「態」基近場動力學框架下,也已從早期的三維模型發展出二維平面應力和平面應變模型。然而,有很多涉及斷裂失效的問題同樣表現出明顯的軸對稱性,而軸對稱問題在近場動力學領域的研究幾乎未見發表。因此,為了高效地分析這類問題,建立相應的軸對稱近場動力學模型是重要且必需的。
  • 基於CT人眶骨三維有限元模型的建立
    方法 利用CT對健康人頭顱進行掃描,得到顱骨組織的斷層圖像資料,保存為DICOM標準文件格式後,利用Mimics軟體自動處理並結合人工描繪將數據進行處理,建立單側人眼眶骨的三維數字模型,然後導入逆向工程軟體GeomagicStudio對Mimics生成的模型進一步處理,包括光順、打磨、生成曲面等操作
  • 如何建立菲涅爾透鏡模型?
    因為它很薄,從而材料吸收而損失的光很少,成像質量所付出的代價也小。菲涅爾透鏡常被用在燈塔、背投電視、太陽能聚光器等多種場合。本文介紹菲涅爾透鏡在序列模式和非序列模式中的各種建模方式,並比較他們的異同。Zs 基底矢高 用以計算光線入射到表面的位置。
  • 「科創中國」—襄陽市營養學會聚力營養健康科創融合發展
    、博士生導師劉烈剛,農業農村部營養與政策發展研究所科技處處長、副研究員朱大洲,中國疾控中心營養與健康所營養教育室研究員、博士劉愛玲,中國疾控中心營養與健康所副研究員向雪松,武漢科技大學營養食品系教授榮爽,中國營養學會會員發展部主任蔣燕,湖北省營養學會副理事長兼秘書長楊雪峰,湖北省疾控中心營養與健康所所長劉爽,湖北省農技協常務理事、省水產科研所高級工程師魏志宇。
  • 武漢病毒所建立新冠小鼠感染模型,有望緩解動物模型緊張問題
    近日,中國科學院武漢病毒研究所/生物安全大科學研究中心研究員、新發傳染病中心副主任張波團隊建立了一種以甲病毒為載體的、快速高效的新型冠狀病毒(SARS-CoV-2)小鼠感染模型,相關成果在線發表於國際學術期刊Cell Research (《細胞研究》)。
  • 武漢病毒所建立新冠小鼠感染模型,有望緩解動物模型緊張問題
    近日,中國科學院武漢病毒研究所/生物安全大科學研究中心研究員、新發傳染病中心副主任張波團隊建立了一種以甲病毒為載體的、快速高效的新型冠狀病毒(SARS-CoV-2)小鼠感染模型,相關成果在線發表於國際學術期刊Cell Research (《細胞研究》)。
  • 用實測方法建立變壓器諧波模型,準確性高,通用性好
    目前,變壓器諧波模型的建立方法主要有3種:①定值描述法,根據變壓器工頻下的電氣參數與勵磁特性來表徵諧波工況下的特性;②電磁理論計算法,採用麥克斯韋方程組,結合變壓器材料與內部幾何參數計算出繞組的頻變模型與鐵心的渦流效應;③實測建模法,基於變壓器短路和開路試驗的實測數據來構建變壓器諧波工況的數學模型。
  • 人體膝關節有限元模型建立及其有效性驗證
    利用膝關節的核磁共振圖像,採用專業的醫學建模軟體,基於 3D 插補法,重建膝關節三維數位化模型。建立的完整的人體膝關節三維有限元模型包括骨骼、韌帶、軟骨等 14 個主要力學承載部件,結構完整、形態逼真。本文所建的模型高度模擬了膝關節的結構與材料特性,具有空間結構測量準確性高、單元劃分精細等特點。
  • Psychological Review | 心理所構建中文閱讀的認知計算模型
    其中一個顯著特點是中文文本在詞和詞之間沒有空格,這使得現有的閱讀模型面對中文時都無能為力。以大量實驗研究為基礎,中國科學院行為科學重點實驗室李興珊研究員構建了中文閱讀過程中認知加工的計算模型(中文閱讀模型,簡稱CRM),成果發表在《Psychological Review》上。
  • 健康所、營養所、巴斯德所三所聯合開展實驗動物平臺工作人員
    為提高實驗動物平臺工作人員的專業技能及確保平臺的穩定運行,中國科學院上海生命科學研究院健康科學研究所、營養科學研究所、上海巴斯德研究所三所於11月13日起在生命科學實驗樓A座2樓會議廳聯合開展了為期兩天的實驗動物平臺工作人員聯合培訓,組織了30多位平臺工作人員參加。
  • 利用材料屬性建立上頜骨三維有限元模型的初步探討
    ,為高效建立個性化上頜骨三維有限元模型提供依據。由於上頜骨不規則的形態結構影響模型的幾何相似性,目前的建模技術限制了應力分析環境的如實建立,同時上頜骨的異質性難以完全實現等,這些因素不僅影響上頜骨三維有限元模型的建立而且影響模型的力學相似性[2,3]。