營養與健康所等開發新的定量蛋白質組數據差異分析計算模型

2020-12-07 中國科學院

  8月13日,國際學術期刊Cell Discovery 在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普計算生物學研究所)邵振課題組研究論文「MAP: model-based analysis of proteomic data to detect proteins with significant abundance changes」,報導了一種新計算模型MAP,用於統計分析基於同位素標記產生的定量蛋白質組數據並鑑定其中差異表達的蛋白質。

  基於同位素標記和質譜技術的定量蛋白質組實驗(如iTRAQ、TMT和SILAC等)能同時檢測數千甚至上萬個蛋白質在不同樣本之間的相對豐度或表達差異。這類數據已有的差異表達分析方法大多依賴於對並行或已有的技術重複數據進行前期比較來構建實驗的技術誤差模型,並以它為基礎檢驗每個蛋白質在被比較樣本之間表達差異的統計顯著性。該方法佔用了有限的實驗通道,也難以保證誤差模型的精確適用性。

  針對這一局限,在MAP模型中研究人員發展了一種新穎的分步回歸(step-by-step regression)分析流程,實現直接對被比較的兩個iTRAQ樣本構建技術誤差模型。在此類研究中,一個常用的經驗假設是技術誤差對樣本間每個蛋白質iTRAQ信號log2比率(log2-ratio)的貢獻服從以0為中心的正態分布N(0, σ2)。其中,方差σ2依賴於該蛋白質的信號強度,並且常被用一個指數衰減函數來刻畫其依賴關係,即所要構建的全局誤差函數。MAP模型首先使用滑動窗口掃描兩個樣本的M-A圖,同時對窗口中0附近的log2比率進行線性建模,以其斜率的平方作為誤差函數的局域估計。然後,對所得局域估計進行第二輪指數擬合,獲得被比較樣本的全局誤差函數,並以它為參照計算每個蛋白質信號差異的顯著性P值(圖1)。

  同位素標記定量蛋白質組數據長期存在比率壓縮的難題。研究人員使用MAP模型分別比較分析了三個批次產生的小鼠胚胎幹細胞分化前後蛋白質組數據,發現蛋白質iTRAQ信號log2比率在不同批次間關聯很低(圖2a),可能是因為技術誤差對其貢獻所服從的正態分布N(0, σ2)在批次間各不相同。根據MAP模型,研究人員提出使用每個批次的全局誤差函數對其中每個蛋白質iTRAQ信號的log2比率進行重標度(rescaling),使得在不同批次中技術誤差對其貢獻均服從標準正態分布N(0, 1),從而發展了一個新的Z統計量。比較不同批次蛋白質Z統計量之間的關聯,可以發現它具有明顯更好的可重複性(圖2b)。

  為方便蛋白質組領域研究者使用MAP模型進行數據分析,研究人員搭建了一個網絡服務平臺(http://bioinfo.sibs.ac.cn/shaolab/MAP)。該平臺額外搭載了一個整合分析模塊,能夠通過整合多個批次生物重複比較結果的次優P值或者平均Z統計量來最終鑑定差異表達蛋白質,並新發展了一種分析方法用於估測基於這些統計量所定義差異表達蛋白質的錯誤發現率(FDR)。此外,在用於雙樣本比較的MAP模型基礎上,研究人員還通過分別用樣本方差和卡方分布分位數取代原分步回歸建模流程中所使用的log2比率和標準正態分布分位數,進一步發展了適用於多樣本比較的拓展eMAP模型。

  上述研究由營養與健康所研究助理李木山和博士研究生塗世奇等在研究員邵振的指導下,與中科院植物生理生態研究所、復旦大學上海醫學院和美國西南醫學中心等多家單位的研究人員合作完成,得到國家自然科學基金委、科技部和中科院等的資助。

  論文連結

 

  圖1:MAP模型的分步回歸分析流程:(a)局域線性擬合;(b)全局指數擬合構建技術誤差模型;(c)計算每個蛋白質信號差異的顯著性P值。

 

圖2:不同批次蛋白質iTRAQ信號的log2比率(a)和Z統計量(b)的皮爾森關聯繫數。

相關焦點

  • 營養與健康所等建立MAnorm2計算模型
    近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代
  • 營養與健康所等建立MAnorm2計算模型---中國科學院
    近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代MAnorm2計算模型。
  • 科學家開發出新型定量蛋白質組學分析方法
    科學家開發出新型定量蛋白質組學分析方法 作者:小柯機器人 發布時間:2020/11/26 11:45:11 美國威斯康星大學麥迪遜分校Joshua J. Coon、Jesse G.
  • Anal Chem:董夢秋等開發出定量蛋白質組學數據解析軟體pQuant
    中科院計算所pFind研究團隊與我所董夢秋實驗室合作開發了定量蛋白質組學數據解析軟體pQuant,用計算方法排除幹擾信號的影響、提高肽段和蛋白質的定量準確度並對每個定量值進行準確性評價。基於質譜的定量蛋白質組學是現代生物學技術的生長點之一,用於測量複雜生物體系中蛋白質及其翻譯後修飾在不同條件下的豐度變化,是研究蛋白質功能和藥物作用機制的重要工具。
  • 大化所高通量多重蛋白質組定量分析方法研究獲進展
    近日,中科院大連化學物理研究所王方軍博士、鄒漢法研究員等人在高通量多重蛋白質組定量分析方法研究方面取得新進展,發展了一級質譜(MS1)譜圖中六種不同蛋白質樣品同時規模化定量分析的同位素標記方法,並將該方法應用於細胞蛋白質合成-降解周轉更新分析,分析通量是常規同位素標記方法的三倍,研究成果發表在自然出版社新創立的綜合性刊物《科學報告》(Scientific Reports
  • 科研人員建立MAnorm2計算模型
    近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples,報導了其開發的新一代MAnorm2計算模型。
  • 青年才俊上演計算蛋白質組學頭腦風暴——記CNCP 2016新技術
    張弓教授介紹了研究團隊研發的利用翻譯組測序數據作為蛋白質de novo鑑定質量控制新方法,使肽段de novo鑑定能首次應用在蛋白質組複雜樣品的實用化鑑定。為了進一步探索質譜信息中隱藏的其他新的修飾,研究者設計了PTMap軟體,用來分析非限定性搜索,得到了一些可靠的新蛋白質修飾鑑定,包括琥珀醯化,巴豆醯化,羥基丁醯化等。在定量研究方面,該團隊比較關心蛋白質修飾豐度,因為普遍使用的相對定量的分析方法對解釋蛋白質修飾的生物學意義有一定的局限性,但是質譜分析得到的離子峰強度並不能直接比較來計算蛋白質修飾的豐度。
  • 「鳥槍法(shotgun)」定量蛋白質組學技術介紹
    差異蛋白質的定量研究是基於肽段水平而非完整的蛋白質,成為該技術最大的技術特色,該技術實現了樣品分離與鑑定直接聯合,完全自動化操作,可以用於各種蛋白質混合物的蛋白質組學分析,如血清、組織、各種體液以及尿液等。  技術路線:  鳥槍法為基因組測序,是先將基因組打斷,分段測序, 然後利用計算機重組在一起。從而確定一段的基因序列。
  • MCP:高等植物擬南芥蛋白質熱穩定性的蛋白質組學分析
    熱蛋白組使用同位素編碼的基於質譜來同時分析上千種蛋白質。將十份樣品置於溫度梯度上溫育,並將上清液進行十通道同量異位標記。 使用標準的基於MS / MS的定量來測量蛋白質水平相對豐度值。這個值適合於所描述的雙態模型。Figure 1. 熱蛋白組的工作流程2.
  • SWATH-MS定量蛋白質組學
    在這項研究中,作者運用基於SWATH的定量蛋白質組學以及掃描電子顯微鏡(SEM)和透射電子顯微鏡(TEM)的超微結構觀察,系統的研究了LBA在蛋白質組水平上對MRSA的抗菌機制。進一步通過基於PRM的靶向質譜技術和實時定量PCR(qRT-PCR)技術驗證了幾種差異表達蛋白的蛋白表達水平和mRNA表達水平。
  • 天津工生所建立無標定量MSE質譜數據分析流程
    超高效液相色譜-高分辨質譜(UPLC-HRMS)已經成為蛋白質組學、代謝組學以及藥代動力學研究中的一項核心支撐技術,通過對不同生物樣品的定量研究可以全面、精細地表徵該生物體系的生理特性及預測功能。在用於蛋白質組學的質譜分析中,無標定量以其穩定性和安全性逐漸佔據了主要地位。
  • 首屆中國計算蛋白質組學研討會在京召開
    依靠簡單的手工處理已經遠遠不能滿足問題的需求,通過先進的計算機算法與軟體工具來自動處理大批量的蛋白質組數據已經成為蛋白質組學研究的重要分支,這就是「計算蛋白質組學」(Computational Proteomics)。
  • 知無不「研」|一文輕鬆讀懂iTRAQ定量蛋白質組學
    定量蛋白質組學 近年來隨著蛋白質組學的迅速發展,其相應的方法學研究也取得了長足的進步,一系列新技術融入了蛋白質組學研究中,極大地促進了這門學科的發展。其中,iTRAQ技術與串聯質譜技術相結合,能夠高通量地尋找不同蛋白質組的差異蛋白並且準確進行相對或絕對定量,目前在蛋白質組學領域已得到了廣泛關注和應用。下面我們一起來了解一下iTRAQ技術的方方面面。
  • 賽默飛世爾科技在ASMS 2010展示定量定性蛋白質組學工具
    它使研究人員能利用以前的質譜數據,如Thermo Scientific LTQ Velos和LTQ Orbitrap Velos的數據,以加快和簡化智能選擇性反應監測(iSRM)定量檢測方法的開發。定量蛋白質組學最大的挑戰之一就是同時確認和定量低含量生物標誌物並獲得重複性結果。
  • 新方法再次提高單細胞蛋白質組學質譜定量準確度
    單細胞蛋白質組學在蛋白豐度檢測、轉錄修飾和翻譯後修飾方面填補了單細胞轉錄組學的空白。    單細胞蛋白質組學質譜(SCoPE-MS)是近年來興起的一種定量分析多功能單細胞蛋白質組的方法,這種方法採用同位素標記和載體蛋白質組學來分析單個細胞。
  • 定量蛋白質組學方法應用於病毒結構、功能及感染機制研究
    基於iTRAQ試劑的定量蛋白質組學揭示相似病毒的結構和功能差異圖1:iTRAQ試劑結合定量蛋白質組學能夠揭示病毒不同狀態下的蛋白豐度差異(來源Zhihong Hu,JVI, 2012)EV71(腸道病毒71型)是導致幼兒手足口病的主要病原體之一,其表達兩種EV71病毒,包涵體衍生型病毒(occlusion-derived virus,ODV)和出芽型病毒(budded virus,BV)。
  • 倍道而進|第一屆西湖-新英格蘭 臨床蛋白質組大數據暑期培訓班
    Hannes Rösthttp://www.roestlab.org/index.html多倫多大學(University of Toronto)Hannes Röst在蘇黎世聯邦理工學院獲得生物化學學士學位和生物信息學碩士學位,並在蘇黎世聯邦理工學院Ruedi Aebersold教授實驗室獲得博士學位,他開發了新的計算方法來分析基於質譜的蛋白質組學數據
  • iTRAQ標記定量蛋白質組學揭示硝普鈉處理對大豆芽的影響
    研究中iTRAQ標記定量蛋白質組學實驗由鹿明生物提供技術支持。中文標題:iTRAQ標記定量蛋白質組分析揭示硝普鈉處理對大豆芽的影響研究結論iTRAQ蛋白組學定量分析數據表明此外,熱休克家族蛋白和類黃酮生物合成蛋白質也收到硝普鈉(NO供體)的調節。本研究可為生產有益於人體健康的功能性食品提供理論指導。
  • 賽默飛:蛋白質組學技術在病毒感染致病機制的亮點研究
    對感染細胞進行蛋白質組學分析,該策略取決於是否有合適的允許病毒感染的細胞培養模型,以及對蛋白質進行時間感染特徵分析的敏感蛋白質組學方法。為了探究潛在的抗病毒藥物,作者建立了一個針對SARS-CoV-2高度兼容的細胞模型,在病毒感染24小時後就能迅速見到細胞致病作用(cytopathogeniceffect,CPE)(圖1A)。
  • 腦科學日報:人體蛋白質組定量圖譜發布;壓力大,容易骨丟失
    1,Cell | 人體蛋白質組定量圖譜發布——不容小覷的蛋白質組學定量分析技術來源:BioArt圖註:基於TMT 10plex和MS3的質譜定量蛋白質組學工作流程人體蛋白質組學研究存在許多空缺有待填補,而GTEx項目(Genotype-Tissue Expression Project)提供的多種組織資源使得利用先進的質譜和定量方法來研究人體組織的多種生物學重複樣本