撰文 | 伊凱
蛋白質是生命體功能的主要執行者,其數目與類型之龐雜、可變體結構特徵之繁複、翻譯後修飾種類之豐富,以及蛋白間相互作用之高度動態和環境依賴,使得對於全蛋白組的結構較其它組學測量而言更加繁瑣和具有挑戰性。儘管近年來伴隨著蛋白晶片和定量質譜等技術發展,領域內湧現出了跨越多類生理病理狀態的大規模蛋白組及互作組圖譜,如專注於癌症樣本的CPTAC【1】、RPPA【2,3】,專注於正常組織樣本的HPA【4】和HPM【5】,及專注於PPI的BioPlex【6-8】和 humancellmap【9】等;蛋白組數據的規模仍然遠遜於轉錄組及基因組數據。這一差異在跨物種比較分析中則尤其突出。
為了填補跨物種蛋白組測量的空缺,近日,來自德國馬克斯·普朗克研究所等機構的科學家們在Nature上發表了題為The proteome landscape of the kingdoms of life的文章,首次報導了利用定量質譜技術構建的跨越三大生物域(真核域、細菌域、古菌域)的一百種生物的大規模蛋白組分析,為基於蛋白層面的進化比較分析提供了寶貴的資源。
在該研究中,作者綜合考慮物種樣本可獲取性、基因組注釋完整性及模式生物的普遍利用度等因素,選取了古菌域的19種生物、細菌域的49種生物和真核域的32種生物作為蛋白組分析的對象。在利用質譜分析得到了超過兩百萬個肽段的基礎上,作者從中識別出三十五萬個不同的蛋白質,包含真核域的二十六萬個、細菌域的六萬五千個及古菌域的一萬七千個。有趣的是,這三十五萬個蛋白質所對應的一百一十三萬個基因元件,高達93%的符合UniProt中TrEMBL項目的根據基因組序列的預測結果,但僅有五十六萬個在Swiss-Prot項目中具有對應的實驗證據。也即是說,該研究所產出的數據一次性將物種已知存在蛋白的數量擴大了一倍以上。
在蛋白表達量的物種差異方面,作者發現,對於真核域而言,平均1546個蛋白即可佔據超過90%的蛋白總質量,而這一數字對於細菌域和古菌域來說分別為306和262。對上述高表達蛋白的功能注釋分析則發現,那些與生命運作的基本需求所相關的功能呈現出了極高的富集性,如蛋白質翻譯、蛋白質摺疊及氧化還原反應等。
最後,作者還觀察到,被識別出的接近40%的蛋白不具有任何功能性注釋條目。即使是只考慮表達量處於前一百位的蛋白質,這一數字仍高達22.9%。大量未經實驗驗證或缺乏功能注釋的蛋白質「暗物質」的存在不僅意味著學界對生物體蛋白質組全貌的探索仍然遠未完成,同時也指向了在對新蛋白質的發掘、對現有蛋白質功能注釋的豐富及對蛋白質進化和保守性分析等方面的前所未有的寶貴機遇。
原文連結:
https://www.nature.com/articles/s41586-020-2402-x.pdf
製版人:十一
參考文獻
1. Zhang, B. et al. Proteogenomic characterization of human colon and rectal cancer. Nature 513, 382–387 (2014).
2. Li, J. et al. Characterization of Human Cancer Cell Lines by Reverse-phase Protein Arrays. Cancer Cell 31, 225–239 (2017).
3. Li, J. et al. Explore, visualize, and analyze functional cancer proteomic data using the cancer proteome atlas. Cancer Res. (2017) doi:10.1158/0008-5472.CAN-17-0369.
4. Uhlén, M. et al. Tissue-based map of the human proteome. Science (80-. ). (2015) doi:10.1126/science.1260419.
5. Kim, M. S. et al. A draft map of the human proteome. Nature 509, 575–581 (2014).
6. Huttlin, E. L. et al. The BioPlex Network: A Systematic Exploration of the Human Interactome. Cell 162, 425–440 (2015).
7. Huttlin, E. L. et al. Architecture of the human interactome defines protein communities and disease networks. Nature 545, 505–509 (2017).
8. Huttlin, E. L. et al. Dual Proteome-scale Networks Reveal Cell-specific Remodeling of the Human Interactome. bioRxiv 2020.01.19.905109 (2020) doi:10.1101/2020.01.19.905109.
9. Go, C. D. et al. A proximity biotinylation map of a human cell. bioRxiv 3, 58–66 (2019).