2010年,人類蛋白質組組織(HUPO)啟動了人類蛋白質組計劃(Human Proteome Project,HPP)。該研究旨在為全球合作、數據共享、質量保證和增強基因組編碼蛋白質組的準確注釋創建一個框架。
2014年5月,兩個國際小組均在《自然》雜誌上公布了人類蛋白質組第一張草圖,這些在大部分非患病人體組織和器官中表達的精選蛋白,為更好的理解疾病狀態下發生的機體變化,奠定了堅實的基礎。這兩項最新研究揭示了人類基因組的更多複雜性,並從之前認為屬於非編碼區域的基因組中發現了新蛋白。
波士頓兒童醫院蛋白質組學主任Hanno Steen(未參與這項研究)表示:「雖然之前其它一些大型蛋白質組數據集也收集了接近上萬個蛋白數據,但是這兩項成果確實是真正的突破性成果,全面覆蓋了超過80%的人類預期蛋白質組,其中還有一些之前未曾被發現的蛋白。這些成果清楚地表明,想要達到這樣的蛋白覆蓋率深度,就需要探索許多不同的組織類型。」
來自約翰霍普金斯大學的蛋白質組研究員Akhilesh Pandey,與來自印度生物信息學研究所等處的研究人員合作,分析了30種不同的組織類型,編撰了由84%所有預期編碼蛋白的人體基因翻譯得到的蛋白。
這項研究識別出17, 294個蛋白編碼基因,並通過表達分析證明了組織和細胞特異性蛋白的存在,並且研究人員還通過從註解的假基因、非編碼RNA和未翻譯的區域識別翻譯的蛋白,表明了「蛋白基因組」分析的重要性。
在隨後的幾年中,HPP建立了合作關係,制定了指南和度量標準,並對以前保存的蛋白數據進行了重新分析,從而不斷增加人類蛋白質組的覆蓋範圍。近日,在HPP十周年之際,該計劃報告了超過90%的高質量人類蛋白質組圖譜。
HPP研究團隊在Nature Communications上發表了人類蛋白質組項目的最新成果。隨後,人類蛋白質組組織(HUPO)也正式公布了該研究進展。報告顯示,人體中90.4%的蛋白質已經被繪製出來。這是人類蛋白質組學的第一個序列草圖。人們對單個蛋白質如何相互作用以影響人類健康有了更深入的理解,為疾病預防和個體化醫學提供了重要見解。
UBC血液研究中心成員Overall教授表示:「這標誌著我們對人類生活的全面理解有了重要的裡程碑進展。雖然人類基因組計劃提供了人類基因的「藍圖」,但人類蛋白質組可識別由這張「藍圖」編碼的生命各個組成部分:蛋白質。蛋白質相互作用可塑造從危及生命的疾病到人體的一切細胞結構。」他指出,了解哪些蛋白質是預防疾病的關鍵,及其表達或活動是疾病的標誌,可以為個體化醫療和新療法的開發提供信息。
圖:完成90%以上高嚴格人類蛋白質組。
目前,該項目研究團隊已檢測到人類基因組編碼的19,773種蛋白質中的17,874 種。自該計劃於2011年發布其首份報告以來,共增加了4,000多種蛋白質。其中,16,924個已通過質譜鑑定,另外950個已通過免疫檢測等非質量標準方法進行了驗證。
據悉,該項目將繼續致力於鑑定其餘10%的預測蛋白質,但這一過程正變得越來越困難。因為許多特殊蛋白質或者只在特定和難以獲得的組織類型中表達,或者很難使用傳統的蛋白質組學技術進行分離和分析。
圖:人類蛋白質組計劃的結構。
HPP主席Robert Moritz表示:「隨著蛋白質組學研究進展放慢,蛋白質組學領域已從鑑定和分類蛋白質轉移到探索其生物學功能和疾病相關性。HPP同樣也正在探索蛋白質功能並開發新的研究資源。該計劃的主要目標是通過提供有關如何檢測蛋白質的信息,擴大研究蛋白質的數量。」
Moritz提到,目前,絕大多數研究都是針對極少數種類的蛋白質進行,因為它們很容易被檢測到並且方法比較成熟。但由於許多人類疾病是由蛋白質組成或功能的變化引起的,繪製蛋白質組圖可加強疾病診斷、預測結果、治療和精準醫學的理論基礎,突出人類蛋白質組在癌症、心血管疾病和傳染病等的診斷和治療中發揮的潛在作用,且對於辨別健康和疾病中的分子過程至關重要。
二十年前,隨著人類基因組草圖的發布,人們可以利用基因組學常規地確定癌症等疾病高風險、易患性以及與腫瘤負擔和復發有關的基因突變信息,也促進了多種治療方法的發展,包括靶向療法。但目前有效的靶向治療仍不能適用於所有癌症。這主要是因為部分基因突變不會導致蛋白質組的變化,因此很難區分哪些變化是重要的生化驅動因素。通過整合基因組和蛋白質組學數據,可提供對疾病病因和機制的深入了解,包括癌症生物學的特徵,有助於實施有效的治療幹預措施。