□龍九尊
蛋白質組學是當代生物醫學的最前沿和主要推動力之一。高精度、高解析度生物質譜技術的發展,對系統化地揭示和理解蛋白質及其在細胞中的作用提供了有力支持。海量的蛋白質組譜圖數據被採集,並被全球不同的課題組分析和存儲。
浙江大學生物醫學工程及儀器科學學院院長段會龍教授在日前召開的一次醫療器械論壇會上介紹了這一領域的進展。
段會龍說,目前的蛋白質組質譜研究依賴於蛋白質序列資料庫和檢索引擎產生的理論譜圖。蛋白質序列資料庫是由基因組系列數據基於現有理論的衍生;檢索引擎再基於蛋白質序列,以及內切酶、翻譯後修飾產生可能的肽段,衍生出其理論圖譜。
「理論圖譜的應用在對蛋白質組學的發展起到積極作用的同時,也限制了其推廣。」 段會龍說,限制主要體現在三個方面。
一是理論衍生的數據難以兼顧特異性、準確性與全面性,由於引入大量的冗餘計算,使得數據通常受限,並要求應用高性能集成式計算中心。
二是實驗譜圖的信息組織是三維的,包括信號出現的時間,荷質比以及強度;在理論圖譜中這些多維信息被簡化為一維,降低了分析的特異性,使假陽性和假陰性匹配難以避免。
三是理論譜圖局限於肽段裂解信息,不包括其他相關的分析或生理特性,將不同課題組的研究割裂開,降低了蛋白質組學研究的可移植性和借鑑性。
段會龍介紹說,建立蛋白質組譜圖資料庫是當前建立在理論譜圖基礎上的蛋白質組學的重要發展,能顯著提高海量數據的分析效率,降低應用生物質譜技術的門檻。蛋白質譜圖數據不僅提供一系列的工具和數據集,還有效地整合大量孤立的譜圖資源。基於模塊化的設計,蛋白質譜圖將組織為多個特異譜圖數據組的集合。通過開放的交互式界面,廣大生物醫學學者也能參與數據的注釋和校正,為蛋白質組學、生物學、臨床研究者提供豐富全面的知識庫,從而有機地將蛋白組學最新成果與生物醫學的革新聯繫在一起。
段會龍說,他們的研究面向並服務於全世界心臟研究群體,共享蛋白組譜圖數據集,提供實驗質譜的檢索、分析工具集,建立交互式數據交流平臺。研究和構建專有的、全面的心血管蛋白質組生物醫學資料庫/知識庫;在蛋白質組數據集成和分析,譜圖數據識別和檢索、蛋白質組生物醫學資料庫體系構建、共享上實現突破。目前,他們已完成的三項主要的工作:
心血管蛋白質組數據體系結構:構建了以蛋白質組信息為主體的資料庫體系結構,以心臟線粒體蛋白質組為基礎建立了核心數據集,該數據集包括了1663種心臟線粒體蛋白質以及與之相對應的2.7萬多個生物質譜譜圖。
心血管蛋白質組資料庫搜尋引擎:初步建立了數據搜尋引擎,可通過蛋白、肽段序列等信息對相應的生物質譜譜圖進行檢索,實現了與歐洲生物信息學研究所(EBI)的IPI蛋白質資料庫間的數據關聯。
心血管生物醫學資料庫平臺:研究並開發了相應的資料庫網絡公共平臺(http://coblip.org)。該網絡平臺的首個正式版本將在2010年末面向全世界發布,通過對心血管生物醫學數據信息和資源的實時共享,服務於全世界心血管研究群體。
《科學時報》 (2010-9-27 B4 企業·合作)