WorldCommunityGrid和Decrypthon支持的研究人員合作研究4萬多種結構已知的蛋白質分子之間的相互作用,特別關注在神經肌肉疾病方面起作用的蛋白質,Decrypthon是AFM(FrenchMuscularDystrophyAssociation)、CNRS(FrenchNationalCenterforScientificResearch)和IBM進行的一項合作研究。
這個項目所產生的信息資料庫將幫助研究人員設計分子以抑制或增強特定高分子的結合,希望能發現治療肌肉萎縮症及其他神經肌肉疾病的更好方法。
什麼是神經肌肉疾病和肌肉萎縮症?
神經肌肉疾病是一組機能紊亂疾病(總數超過200種)的通用術語,這些疾病直接通過肌肉病理學因素(肌肉萎縮症)或間接通過神經病理學因素損害肌肉功能。其中的大多數疾病都具有以下特點:比較罕見(概率小於兩千分之一)、源於基因(80%)並同時影響兒童和成人。
這些慢性疾病會逐步降低肌肉力量,最終導致嚴重的運動機能(移動、呼吸等)殘疾。這些疾病的表現形式各不相同,有些會越來越嚴重,而有些會穩定好幾年,並且同一種疾病在不同人身上也會表現出不同的症狀。
儘管治療方法在不斷進步,但到目前為止,醫學界仍未找到治療神經肌肉疾病的有效方法。
項目介紹
從基因到發病機理
1986 年,科學家們發現了第一種與杜興氏肌肉萎縮症(Duchenne dystrophy,最常見的肌肉萎縮症形式)有關的基因 - 肌營養不良基因(dystrophin gene)。從那時起,我們通過基因分析方法發現了 200 多種引起神經肌肉疾病的基因。然而,對於由這些基因編碼的相應蛋白質的功能和相互作用,我們基本上仍然是一無所知。儘管我們的知識水平在不斷提高,但已發現基因的數量也表明這些疾病發病機理的整體複雜性。
一個生物體的所有細胞都包含相同的遺傳信息,這些信息以 DNA 的形式存在並構成基因組。基因組所包含基因(已發現超過 2 萬種人類基因)的表現形式會產生蛋白質(已經發現了約 4.5 萬種蛋白質,平均每個基因為 1.6 種蛋白質編碼),而這些蛋白質又根據器官(如肌肉)特異性確保細胞的功能。
其中有些蛋白質是酶,有些是信號分子,有些是感受器(它們與其他具有高度親合性和特異性、稱為配體的分子結合,就像鑰匙和鎖的關係),還有些是結構蛋白質。蛋白質的空間構造(3 維結構)決定了它們的相互作用及功能。
肌肉的功能取決於無數的蛋白質。這些蛋白質在不同的細胞和級別發揮作用,有的位於肌肉細胞本身(細胞體),有的位於運動神經軸突(用於刺激肌肉),有的則位於神經和肌肉之間的連接細胞中。
大部分神經肌肉疾病都是由基因突變引起的,某些基因的突變會引起相應蛋白質發生變異,從而導致蛋白質失去功能、功能受損或蛋白質完全被破壞。神經肌肉疾病因變異所影響的蛋白質及其部位而異。
研究人員要能夠理解神經肌肉疾病如何阻止蛋白質執行保持肌肉和神經健康所需的功能,就必須更好更詳細地理解每種肌肉萎縮症發病機理中所涉及的蛋白質的功能及其相互作用。
了解蛋白質的功能及其相互作用對於幫助研究人員制定治療策略同樣非常關鍵。沒有這些重要的知識,科學家們就無法開發創新的療法,從而也無法攻克絕大多數的神經肌肉疾病。
World Community Grid 與「Decrypthon 分子對接」項目
利用World Community Grid提供的強大計算力量,治療肌肉萎縮症項目得以確定超過2200種已知的不同蛋白質結構之間的相互作用機制,這些結構信息取自於Protein Data Bank。這些被分析的蛋白質中就包含有誘發神經肌肉紊亂的突變種類。
這樣會產生一個新的資料庫,其中存儲有關在功能上相互作用的蛋白質的信息。該項目的進一步擴展將包括對與 DNA 配體的相互作用(比如藥物)所涉及的蛋白質結合部位的研究。這將引起醫學界極大的興趣,因為這樣可以設計一個小分子以抑制或增強特定分子與其配對夥伴的結合,但要理解同一個小分子如何直接或間接影響其他現有的相互作用還是非常困難的。
該項目中建議的方法是將進化信息(進化如何改變蛋白質以增強其功能)和分子建模(通過計算確定兩個相互作用的配對蛋白質的相對位置)結合起來,以便發現潛在的相互作用。
分子建模是指對分子的行為進行建模或模擬的理論方法和計算方法。這些方法用於研究生物系統的結構,比如蛋白質摺疊或蛋白質配體結合的分子識別,這些系統的範圍從小型的化學系統到大型的生物分子以及物質組合(蛋白質複合體),涉及面極廣。
蛋白質配體對接是一種分子建模技術,用於預測與配體(另一種蛋白質、DNA、藥物等等)有關的蛋白質的位置和方向(3 維結構)。對接方法完全基於物理原理,因此即使是功能未知的蛋白質(或研究相對較少的蛋白質)也可能進行對接。唯一的先決條件是這些蛋白質的 3 維結構已通過實驗方法確定或通過理論方法估計。
對接方法通常從已知分子的資料庫開始,然後嘗試尋找具有相互結合親緣性的分子對。親緣性是用所謂的評分功能估計的。最後,該方法會返回目標蛋白質最佳結合分子的列表。結合程度具有幾何與化學因素。 幾何因素衡量表面形狀(3 維結構)互補的程度,這就像手和手套的關係。化學因素衡量配對分子之間原子相互作用的質量(即相互作用的強弱程度)。
由於蛋白質具有複雜的結構(即便是最小的蛋白質都由上百個原子構成),確定恰當蛋白質相互作用的結合程度需要花費驚人的計算時間。如果沒有 Word Community Grid ,對接過程所需要的計算量是如此之大,以至於研究將會完全無法進行。在項目第一階段中,我們選擇了 168 種蛋白質實施對接,在 WCG 項目上花費的總 CPU 時間約達 8000 年。項目的第二階段將處理2,246種蛋白質結構,而預計的時間花費將達到 11.46x8000 = 91,680 年。
解決這種計算障礙的方法是利用進化信息來預測潛在的結合部位並在最可能發生相互作用的表面實現定位對接。基於蛋白質進化的初步分析使計算時間縮短了 100 倍,這樣就使我們有可能利用 World Community Grid 的關鍵幫助大規模地擴展分析。如果沒有 World Community Grid,那麼進行大規模(定位)對接所需的計算將會花費驚人的時間。
志願者向 World Community Grid 貢獻出自己的計算機時間,用以搜索最佳的蛋白質配對。他們的參與會顯著增加 AFM、CNRS、INSERM 及其他科學參與者進行的工作,從而為科學工具的發展做出貢獻,使對於罕見疾病的新療法開發至關重要的知識不斷增加。