【來源:科技日報】
此次AlphaFold對新冠病毒蛋白質結構的預測,是脫離於實驗之外的結構重構。預測的準確性,尚需同行評審,以及實際臨床治療的驗證。
蛋白質是維持生命所必需的結構複雜的生物大分子,人體內幾乎所有的功能如肌肉收縮、呼吸,或將食物轉化為能量等,都與蛋白質之間的相互作用密切相關。而獲得蛋白質三維結構,則有助於科學家了解它在人體內的作用,並設計相應的藥物。
近日,人工智慧公司DeepMind宣布,其用AlphaFold預測了六種由新冠病毒基因編碼的蛋白質的三維結構,包括膜蛋白、非結構蛋白等,而且已經開放下載。
獲悉病毒蛋白質結構 有助於研發針對性藥物
病毒由核酸和蛋白質組成,而蛋白質是由病毒基因組編碼的。病毒蛋白質有兩種,一種是結構蛋白,它們可以構成一個形態成熟的有感染性的病毒顆粒,幫助病毒侵染細胞,例如殼體蛋白、膜糖蛋白和存在於病毒顆粒中的酶等;另一種是非結構蛋白,則幫助病毒在宿主細胞裡複製、基因表達,擴大在人體內的「領地」。
早在1月10日,中國公布新冠病毒全基因組序列。但僅僅知道基因組序列,並不能充分了解蛋白質是如何工作的。
「蛋白質的成分包括20種胺基酸,每個蛋白質由幾十到上千個胺基酸組成。部分胺基酸的線性序列會形成螺旋或者摺疊狀的二級結構,並進一步有序組合堆積成三維結構,這種三維結構決定了蛋白質在人體內如何發揮作用。」中國藥科大學藥學院教授肖易倍接受科技日報記者採訪時,打了個比方,如果說人體的病毒受體是鎖,病毒的刺突糖蛋白就是鑰匙,如果這些鑰匙能插進人體病毒受體蛋白,就會侵染細胞,科學家要做的,就是弄清楚鑰匙內的三維結構是什麼、鑰匙和鎖的關係是什麼,進而阻止鑰匙去開鎖,即阻止病毒侵染細胞。
「知道了蛋白質如何發揮功能,就知道如何有針對性地抑制病毒活性,如果發現某個蛋白是入侵宿主細胞的關鍵蛋白,就可以針對這個蛋白或者蛋白的某個區域做藥物設計。」南京大學生命科學學院教授、博導董鹹池說。
預測結果即使準確 實驗過程仍不可迴避
在DeepMind團隊看來,可根據胺基酸序列確定蛋白質的三維結構。他們基於深度神經網絡,通過預測蛋白質中每對胺基酸之間的距離,以及連接這些胺基酸的化學鍵之間的角度,使用兩種方法,來構建預測模型。
「第一步是在結構生物學常用的技術上,訓練神經網絡預測蛋白質中每對胺基酸之間的距離或角度,然後不斷組合這些概率,提高蛋白質結構預測的準確度;第二步是通過梯度下降來優化得分。他們預測的是整個蛋白質鏈,而不是蛋白質結構組裝之前的蛋白質『碎片』,因此一定程度上降低了整個預測過程的複雜性。」湖南大學超算中心副主任、教授彭紹亮告訴科技日報記者,AlphaFold從頭開始對蛋白質的形態結構進行建模,而沒有使用已經解析的蛋白質作為模板,這意味著需要超大的計算量。
而據清華大學自動化系生物信息學副教授汪小介紹,在目前國際的蛋白質資料庫(PDB)中,有大約3萬種已知的蛋白質結構,利用其中與目標序列具有相似性的蛋白質序列,可以為蛋白質結構預測提供支持。
在人工智慧深度學習之外,科學家們想要獲取蛋白質結構,目前大多從核磁共振、冷凍電鏡與X射線衍射技術中尋求答案。
「三種方法都依賴大型設施、儀器,實驗手段獲得的蛋白質結構,通俗地說就是給蛋白質多角度拍照片,然後根據海量二維照片重構三維結構,結果客觀精確,但是實驗周期比較長,通常需要幾個月,實驗門檻和實驗成本高,實驗難度也不小。」彭紹亮說。
此次AlphaFold對新冠病毒蛋白質結構的預測,是脫離於實驗之外的結構重構。預測的準確性,尚需同行評審,以及實際臨床治療的驗證。不過,DeepMind指出,「模型會指出結構的哪些部分更有可能是正確的,雖然這些未被研究的蛋白質不是當前治療的重點,但它們可能會增加研究人員對新冠病毒的理解」。
而對於AlphaFold的預測結果,彭紹亮認為,如果預測結果準確,還要進行分子對接、分子動力學模擬等很多計算分析過程,以及動物實驗、人體臨床試驗的驗證。「計算可以不斷被加速,但實驗過程是不可迴避的,而最終的一切都是以能做出臨床可用的藥物和疫苗為目標。」