據科學家報導,一個長期存在且極其複雜的關於蛋白質結構和行為的科學問題已經被一種新的人工智慧系統有效地解決了。
多年來,總部位於英國的人工智慧公司DeepMind的一系列不斷進步的神經網絡一直令我們讚嘆不已,這些神經網絡在西洋棋和圍棋等複雜遊戲中不斷擊敗人類。然而,所有這些漸進式的進步都不僅僅是關於掌握娛樂消遣。
在此背景下,DeepMind的研究人員試圖引導他們的人工智慧解決更為重要的科學難題——比如,通過預測人類生物學極其微小但至關重要的方面,找到對抗疾病的新方法。
如今,藉助最新版本的AlphaFold人工智慧引擎,他們似乎真的實現了這個雄心勃勃的目標。50年來,研究人員一直在努力預測蛋白質是如何實現它們的三維結構的,但這並不是一個容易解決的問題。事實上,所有可能的分子結構的數量大得令人難以置信,研究人員推測,要對所有可能的分子結構進行採樣,需要比宇宙年齡更長的時間。
儘管如此,如果我們能夠解決這個被稱為蛋白質摺疊問題的謎題,這將是科學上的巨大突破,極大地加速藥物發現和疾病建模等方面的研究,並延伸出遠遠超出健康領域的新應用。出於這個原因,儘管極具挑戰,但研究人員一直在合作,在開發蛋白質摺疊問題的解決方案方面取得進展。
20世紀90年代開始了一項名為CASP(蛋白質結構預測的關鍵評估)的嚴格實驗,挑戰著科學家們設計出能夠預測蛋白質摺疊奧秘的系統。如今,CASP實驗已經運行了30年,似乎已經產生了迄今為止最有希望的解決方案,DeepMind的AlphaFold以前所未有的準確性對3D蛋白質結構進行了預測。
來自馬裡蘭大學的CASP聯合創始人約翰·穆爾特說:「近50年來,我們一直困在這個問題上——蛋白質如何摺疊。」「看到DeepMind為這個問題找到解決方案,這是一個非常特殊的時刻。我個人在這個問題上花了這麼長時間,在經歷了那麼多的停歇之後,開始思考我們是否能實現這個目標。」
在實驗中,DeepMind為AlphaFold使用了一種新的深度學習架構,該架構能夠解釋和計算3D蛋白質的「空間圖」,預測支撐其摺疊結構的分子結構。該系統通過分析包含約17萬個蛋白質結構的資料庫進行訓練,將其獨特的技能組合用於今年的CASP挑戰,其預測的全球距離測試的中位數得分為92.4 GDT。
這超過了90 GDT的臨界值,一般認為這與通過實驗方法得到的相同結果具有競爭力。DeepMind表示,它的預測平均只差1.6埃(大約一個原子的寬度)。
「當我看到這些結果時,我幾乎從椅子上摔下來,」歐洲分子生物學實驗室的基因組學研究員伊萬·伯尼說。「我知道CASP有多嚴格——它基本上確保了計算模型必須執行具有挑戰性的從頭開始的蛋白質摺疊任務。看到這些模型能如此準確地做到這一點,我感到很驚訝。有很多方面需要理解,但這是科學的巨大進步。」
熟悉該領域的專家們已經承認並讚揚了這一突破,儘管完整的報告和詳細的結果還有待觀察。英國皇家學會主席、結構生物學家羅摩克裡希納說:「這個計算工作代表了在蛋白質摺疊問題上令人震驚的進步,這是一個有50年歷史的生物學大挑戰。」它發生的時間比該領域的許多人所預測的要早幾十年。