文 | 姚思妤
編輯 | 尹莉娜
2017年,AlphaGo擊敗「最強大腦」柯潔,從此退隱江湖。
2018年,AlphaGo的「姊妹」系統AlphaFold亮相第13屆「蛋白質結構預測奧運會」CASP,擊敗97名參賽者,一舉奪魁。
兩年後的11月30日,AlphaFold在CASP中再次衛冕,因AlphaGo名揚四海的DeepMind公司宣布,AlphaFold在解決生物學界50年難題方面又獲得了新的突破。「DeepMind遙遙領先。」CASP主席John Moult說。
▲AlphaFold在「蛋白質結構預測奧運會」CASP中兩次奪冠
本屆CASP中,AlphaFold系統對所有蛋白靶點3D結構預測的中位GDT評分高達92.4分。而達到90分以上就可以認為是與實驗所確定的結構相一致。即便是針對最難解析的蛋白靶點,AlphaFold的中位GDT評分也達到了87.0分。
▲AlphaFold根據胺基酸序列預測的蛋白結構與實驗手段解析的結果幾乎完全重合(綠色,實驗結果;藍色,計算預測結果;圖片來源:DeepMind Blog)
那麼蛋白質結構到底有什麼用?眾所周知,蛋白質是維持生命所必需的分子,帶有蛋白質編碼的DNA片段則稱為基因,而蛋白質的功能一般取決於其獨特的3D結構。
例如,構成人體免疫系統的抗體蛋白是「Y 形」的,形狀類似於獨特的鉤。通過鎖定病毒和細菌,抗體蛋白能夠檢測和標記這些引發疾病的微生物並最終消滅它們。其他類型的蛋白質包括CRISPR和Cas9,它們會像剪刀一樣剪切並粘貼DNA。
預測蛋白質的結構可以讓我們了解它在體內的作用,幫助診斷和治療由蛋白質堆疊錯誤引起的疾病,如阿爾茨海默症、帕金森症、亨丁頓舞蹈症和囊腫性纖維化等。
但是從純粹的基因序列中找出蛋白質結構並不容易,其挑戰在於DNA僅包含有關蛋白質構建塊序列的信息——胺基酸殘基,它形成了長鏈,預測這些鏈如何摺疊成蛋白質的複雜3D結構——即「蛋白摺疊問題」,是科學家們幾十年來都未曾解決的難題。
▲預測蛋白質3D結構模型示意
有學者估計,一個典型的蛋白質理論上可以形成10³ºº個可能構象。用什麼樣的計算方法,才能找出那個10³ºº分之一的正確構象呢?
北宋科學家沈括曾在《夢溪筆談》中提到,19路圍棋,最多可以放361個子,每一步棋約有10的172次方種下法。而AlphaFold自誕生以來,僅僅在4年間就將運算量級提升遠遠超過了兄弟「AlphaGo」,進化速度之強令人驚嘆。
在過去的50年中,科學家們已經能夠使用冷凍電子顯微鏡、核磁共振等技術來確定實驗室中的蛋白質形狀。但是上述方法都需要大量反覆的實驗,這將花費數年的時間和大量的金錢。所以,生物學家將目光轉向AI,希望可以解決這個問題。
AlphaFold則藉助兩種不同的方法來預測蛋白質結構的物理性質,以此達到高度的準確性。
第一種方法建立在常用的結構生物學中技術上,用新的蛋白質片段反覆替換蛋白質結構的片段,不斷提高所提出的蛋白質結構的得分;第二種方法則通過梯度下降優化得分, 該技術應用於整個蛋白質鏈,而不是在組裝之前必須單獨摺疊的碎片,從而降低了預測過程的複雜性。
藥物靶點是指藥物在體內的作用結合位點,識別新的有效的藥物靶點是新藥開發的重中之重。然而,發現和驗證大量分子靶標所涉及的工作極大增加了藥物開發的負擔。
以熱門的腫瘤新藥研發為例,人體所攜帶的癌症相關基因近500個,會產生將近1000萬個基因的變異,涉及10多條信號通路和60多個藥物靶點,而且這個數字還將不斷擴大。
AI則可以很好地解決這個問題,通過實時抓取和動態學習更新,儘量窮盡腫瘤靶點的知識庫,提高這一環節的效率。幫助生物學家更早、更快地找到更佳的藥物作用靶點,減少研發時間和所需臨床試驗的數量。
曾在瑞士諾華製藥工作過的美國史賽克醫療器械全國銷售經理金宏山對《財健道》說,蛋白質結構預測工作,已經開拓了「已知藥物靶點正向篩選藥物」和「已知藥物反向篩選靶點」兩個領域。AlphaFold對蛋白質結構的預測則開啟AI藥物發現的第三大領域,即「發現新靶點,解析新靶點」。
AlphaFold不見得完全取代冷凍電子顯微鏡等其它實驗手段,但是DeepMind的研究人員表示,這一令人興奮的結果表明,生物學家們可以將計算結構預測作為科學研究的核心工具之一。這一手段對於特定類型的蛋白來說可能尤為便利,例如膜蛋白一直非常難於結晶,因此很難用實驗手段獲得它們的結構。
而對於從事計算和機器學習研究的DeepMind團隊來說,AlphaFold的表現證明了AI在輔助基礎科學發現方面的驚人潛力。該團隊在公司發布的博文中表示,他們相信,AI將成為人類拓展科學知識前沿最有力的工具之一!
(作者系《財經》實習研究員)
- END -
參考文獻:
【1】《「阿爾法狗」親兄弟AlphaFold破解預測蛋白質結構50年難題》,騰訊新聞
【2】《AI引發製藥革命?26億美元的新藥成本魔咒就要被打破了》,億歐大健康
【3】《AlphaGo「兄弟」AlphaFold出世,DeepMind再創記錄》,CSDN
【4】《解決生物學50年來的重大挑戰!生物界「AlphaGo」精準預測蛋白質結構》,藥明康德
【5】《DeepMind開源AlphaFold,蛋白質預測模型登上Nature》,CSDN