當地時間11月30日,英國DeepMind團隊宣布在蛋白質結構問題上取得重大進展,其第二代「阿爾法摺疊」(AlphaFold)方法精準預測蛋白質的三維結構,摘得國際蛋白質結構預測競賽(CASP)冠軍。
這一進展被輿論視為繼AlphaGo以3:0戰勝世界圍棋冠軍後,人工智慧的再度發威。有網友擔憂「結構生物學家是否會因此失業」,也有人認為,在代碼正式公開之前,所謂的重大進展可能只是炒作。
眾所周知,在人體內有成千上萬種不同的蛋白質,而蛋白質的作用很大程度上取決於其獨特的3D結構。弄清楚蛋白質摺疊成什麼形狀被稱為「蛋白質摺疊問題」。這在過去的50年中,一直是生物學的重大挑戰。
此間,生物學家主要利用X射線晶體學或冷凍電鏡(cryo-EM)等實驗技術來破譯蛋白質的三維結構。但這類方法耗時長、成本高。目前,科學界已經在生命體內發現了2億多個蛋白質,但只有約17萬蛋白質的結構經實驗破解,並被上傳至公開的蛋白質數據銀行(Protein Data Bank)。
DeepMind團隊的AlphaFold(「阿爾法摺疊」)程序在此次競賽中戰勝其餘100多個團隊。《自然》新聞評論稱「它將改變一切」,「將極大地加快了解細胞組成部分的工作,並使更快、更先進的藥物發現成為可能。」
DeepMind團隊對比賽結果感到興奮,他們在博客中將AlphaFold稱為應對生物學50年重大挑戰的「解決方案」,並對「AlphaFold對生物學研究和更廣闊世界的影響持樂觀態度」 。
事實上,這不是DeepMind對蛋白質摺疊問題的第一次挑戰。
早在2018年,DeepMind第一代人工智慧程序AlphaFold便參與了國際蛋白質結構預測競賽(CASP)。首次參加國際比賽的AlphaFold在「預測蛋白質三維結構」的任務中排名第一。當時,第二名的準確率與AlphaFold相差甚遠。2020年1月,DeepMind團隊將相關研究發表在學術期刊《Nature》並公開了代碼。
第二代AlphaFold強勢歸來,創建了基於注意機制的神經網絡,經過端到端訓練的優化整體構建結構,使用序列、結構和宏基因組等信息細化結構。此次比賽中,第二代AlphaFold方法的中位分數為92.4(滿分100分),預測最具挑戰性的蛋白質的平均得分為87,比次優預測高出25分。
對於第二代AlphaFold的比賽結果,中國人民大學數學科學研究院教授、清華大學北京結構生物學高精尖中心合作研究員龔新奇對結構生物學家顏寧等人創辦的科學自媒體「返樸」表示,在欣喜的同時,蛋白質結構預測領域的同行對AlphaFold2有一些保留意見。
「工程化明顯,依賴於強大的GPU計算資源和代碼優化團隊;谷歌公司幾乎可以收集全球所有網絡信息,雖然看起來AlphaFold2的自動化程度很高,但他們在人工操作中使用了哪些信息值得關注;預測對了結構,但不等於明白了蛋白質摺疊過程和原理。」
美國普林斯頓大學雪莉·蒂爾曼終身講席教授,美國科學院外籍院士顏寧則評價稱,「這次人工智慧贏得CASP的新聞亮點有兩個,一是AI,二是準確度高。這確實是突破,但是有了兩年前的新聞(註:2018年,DeepMind開發的第一代AlphaFold首次參加CASP並且拔得頭籌)做鋪墊,現在這次委實是意料之中。」
對於所謂「結構生物學家都要失業了」的調侃,她表示,結構生物學的主語是生物學,是理解生命、是做出生物學發現。「結構本身只是手段,它們是為了回答問題、做出發現。」
AlphaGo之父、DeepMind聯合創始人兼CEO 戴密斯·哈薩比斯(Demis Hassabis)對媒體表示,DeepMind計劃讓AlphaFold變得有用,以便其他科學家可以使用它。此前,DeepMind公布了第一版AlphaFold的大量細節,以供科學家複製該方法。
DeepMind目前尚未發表第二代AlphaFold的相關論文,但在博客中表示,正在準備有關該系統的論文,以適時提交給同行評審期刊。
在論文正式發表之前,「阿爾法摺疊」是「重大進展」還是一場「炒作」的爭議恐將持續一段時間。
(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)