生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...

2020-12-08 澎湃新聞

鄭集楊 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。

啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。

11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。

這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。

而過去十幾年,其他方法只能在40分左右徘徊。

△圖源:Deepmind

兩年前,上一版本的AlphaFold便已經取得了裡程碑的突破,但是,仍然沒有完全解決蛋白質摺疊問題。而這次AlphaFold 2,則更進一步。

這一巨大的突破,直接引爆了全網,Nature、Science紛紛報導,生物屆和AI大牛們也紛紛祝賀。

甚至很少露面的DeepMind創始人哈薩比斯,也親自出面介紹:

DeepMind背後的終極願景一直是構建通用人工智慧,利用通用人工智慧來極大地加速科學發現的步伐,幫助我們更好地了解周圍世界。

而哥大生物學助理教授Mohammed AlQuraishi,更是評價道:

蛋白質結構AI進入「ImageNet時代」。

如此重大的突破,究竟帶來了什麼呢?讓我們來快速且全面地了解一下。

CASP中斬獲92.4的均分

就在11月30日,第14次CASP評估的評價結果公布了。

CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。

△圖源:Science

從1994年起,隨著技術的進步,蛋白質的預測準確性在不斷增加,而在今年,迎來了重大突破,預測準確性得分達到了92.4/100。

而這,便是DeepMind的AlphaFold 2系統帶來的。

AlphaFold 2在所有目標上測試結果:GDT的平均得分為92.4,中位數得分也達到了87.0,這比第二名高出了25分。

GDT(Global Distance Test),是用來衡量預測準確性的主要指標。

簡單來說,GDT就是:預測結果對於正確位置,在距離上的一個綜合評分。

能斬獲92.4的準確性高分,這說明,預測的結果,誤差基本不超過一個原子的大小。

這無疑是巨大的突破。

對此,CASP發起人,計算生物學家約翰·莫爾特(John Moult)表示:

從某種意義上說,蛋白質摺疊的問題已經解決了。

端到端的訓練

如此強大的AlphaFold 2系統,不免讓人好奇,它是如何訓練出來的呢?

首先,研究人員把摺疊的蛋白質認為是一個「空間圖」,其中殘基是節點,邊緣連接著非常接近的殘基。

之後,建立了一個基於注意力機制的神經網絡系統,端到端進行了訓練。

建立的這個系統會試圖解釋這個圖的結構,同時對它正在構建的隱式圖進行推理。

在這個推理過程,還會用到生物學中已知的信息進行完善,如:進化中的同源序列,多序列比對(MSA)和胺基酸殘基對等。

通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。

此外,AlphaFold還使用了內部置信度度量指標來判斷蛋白質結構中哪些部分是可靠的。

之後,研究人員在公開的數據上訓練了這個系統,這些資料庫包括大約170000個蛋白質結構,其中便有許多未知結構的蛋白質序列。

這個訓練過程花費了幾周的時間,使用了大約128個TPUv3內核(大約相當於100-200個GPU)。

實驗證明AlphaFold確實靠譜

不過,所謂技術突破,都總會引來一些質疑。

連組織者都擔心:DeepMind可能一直在以某種方式作弊。

因此,德國馬克斯·普朗克發育生物學研究所蛋白質進化學系主任安德烈·盧帕斯(Andrei Lupas)提出了一個特殊的挑戰:預測一種來自古細菌群中古細菌物種的膜蛋白。

十年來,科學家雖然獲取了這個蛋白質的X射線晶體結構,但是一直無法解釋它。

而AlphaFold 2,輸出了一個三部分構成的蛋白質詳細圖像,中間有兩個長長的螺旋臂。

而該模型,使盧帕斯和他的同事能夠理解他們的X射線數據。

之後,科學家用了半小時進行驗證,發現:實驗結果完全符合AlphaFold的預測結構。

盧帕斯驚呼:「這幾乎是完美的。」

他們不可能這麼作弊,我不知道他們是怎麼做到的。

AlphaFold 2憑事實,告訴大家:這個進展確實真實而且靠譜的。

解決50年的挑戰

克裡斯蒂安·安芬森在1972年諾貝爾化學獎的獲獎感言中,提出了一個著名的假設,即理論上,蛋白質的胺基酸序列應該完全決定其結構。

正是由於這一假設,引發了50年的探索,即能夠僅基於1D胺基酸序列通過計算預測蛋白質的3D結構。

然而,一個主要的挑戰是,一種蛋白質在進入最終的3D結構之前,理論上可以摺疊的方式數量是天文數字。

1969年,Cyrus Levinthal指出,通過蠻力計算來列舉一種典型蛋白質的所有可能構型需要比已知宇宙的年齡更長的時間——Levin thal估計了一種典型蛋白質的10^300種可能構象。

要知道,AlphaGo面對的圍棋問題複雜度也就是10^171,蛋白質摺疊問題比圍棋複雜度高出129個數量級!

DeepMind的研究人員對此說道:DeepMind方法將產生深遠的影響,其中包括極大地加快新藥的開發速度。

馬裡蘭大學的結構生物學家Shady Grove則表示:

這是一個已有50年歷史的問題,我從沒想過一輩子中能看到這個。

參考連結:

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

https://www.nytimes.com/2020/11/30/technology/deepmind-ai-protein-folding.html

https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures

— 完 —

本文系網易新聞•網易號特色內容激勵計劃籤約帳號【量子位】原創內容,未經帳號授權,禁止隨意轉載。

原標題:《生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確性達92.4》

閱讀原文

相關焦點

  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。而攻克這一難題的正是其2018年一經推出便震驚科學界的AI系統——AlphaFold。
  • 解決生物學50年來重大挑戰!人工智慧預測蛋白結構能力堪比實驗室水平
    」馬克斯-普朗克發育生物學研究所的進化生物學家Andrei Lupas說[2]。 「我之前認為這個問題在我有生之年不會得到解決。」歐洲分子生物學實驗室的結構生物學家Janet Thornton說[3]。 「它的發生比該領域的許多人預測的要早幾十年。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    【新智元導讀】近日,DeepMind在預測蛋白質結構方面邁出了一大步!公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!DeepMind這一歷史性進展有助於加快藥物發現速度,對理解人類生命形成機制至關重要。剛剛,一個困擾生物學家50年的難題,被AI解決了。
  • DeepMind的蛋白質摺疊AI解決了50年來的生物學重大挑戰
    蛋白質的工作方式和功能由其三維形狀決定-"結構即功能 "是分子生物學的公理。幾十年來,實驗室實驗一直是獲得良好蛋白質結構的主要途徑。從20世紀50年代開始,利用X射線束射向結晶的蛋白質,並將衍射光轉化為蛋白質的原子坐標的技術,首次確定了蛋白質的完整結構。X射線晶體學產生了絕大部分的蛋白質結構。
  • 破解生物界50年重大挑戰!DeepMind用AI精準預測蛋白質結構
    智東西(公眾號:zhidxcom)編譯 |子佩編輯 |Panken智東西12月2日消息,Alphabet旗下公司DeepMind本周一在官網中宣布,已經開發出可以快速準確預測蛋白質結構的機器學習軟體AlphaFold,用於藥物開發。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。比起這個成果,相信大家跟我一樣更感興趣的是,這個DeepMind究竟是個什麼神奇公司,可以破解50年來無人能破的世界級計算難題?為創建超人類AI而生,讓馬斯克極度關注DeepMind跟傳奇的谷歌X實驗室不同,它並非谷歌親身,而是最初於2010年在英國成立的一家AGI(通用人工智慧)公司。
  • 顛覆生物學!AlphaFold成功預測蛋白質結構
    原文作者:Ewen Callaway科學家認為,谷歌預測蛋白質3D結構的深度學習程序將顛覆生物學。谷歌旗下人工智慧(AI)公司DeepMind的一個AI網絡朝著解決生物學領域最大的挑戰之一邁出了一大步,這裡的挑戰是:根據一個蛋白質的胺基酸序列來確定它的3D結構。
  • DeepMind AI系統攻破生物學界50多年重大難題
    美國時間 11 月 30 日,谷歌母公司 Alphabet 旗下人工智慧公司 DeepMind 公開宣布,生物學界 50 年來的重大難題——蛋白質摺疊預測,已被其成功攻克。Alphabet 旗下人工智慧公司 DeepMind 在預測蛋白質結構方面邁出了一大步。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    傳統上,蛋白質結構預測可以分成基於模板和從頭預測,但是AlphaFold2隻用同一種方法——機器學習,對幾乎所有的蛋白質都預測出了正確的拓撲學的結構,其中有大約2/3的蛋白質預測精度達到了結構生物學實驗的測量精度。這說明,至少是在單結構域的蛋白結構,他們接近解決了這個問題。谷歌這次為什麼能夠取得如此大的成功?這首先與它們擁有強大的人力和計算資源有關。
  • AI再發力,解決困擾生物學家近50年的一個基本問題
    蛋白質是一切生命活動的基礎物質,它是運輸氧氣的載體,是幫助抵禦病毒的抗體,也是消化食物的酶。蛋白質之所以能夠承擔多種多樣的功能,很大程度上是因為它們具有豐富而複雜的空間結構。可是,蛋白質如何摺疊成這些獨特的形狀呢?這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。
  • DeepMind打造AlphaFold擊敗人類,精度碾壓人類專家!
    DeepMind匯集了來自結構生物學,物理學和機器學習領域的專家,以應用尖端技術,僅根據其基因序列預測蛋白質的3D結構。過去兩年來,DeepMind一直在研究開發AlphaFold,該研究建立在多年研究基礎上,使用大量的基因組數據來預測蛋白質結構。 AlphaFold生成的蛋白質3D模型比之前的任何蛋白質都更加準確 - 在生物學的核心挑戰之一上取得了重大進展。
  • 再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務
    DeepMind 於 2010 年創辦,創始人為 Demis Hassabis、Mustafa Suleyman 和 Shane Legg,2014 年被谷歌以 6 億美元收購。這家公司因其大量研究成果被社區所熟知,比如打敗圍棋世界冠軍的 AlphaGo、預測蛋白質結構的 等等。
  • 除了下圍棋,AI還能預測「難纏「的蛋白質結構,它是怎麼做到的?
    在2020年各種重大科學新聞評選中,「人工智慧預測蛋白質三維結構」是上榜率很高的一項內容。50年來,科學家們一直在努力解決生物學最大的挑戰之一——預測一串胺基酸在變成工作蛋白質時摺疊成的精確三維形狀。2020年,他們通過一款人工智慧程序,實現了這一目標。那麼,這個工作的意義是什麼?人工智慧又是如何做到這一點的?
  • 精準預測蛋白結構的AlphaFold,會砸了結構生物學家的飯碗嗎?
    當日,DeepMind在官網發布新聞稿,稱對於困擾生物學界50年的 「蛋白質摺疊」 難題,AlphaFold系統已成為業內專家認可的解決方案;Nature新聞更是以 「it will change everything」(將改變一切)作為標題,指出DeepMind在解決蛋白結構問題上「邁出一大步」。
  • AlphaFold 2發布背後,DeepMind AI去年巨虧6.49億美元
    【新智元導讀】根據最新的年度報告,Alphabet旗下的人工智慧公司DeepMind2019年持續虧損,虧損金額達4.77億英鎊,與上年相比,虧損金額增長了1.5%;而2019年公司的大部分支出都用在了「人員和其他相關支出」。
  • 擊敗李世石的AI公司,又研發出生物版「阿爾法狗」:破解50年生物學...
    當地時間11月30日,谷歌旗下的人工智慧公司DeepMind宣布,其研發的AI系統AlphaFold成功解開了一個困擾人類長達50年之久的生物學難題——「蛋白質摺疊問題」。這一驚人的成果立刻引發了關注。
  • DeepMind簡史:解決科技棘手問題,挑戰史詩級任務
    該團隊現研究蛋白質摺疊——預測生命基石的形狀的科學。        Kohli召集了一組結構生物學家、機器學習專家和物理學家,以應對這一挑戰。        蛋白質是所有哺乳動物生命的基礎,它們在分子水平上發展組織和器官的結構和功能。        蛋白質由胺基酸構成鏈。
  • AlphaFold2是什麼狗?(會後解讀)
    前言蛋白質結構預測問題是結構生物學一個裡程碑式的問題,每兩年,人類會組織一場蛋白質結構預測大賽,而在接下來的幾天,第十四屆,堪稱該領域奧林匹克的比賽,CASP14就要開始了。據我腦子中的淺薄的知識,目前所有學術界在做蛋白質結構預測方向好像都沒有用上這個。以為deepmind在這裡用了什麼黑科技。然後經提醒發現是這個Richard Evans,主攻Deep reinforcement learning的,且參加過初代alphafold 的開發,瞬間合理了!
  • Deepmind被「圈外人」刷屏後,「圈內」科學家是如何評價它的?
    許東是美國密蘇裡大學哥倫比亞分校Shumaker講座教授,AAAS和AIMBE會士,曾因為蛋白結構預測的工作獲得2001年美國「最傑出研究與開發100人獎勵(國際2001R&D 100 Award)」。從1997年開始,許東教授就開始了蛋白質結構預測這方面的研究。他表示,從防病、治病的角度來看,蛋白質結構變化預測,絕對是非常重要。
  • 困擾科學家近半個世紀的蛋白質摺疊難題破了!這回又是AI揭的秘
    在2020年各種重大科學新聞評選中,「人工智慧預測蛋白質三維結構」是上榜率很高的一項內容。50年來,科學家們一直在努力解決生物學最大的挑戰之一——預測一串胺基酸在變成工作蛋白質時摺疊成的精確三維形狀。今年,他們通過一款人工智慧程序,實現了這一目標。那麼,這個工作的意義是什麼?人工智慧又是如何做到這一點的?