生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...

2021-01-09 澎湃新聞

鄭集楊 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。

啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。

11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。

這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。

而過去十幾年,其他方法只能在40分左右徘徊。

△圖源:Deepmind

兩年前,上一版本的AlphaFold便已經取得了裡程碑的突破,但是,仍然沒有完全解決蛋白質摺疊問題。而這次AlphaFold 2,則更進一步。

這一巨大的突破,直接引爆了全網,Nature、Science紛紛報導,生物屆和AI大牛們也紛紛祝賀。

甚至很少露面的DeepMind創始人哈薩比斯,也親自出面介紹:

DeepMind背後的終極願景一直是構建通用人工智慧,利用通用人工智慧來極大地加速科學發現的步伐,幫助我們更好地了解周圍世界。

而哥大生物學助理教授Mohammed AlQuraishi,更是評價道:

蛋白質結構AI進入「ImageNet時代」。

如此重大的突破,究竟帶來了什麼呢?讓我們來快速且全面地了解一下。

CASP中斬獲92.4的均分

就在11月30日,第14次CASP評估的評價結果公布了。

CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。

△圖源:Science

從1994年起,隨著技術的進步,蛋白質的預測準確性在不斷增加,而在今年,迎來了重大突破,預測準確性得分達到了92.4/100。

而這,便是DeepMind的AlphaFold 2系統帶來的。

AlphaFold 2在所有目標上測試結果:GDT的平均得分為92.4,中位數得分也達到了87.0,這比第二名高出了25分。

GDT(Global Distance Test),是用來衡量預測準確性的主要指標。

簡單來說,GDT就是:預測結果對於正確位置,在距離上的一個綜合評分。

能斬獲92.4的準確性高分,這說明,預測的結果,誤差基本不超過一個原子的大小。

這無疑是巨大的突破。

對此,CASP發起人,計算生物學家約翰·莫爾特(John Moult)表示:

從某種意義上說,蛋白質摺疊的問題已經解決了。

端到端的訓練

如此強大的AlphaFold 2系統,不免讓人好奇,它是如何訓練出來的呢?

首先,研究人員把摺疊的蛋白質認為是一個「空間圖」,其中殘基是節點,邊緣連接著非常接近的殘基。

之後,建立了一個基於注意力機制的神經網絡系統,端到端進行了訓練。

建立的這個系統會試圖解釋這個圖的結構,同時對它正在構建的隱式圖進行推理。

在這個推理過程,還會用到生物學中已知的信息進行完善,如:進化中的同源序列,多序列比對(MSA)和胺基酸殘基對等。

通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。

此外,AlphaFold還使用了內部置信度度量指標來判斷蛋白質結構中哪些部分是可靠的。

之後,研究人員在公開的數據上訓練了這個系統,這些資料庫包括大約170000個蛋白質結構,其中便有許多未知結構的蛋白質序列。

這個訓練過程花費了幾周的時間,使用了大約128個TPUv3內核(大約相當於100-200個GPU)。

實驗證明AlphaFold確實靠譜

不過,所謂技術突破,都總會引來一些質疑。

連組織者都擔心:DeepMind可能一直在以某種方式作弊。

因此,德國馬克斯·普朗克發育生物學研究所蛋白質進化學系主任安德烈·盧帕斯(Andrei Lupas)提出了一個特殊的挑戰:預測一種來自古細菌群中古細菌物種的膜蛋白。

十年來,科學家雖然獲取了這個蛋白質的X射線晶體結構,但是一直無法解釋它。

而AlphaFold 2,輸出了一個三部分構成的蛋白質詳細圖像,中間有兩個長長的螺旋臂。

而該模型,使盧帕斯和他的同事能夠理解他們的X射線數據。

之後,科學家用了半小時進行驗證,發現:實驗結果完全符合AlphaFold的預測結構。

盧帕斯驚呼:「這幾乎是完美的。」

他們不可能這麼作弊,我不知道他們是怎麼做到的。

AlphaFold 2憑事實,告訴大家:這個進展確實真實而且靠譜的。

解決50年的挑戰

克裡斯蒂安·安芬森在1972年諾貝爾化學獎的獲獎感言中,提出了一個著名的假設,即理論上,蛋白質的胺基酸序列應該完全決定其結構。

正是由於這一假設,引發了50年的探索,即能夠僅基於1D胺基酸序列通過計算預測蛋白質的3D結構。

然而,一個主要的挑戰是,一種蛋白質在進入最終的3D結構之前,理論上可以摺疊的方式數量是天文數字。

1969年,Cyrus Levinthal指出,通過蠻力計算來列舉一種典型蛋白質的所有可能構型需要比已知宇宙的年齡更長的時間——Levin thal估計了一種典型蛋白質的10^300種可能構象。

要知道,AlphaGo面對的圍棋問題複雜度也就是10^171,蛋白質摺疊問題比圍棋複雜度高出129個數量級!

DeepMind的研究人員對此說道:DeepMind方法將產生深遠的影響,其中包括極大地加快新藥的開發速度。

馬裡蘭大學的結構生物學家Shady Grove則表示:

這是一個已有50年歷史的問題,我從沒想過一輩子中能看到這個。

參考連結:

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

https://www.nytimes.com/2020/11/30/technology/deepmind-ai-protein-folding.html

https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures

— 完 —

本文系網易新聞•網易號特色內容激勵計劃籤約帳號【量子位】原創內容,未經帳號授權,禁止隨意轉載。

原標題:《生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確性達92.4》

閱讀原文

相關焦點

  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    蛋白質對於生命至關重要,它們是由胺基酸鏈組成的大型複雜分子,其作用取決於自身獨特的 3D 結構。弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。
  • 除了下圍棋 AI還能預測"難纏"的蛋白質結構
    在2020年各種重大科學新聞評選中,「人工智慧預測蛋白質三維結構」是上榜率很高的一項內容。50年來,科學家們一直在努力解決生物學最大的挑戰之一——預測一串胺基酸在變成工作蛋白質時摺疊成的精確三維形狀。2020年,他們通過一款人工智慧程序,實現了這一目標。那麼,這個工作的意義是什麼?人工智慧又是如何做到這一點的?
  • 機器學習遇見生物學:詳解蛋白質摺疊預測中的算法
    機器之心原創作者:王子嘉編輯:H4O蛋白質摺疊問題耗費巨大,而使用機器學習或許能夠更為高效、準確地解決這一難題。本文介紹了目前這一領域遇到的問題,以及機器學習怎樣幫助解決的具體算法。蛋白質摺疊問題一直是一個耗費巨大的難題,但是這個難題的解決又對人類具有巨大的意義。
  • 阿法狗算什麼?這個星球最聰明的人說:零來了 擺脫人類自學成才
    在今年5月烏鎮一役完勝人類第一高手柯潔、宣布就此封盤退役的阿法狗為何在短短數月之後又捲土重來?紅星新聞記者19日晚在第一時間連線到了阿法狗之父、谷歌Deepmind公司CEO德米什·哈薩比斯,他向我們獨家揭秘了新一代阿法狗之謎。
  • 擊敗李世石的AI公司,又研發出生物版「阿爾法狗」:破解50年生物學...
    當地時間11月30日,谷歌旗下的人工智慧公司DeepMind宣布,其研發的AI系統AlphaFold成功解開了一個困擾人類長達50年之久的生物學難題——「蛋白質摺疊問題」。 這一驚人的成果立刻引發了關注。
  • AlphaFold2是什麼狗?(會後解讀)
    前言蛋白質結構預測問題是結構生物學一個裡程碑式的問題,每兩年,人類會組織一場蛋白質結構預測大賽,而在接下來的幾天,第十四屆,堪稱該領域奧林匹克的比賽,CASP14就要開始了。據我腦子中的淺薄的知識,目前所有學術界在做蛋白質結構預測方向好像都沒有用上這個。以為deepmind在這裡用了什麼黑科技。然後經提醒發現是這個Richard Evans,主攻Deep reinforcement learning的,且參加過初代alphafold 的開發,瞬間合理了!
  • 阿法狗vs柯潔三勝:阿法狗比去年強大太多
    韓聯社1月10日報導稱,圍棋人工智慧AlphaGo阿法狗在人類圍棋界的積極支持下迅速成長。韓國網絡圍棋網站Tygem9日稱,已經與谷歌Deepmind建立了緊密的合作關係,將不遺餘力地支持阿法狗的發展。
  • Nat Methods:計算神經網絡驅動下一代「蛋白質預測技術」的誕生
    2019年10月23日 訊 /生物谷BIOON/ --一直以來,合成生物學家一直試圖通過改變自然界中存在的蛋白質,甚至是從頭合成蛋白質,將其進化的途徑掌握在自己手中。通過人工構建不同類型的蛋白,可以設計藥物,感測生物信號,以及生產高價值化學品,等等。為了設計蛋白質,科學家們使用了兩種截然不同的方法。
  • DeepMind再度取得AI突破
    在發表於《科學》的評論中寫到,1997年被IBM人工智慧擊敗的西洋棋冠軍Garry Kasparov對AlphaZero大加讚賞,認為這一AI不僅技術嫻熟,在對弈手法上也讓人捉摸不透。Kasparov寫到,AlphaZero讓人驚奇的地方在於,通常來說AI程序會在對弈中會選擇較為保守的策略,但它卻似乎更傾向於採用高風險策略。
  • 創造出「阿法狗」的是怎樣的人
    在Deepmind公司公布的一段視頻中,有人就留意到,在「阿法狗」與樊麾對弈時,「阿法狗」的介紹標籤上貼著一個英國國旗。而這一次「阿法狗」挑戰韓國的世界冠軍李世石,現場的選手信息介紹中,也同樣給「阿法狗」貼上了一個英國國旗。
  • 今日Nature: 人工智慧從0到1, 無師自通完爆阿法狗100-0 深度解析
    他的名字叫阿法狗。  今年,他的弟弟只靠一副棋盤和黑白兩子,沒看過一個棋譜,也沒有一個人指點,從零開始,自娛自樂,自己參悟,100-0打敗哥哥阿法狗。他的名字叫阿法元。  DeepMind這項偉大的突破,今天以Mastering the game of Gowithout human knowledge為題,發表於Nature,引起轟動。
  • 阿法狗有什麼可怕的?
    我不是職業棋手,不擔心被阿法狗搶走飯碗,我只想知道阿法狗究竟會給我們這些普通人的生活帶來哪些改變。這不是人類第一次被機器打敗,我們的力量、速度、耐力、聽力、視力……都早已輸給了機器,但我們從沒如此緊張過。
  • 「阿法零」接連打敗西洋棋將棋世界冠軍 「阿法狗」走向教學
    【觀察者網綜合報導】自2016年3月甫出茅廬震驚世人後,「阿法狗」(AlphaGo)連續擊敗各路圍棋高手,令人談虎色變。可怕的是其「自我更新」的能力,幾經升級的「阿法狗」已經進化成「阿法零」,自我學期不到24小時,就問鼎西洋棋、將棋、圍棋的人類巔峰。「無敵是寂寞」,沒了對手的「阿法狗」如今選擇放下身段,成為一款棋類教學程序,將「功力」傳授給大家。
  • 還記得那個打敗了柯潔的阿法狗嗎?新一代阿法星已全面超越人類
    在2016年,有一家叫做深度思維的人工智慧公司推出了一個叫做阿爾法狗的AI程序,當時它被用來學習圍棋算法,並且對抗人類最頂尖的棋手,而在此之前,AI已經攻克了西洋棋、象棋、軍棋等多個領域獲得冠軍,只有圍棋由於在算法樹上出現了太多的分支,所以讓所有的傳統AI都無計可施。
  • 「阿爾法狗」轉行預測蛋白質結構,交大教授建議布局AI+生物醫藥|新...
    美國《科學》雜誌近日評選出了2020年十大科學突破,「人工智慧首次精準預測蛋白質三維結構」榜上有名。 人工智慧讓蛋白質結構預測成為可能 蛋白質具有三維結構,由一系列胺基酸摺疊而成。對科學家來說,胺基酸測序是比較容易完成的工作,蛋白質三維結構解析的難度卻很大,耗時費力。1972年,美國科學家克裡斯蒂安·安芬森因提出「蛋白質的高級空間結構由其胺基酸序列決定」而獲得諾貝爾化學獎。
  • 最新版「阿法狗」Master更強大 橫掃棋壇60連勝
    Master確實是只「狗」 最新版「阿法狗」更強大    Master究竟是何方神聖?昨天晚上,謎底揭開,谷歌旗下的人工智慧網站DeepMind官方確認Master即「阿法狗」。只不過,它是「阿法狗」的最新版本。一周以來,它可是讓人類圍棋高手吃盡苦頭。
  • [圖]谷歌DeepMind可幫助醫生提前48小時預測急性腎損傷
    根據本周三公司發布的最新研究報告,DeepMind正研發新的人工智慧系統能夠讓醫生更快捷的預測病情惡化,提前48小時預測急性腎損傷(AKI)的發生。根據美國疾病控制和預防中心的數據,急性腎病每年奪去50萬美國患者的生命。急性腎損傷可能是致命的,而且它們對醫生來說是一個真正棘手的問題。它們不僅難以檢測,而且還可能導致患者迅速惡化。不過通過人工智慧系統,DeepMind所提供的解決方案可以幫助醫生提前48小時檢測潛在的腎臟損傷,從而能夠在這段寶貴的時間內解決問題,並能夠讓30%的患者提前預防病情的惡化。
  • 新版「阿法狗」無需人類指導迅速成為圍棋霸主
    這款新程序名叫「阿法元」(AlphaGo Zero),其以100比0的不敗戰績,狠狠打擊了曾書寫歷史的舊版「阿法狗」。  實力,「阿法狗」的輝煌戰績  人工智慧「阿法狗」出自谷歌旗下深度思維(DeepMind)公司。
  • 承啟生物助力中國科學家發現「隱藏的蛋白質組」-美通社PR-Newswire
    蛋白質是胺基酸形成的多肽長鏈。通常認為,至少50個胺基酸以上的為「蛋白質」,而50個胺基酸以下的為「小肽」。小肽因長度短,難以形成複雜的空間構象,只能起一些調控作用;而蛋白質較大,能生成較為精密和複雜的空間構象,便可獨立行使細胞結構、催化酶等較為複雜的功能,也能與其他蛋白質相結合,形成精密的蛋白質複合體甚至大分子機器,是生物學功能的主要執行者。
  • 柯潔是如何被阿法狗超越的?關鍵在於這3點!
    在2017年5月23日,一場舉世矚目的「圍棋人機對抗賽」在浙江桐鄉打響,參賽雙方分別是當時等級分排名世界第一的中國棋手柯潔九段,以及谷歌公司研製的人工智慧程序AlphaGo(國內網友親切地稱之為「阿法狗」)。