DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分

2020-12-01 量子位

鄭集楊 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。

啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。

11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。

這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100

而過去十幾年,其他方法只能在40分左右徘徊。

△圖源:Deepmind

兩年前,上一版本的AlphaFold便已經取得了裡程碑的突破,但是,仍然沒有完全解決蛋白質摺疊問題。而這次AlphaFold 2,則更進一步。

這一巨大的突破,直接引爆了全網,Nature、Science紛紛報導,生物界和AI大牛們也紛紛祝賀。

甚至很少露面的DeepMind創始人哈薩比斯,也親自出面介紹:

DeepMind背後的終極願景一直是構建通用人工智慧,利用通用人工智慧來極大地加速科學發現的步伐,幫助我們更好地了解周圍世界。

而哥大生物學助理教授Mohammed AlQuraishi,更是評價道:

蛋白質結構AI進入「ImageNet時代」。

如此重大的突破,究竟帶來了什麼呢?讓我們來快速且全面地了解一下。

CASP中斬獲92.4的均分

就在11月30日,第14次CASP評估的評價結果公布了。

CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。

△圖源:Science

從1994年起,隨著技術的進步,蛋白質的預測準確性在不斷增加,而在今年,迎來了重大突破,預測準確性得分達到了92.4/100。

而這,便是DeepMind的AlphaFold 2系統帶來的。

AlphaFold 2在所有目標上測試結果:GDT的平均得分為92.4,較難蛋白質的中位數得分也達到了87.0,這比第二名高出了25分。

GDT(Global Distance Test),是用來衡量預測準確性的主要指標。

簡單來說,GDT就是:預測結果對於正確位置,在距離上的一個綜合評分。

能斬獲92.4的準確性高分,這說明,預測的結果,誤差基本不超過一個原子的大小

這無疑是巨大的突破。

對此,CASP發起人,計算生物學家約翰·莫爾特(John Moult)表示:

從某種意義上說,蛋白質摺疊的問題已經解決了。

端到端的訓練

如此強大的AlphaFold 2系統,不免讓人好奇,它是如何訓練出來的呢?

首先,研究人員把摺疊的蛋白質認為是一個「空間圖」,其中殘基是節點,邊緣連接著非常接近的殘基。

之後,建立了一個基於注意力機制的神經網絡系統,端到端進行了訓練。

建立的這個系統會試圖解釋這個圖的結構,同時對它正在構建的隱式圖進行推理。

在這個推理過程,還會用到生物學中已知的信息進行完善,如:進化中的同源序列多序列比對(MSA)胺基酸殘基對等。

通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。

此外,AlphaFold還使用了內部置信度度量指標來判斷蛋白質結構中哪些部分是可靠的。

之後,研究人員在公開的數據上訓練了這個系統,這些資料庫包括大約170000個蛋白質結構,其中便有許多未知結構的蛋白質序列。

這個訓練過程花費了幾周的時間,使用了大約128個TPUv3內核(大約相當於100-200個GPU)。

實驗證明AlphaFold確實靠譜

不過,所謂技術突破,都總會引來一些質疑。

連組織者都擔心:DeepMind可能一直在以某種方式作弊。

因此,德國馬克斯·普朗克發育生物學研究所蛋白質進化學系主任安德烈·盧帕斯(Andrei Lupas)提出了一個特殊的挑戰:預測一種來自古細菌群中古細菌物種的膜蛋白。

十年來,科學家雖然獲取了這個蛋白質的X射線晶體結構,但是一直無法解釋它。

而AlphaFold 2,輸出了一個三部分構成的蛋白質詳細圖像,中間有兩個長長的螺旋臂。

而該模型,使盧帕斯和他的同事能夠理解他們的X射線數據。

這個過程,只用了半小時證,實驗結果完全符合AlphaFold的預測結構。

盧帕斯驚呼:「這幾乎是完美的。」

他們不可能這麼作弊,我不知道他們是怎麼做到的。

AlphaFold 2憑事實,告訴大家:這個進展確實真實而且靠譜的。

解決50年的挑戰

克裡斯蒂安·安芬森在1972年諾貝爾化學獎的獲獎感言中,提出了一個著名的假設,即理論上,蛋白質的胺基酸序列應該完全決定其結構。

正是由於這一假設,引發了50年的探索,即能夠僅基於1D胺基酸序列通過計算預測蛋白質的3D結構。

然而,一個主要的挑戰是,一種蛋白質在進入最終的3D結構之前,理論上可以摺疊的方式數量是天文數字。

1969年,Cyrus Levinthal指出,通過蠻力計算來列舉一種典型蛋白質的所有可能構型需要比已知宇宙的年齡更長的時間——Levin thal估計了一種典型蛋白質的10^300種可能構象。

要知道,AlphaGo面對的圍棋問題複雜度也就是10^171,蛋白質摺疊問題比圍棋複雜度高出129個數量級!

DeepMind的研究人員對此說道:DeepMind方法將產生深遠的影響,其中包括極大地加快新藥的開發速度。

馬裡蘭大學的結構生物學家Shady Grove則表示:

這是一個已有50年歷史的問題,我從沒想過一輩子中能看到這個。

參考連結:
https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
https://www.nytimes.com/2020/11/30/technology/deepmind-ai-protein-folding.html
https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures


— 完 —

量子位 QbitAI · 頭條號籤約

關注我們,第一時間獲知前沿科技動態

相關焦點

  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。而過去十幾年,其他方法只能在40分左右徘徊。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。AlphaFold:精確度高達92.4GDT首先要了解為什麼要預測蛋白質摺疊結構?眾多周知,蛋白質對於生命至關重要。幾乎所有疾病,包括癌症、痴呆症都與蛋白質的功能有關。而蛋白質的功能由它的3D結構決定。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。AlphaFold:精確度高達92.4GDT首先要了解為什麼要預測蛋白質摺疊結構?眾多周知,蛋白質對於生命至關重要。幾乎所有疾病,包括癌症、痴呆症都與蛋白質的功能有關。而蛋白質的功能由它的3D結構決定。
  • DeepMind破解蛋白質摺疊難題
    公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!但超人遊戲從來都不是主要目標,遊戲為程序提供了訓練場,一旦程序足夠強大,就可以解決現實世界中的問題!
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。但一個現實挑戰是,蛋白質的3D結構在形成之前會有數以億計的摺疊方式。美國分子生物學家Cyrus Levinthal指出,如果用蠻力來計算蛋白質所有可能的構型所需要的時間可能比宇宙的時間都要長,一個典型的蛋白質可能有10∧300種可能的構型。因此,從1972年至今,如何準確預測蛋白質的摺疊方式一直是生物學界的一項重大挑戰。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    以下內容分享自微信公眾號機器之心(id:almosthuman2014)  生物學界最大的謎團之一,蛋白質摺疊問題被 AI 破解了。  11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智慧技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題。
  • DeepMind破解蛋白質摺疊難題
    但超人遊戲從來都不是主要目標,遊戲為程序提供了訓練場,一旦程序足夠強大,就可以解決現實世界中的問題!蛋白質摺疊50年來重大突破,AI破解預測難題蛋白質的形狀與其功能密切相關,預測蛋白質結構的能力可以幫助我們更好地理解蛋白質的功能和工作原理。
  • DeepMind破解蛋白質摺疊難題
    【新智元導讀】近日,DeepMind在預測蛋白質結構方面邁出了一大步!公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!DeepMind這一歷史性進展有助於加快藥物發現速度,對理解人類生命形成機制至關重要。剛剛,一個困擾生物學家50年的難題,被AI解決了。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。遊戲意味著有規則可循,所以在有一定規律可循的事情上,Deepmind可以發現其中的規律,並比人類做得更出色。因而,通過Deepmind開發的Alophafold發現蛋白質摺疊規律並成功預測,顯然也在情理之中。
  • 谷歌Deepmind稱解決蛋白質摺疊難題
    來源:新浪科技據報導,Alphabet旗下人工智慧公司DeepMind開發了一款軟體,可以準確預測蛋白質在幾天時間裡會摺疊成什麼樣的結構,從而解決了過去50年的一項「重大挑戰」。這可能為更好地了解疾病和藥物研發鋪平道路。
  • 重大事件上鏈—DeepMind破解蛋白質摺疊難題
    近日,在國際蛋白質結構預測競賽上,DeepMind推出的AlphaFold系統的總體中位數得分達到92.4GDT,擊敗了其餘的參會選手。AlphaFold是一種能夠基於蛋白質的基因序列,利用AI預測蛋白質3D結構的系統。
  • AI數小時內解決困擾生物學50年的高精度蛋白質摺疊預測問題
    據《紐約時報》報導,這家與谷歌同屬一家母公司的公司DeepMind創造了一個人工智慧系統,它可以快速準確地預測蛋白質如何摺疊以獲得其3D形狀,這是一個令人驚訝的複雜問題,幾十年來一直困擾著研究人員。但事實證明,解決這個 "蛋白質摺疊問題 "具有巨大的挑戰性,因為根據DeepMind公司的聲明,理論上同一蛋白質有很多方式可以摺疊成3D結構,令人匪夷所思。
  • DeepMind破解蛋白質摺疊難題引爭議 正準備論文回應
    團隊宣布在蛋白質結構問題上取得重大進展,其第二代「阿爾法摺疊」(AlphaFold)方法精準預測蛋白質的三維結構,摘得國際蛋白質結構預測競賽(CASP)冠軍。   眾所周知,在人體內有成千上萬種不同的蛋白質,而蛋白質的作用很大程度上取決於其獨特的3D結構。弄清楚蛋白質摺疊成什麼形狀被稱為「蛋白質摺疊問題」。這在過去的50年中,一直是生物學的重大挑戰。   此間,生物學家主要利用X射線晶體學或冷凍電鏡(cryo-EM)等實驗技術來破譯蛋白質的三維結構。
  • 谷歌Deepmind稱解決蛋白質摺疊難題 或加速藥物研發
    ,從而解決了過去50年的一項「重大挑戰」。每個活細胞體內都有成千上萬種不同的蛋白質,這些蛋白質也是細胞生存的基礎。預測蛋白質如何摺疊非常重要,因為這決定了蛋白質的性質。幾乎所有疾病,包括癌症和老年痴呆症,都與蛋白質的功能有關。歐洲生物信息學研究所的珍妮特·桑頓(Dame Janet Thornton)教授表示:「蛋白質是最美麗的結構。準確預測蛋白質的摺疊非常具有挑戰性,多年來一直困擾著很多人。」
  • DeepMind破解蛋白質摺疊難題引爭議,正準備論文回應
    當地時間11月30日,英國DeepMind團隊宣布在蛋白質結構問題上取得重大進展,其第二代「阿爾法摺疊」(AlphaFold)方法精準預測蛋白質的三維結構,摘得國際蛋白質結構預測競賽(CASP)冠軍。這一進展被輿論視為繼AlphaGo以3:0戰勝世界圍棋冠軍後,人工智慧的再度發威。
  • DeepMind:通過摺疊蛋白質的AI,解決了50年的「巨大挑戰」
    這一人工智慧軟體可以在幾天之內準確預測蛋白質將摺疊的結構,從而解決了已有50年歷史的「巨大挑戰」,可以為更好地理解鋪平道路疾病和藥物發現。每個活細胞內部都有成千上萬種不同的蛋白質,這些蛋白質可以使它們保持健康。預測蛋白質摺疊的形狀非常重要,因為它決定了蛋白質的功能,幾乎所有疾病(包括癌症和痴呆症)都與蛋白質的功能有關。
  • AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
    DeepMind 開放的新冠病毒蛋白質結構預測結果下載連結:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip為什麼要用深度學習預測新冠病毒蛋白結構?
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    「我們的目標從來就不是贏得圍棋或雅達利比賽的勝利,而是開發能夠解決蛋白質摺疊這類問題的算法,」Hassabis 表示。AlphaFold 在預測蛋白質結構的物理性質上達到了高度的準確性,然後基於這些預測可以使用兩種不同的方法預測構建完整的蛋白質結構。
  • 解決生物學50年來重大挑戰 生物界"AlphaGo"精準預測蛋白質結構
    差得越少,得分越高。 GDT的分值在0-100之間。2006-2016年間,這個數字最高在40左右。2018年,上一代的 AlphaFold得分一下子突破了50。而這次的新一代 AlphaFold,在蛋白結構預測大賽裡的中位得分超過了92.4。
  • DeepMind 模型實現蛋白質3D結構預測
    此外AlphaFold還包括了一個神經網絡來預測蛋白質中每對殘基之間的距離分布,然後將這些概率合併成一個分數,該分數可估計擬議蛋白質結構的準確性,並利用梯度下降的方式來優化得分。>AlphaFold模型在CASP比賽中平均得分為92.5(滿分100)超過當前實驗方法的90分。