生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...

2020-12-03 澎湃新聞

鄭集楊 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。

啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。

11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。

這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。

而過去十幾年,其他方法只能在40分左右徘徊。

△圖源:Deepmind

兩年前,上一版本的AlphaFold便已經取得了裡程碑的突破,但是,仍然沒有完全解決蛋白質摺疊問題。而這次AlphaFold 2,則更進一步。

這一巨大的突破,直接引爆了全網,Nature、Science紛紛報導,生物屆和AI大牛們也紛紛祝賀。

甚至很少露面的DeepMind創始人哈薩比斯,也親自出面介紹:

DeepMind背後的終極願景一直是構建通用人工智慧,利用通用人工智慧來極大地加速科學發現的步伐,幫助我們更好地了解周圍世界。

而哥大生物學助理教授Mohammed AlQuraishi,更是評價道:

蛋白質結構AI進入「ImageNet時代」。

如此重大的突破,究竟帶來了什麼呢?讓我們來快速且全面地了解一下。

CASP中斬獲92.4的均分

就在11月30日,第14次CASP評估的評價結果公布了。

CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。

△圖源:Science

從1994年起,隨著技術的進步,蛋白質的預測準確性在不斷增加,而在今年,迎來了重大突破,預測準確性得分達到了92.4/100。

而這,便是DeepMind的AlphaFold 2系統帶來的。

AlphaFold 2在所有目標上測試結果:GDT的平均得分為92.4,中位數得分也達到了87.0,這比第二名高出了25分。

GDT(Global Distance Test),是用來衡量預測準確性的主要指標。

簡單來說,GDT就是:預測結果對於正確位置,在距離上的一個綜合評分。

能斬獲92.4的準確性高分,這說明,預測的結果,誤差基本不超過一個原子的大小。

這無疑是巨大的突破。

對此,CASP發起人,計算生物學家約翰·莫爾特(John Moult)表示:

從某種意義上說,蛋白質摺疊的問題已經解決了。

端到端的訓練

如此強大的AlphaFold 2系統,不免讓人好奇,它是如何訓練出來的呢?

首先,研究人員把摺疊的蛋白質認為是一個「空間圖」,其中殘基是節點,邊緣連接著非常接近的殘基。

之後,建立了一個基於注意力機制的神經網絡系統,端到端進行了訓練。

建立的這個系統會試圖解釋這個圖的結構,同時對它正在構建的隱式圖進行推理。

在這個推理過程,還會用到生物學中已知的信息進行完善,如:進化中的同源序列,多序列比對(MSA)和胺基酸殘基對等。

通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。

此外,AlphaFold還使用了內部置信度度量指標來判斷蛋白質結構中哪些部分是可靠的。

之後,研究人員在公開的數據上訓練了這個系統,這些資料庫包括大約170000個蛋白質結構,其中便有許多未知結構的蛋白質序列。

這個訓練過程花費了幾周的時間,使用了大約128個TPUv3內核(大約相當於100-200個GPU)。

實驗證明AlphaFold確實靠譜

不過,所謂技術突破,都總會引來一些質疑。

連組織者都擔心:DeepMind可能一直在以某種方式作弊。

因此,德國馬克斯·普朗克發育生物學研究所蛋白質進化學系主任安德烈·盧帕斯(Andrei Lupas)提出了一個特殊的挑戰:預測一種來自古細菌群中古細菌物種的膜蛋白。

十年來,科學家雖然獲取了這個蛋白質的X射線晶體結構,但是一直無法解釋它。

而AlphaFold 2,輸出了一個三部分構成的蛋白質詳細圖像,中間有兩個長長的螺旋臂。

而該模型,使盧帕斯和他的同事能夠理解他們的X射線數據。

之後,科學家用了半小時進行驗證,發現:實驗結果完全符合AlphaFold的預測結構。

盧帕斯驚呼:「這幾乎是完美的。」

他們不可能這麼作弊,我不知道他們是怎麼做到的。

AlphaFold 2憑事實,告訴大家:這個進展確實真實而且靠譜的。

解決50年的挑戰

克裡斯蒂安·安芬森在1972年諾貝爾化學獎的獲獎感言中,提出了一個著名的假設,即理論上,蛋白質的胺基酸序列應該完全決定其結構。

正是由於這一假設,引發了50年的探索,即能夠僅基於1D胺基酸序列通過計算預測蛋白質的3D結構。

然而,一個主要的挑戰是,一種蛋白質在進入最終的3D結構之前,理論上可以摺疊的方式數量是天文數字。

1969年,Cyrus Levinthal指出,通過蠻力計算來列舉一種典型蛋白質的所有可能構型需要比已知宇宙的年齡更長的時間——Levin thal估計了一種典型蛋白質的10^300種可能構象。

要知道,AlphaGo面對的圍棋問題複雜度也就是10^171,蛋白質摺疊問題比圍棋複雜度高出129個數量級!

DeepMind的研究人員對此說道:DeepMind方法將產生深遠的影響,其中包括極大地加快新藥的開發速度。

馬裡蘭大學的結構生物學家Shady Grove則表示:

這是一個已有50年歷史的問題,我從沒想過一輩子中能看到這個。

參考連結:

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

https://www.nytimes.com/2020/11/30/technology/deepmind-ai-protein-folding.html

https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures

— 完 —

本文系網易新聞•網易號特色內容激勵計劃籤約帳號【量子位】原創內容,未經帳號授權,禁止隨意轉載。

原標題:《生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確性達92.4》

閱讀原文

相關焦點

  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。因此,從1972年至今,如何準確預測蛋白質的摺疊方式一直是生物學界的一項重大挑戰。然而,困擾生物學界50年的重大挑戰昨日被DeepMind的成功攻克。該公司的最新AlphaFold系統,在第14次CASP評估中的總體中位數得分達到了92.4GDT。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。但一個現實挑戰是,蛋白質的3D結構在形成之前會有數以億計的摺疊方式。美國分子生物學家Cyrus Levinthal指出,如果用蠻力來計算蛋白質所有可能的構型所需要的時間可能比宇宙的時間都要長,一個典型的蛋白質可能有10∧300種可能的構型。因此,從1972年至今,如何準確預測蛋白質的摺疊方式一直是生物學界的一項重大挑戰。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。但一個現實挑戰是,蛋白質的3D結構在形成之前會有數以億計的摺疊方式。美國分子生物學家Cyrus Levinthal指出,如果用蠻力來計算蛋白質所有可能的構型所需要的時間可能比宇宙的時間都要長,一個典型的蛋白質可能有10∧300種可能的構型。因此,從1972年至今,如何準確預測蛋白質的摺疊方式一直是生物學界的一項重大挑戰。
  • 50年難遇諾獎級裡程碑!DeepMind破解蛋白質摺疊難題
    公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!剛剛,一個困擾生物學家50年的難題,被AI解決了。去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    蛋白質存在於我們世界中的所有有機物體及奧妙人體中,全新的AlphaFold 算法揭秘了生物學界50年來試圖破解蛋白質分子摺疊的難題,這項AI帶來的重大突破,將幫助科學家弄清某些困擾人們的疾病機制、加速找出新型流行病的具體原因(比如今年的全球新冠大流行),促進新藥設計、幫助農業增產、解析可有效降解廢棄物的嶄新成分、甚至探索為大氣減碳的全新解決方案。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    DeepMind破解蛋白質摺疊難題,Nature:這可能改變一切剛剛,一個困擾生物學家50年的難題,被AI解決了。去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    【新智元導讀】近日,DeepMind在預測蛋白質結構方面邁出了一大步!公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!DeepMind這一歷史性進展有助於加快藥物發現速度,對理解人類生命形成機制至關重要。剛剛,一個困擾生物學家50年的難題,被AI解決了。
  • DeepMind AI 人工智慧破解困擾科學家 50 年的蛋白質摺疊結構難題
    DeepMind AI 人工智慧破解困擾科學家 50 年的蛋白質摺疊結構難題過去推動的Folding@home計劃,就是希望透過使用者貢獻空閒運算效能,透過連網協作方式組成龐大運算資源,藉此研究蛋白質摺疊結構,就連NVIDIA過去也曾藉由GPU
  • AI解決生物學50年來重大難題:破解蛋白質摺疊,顛覆結構生物學
    蛋白質對於生命至關重要,它們是由胺基酸鏈組成的大型複雜分子,其作用取決於自身獨特的 3D 結構。弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。
  • 向李昌鈺學破案,這是Deepmind預測蛋白質結構的秘密研究方法嗎?
    眾所周知,全世界頂級的圍棋選手人工智慧阿法狗之父,Deepmind公司最近又因為在生命科學領域的成就,上了科技界的熱搜榜。這個小成就就是,新的算法AlphaFold 可以僅根據基因預測生成蛋白質的三維形狀。可惜,公司並沒有公布這個算法的論文。我們就這樣放棄嘛?
  • DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分
    原來是結構生物學,迎來了一個「革命性」的突破。CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。
  • 解決生物學50年來重大挑戰 生物界"AlphaGo"精準預測蛋白質結構
    評估蛋白結構預測準確度的指標叫做GDT,也就是評估預測結構裡的胺基酸位置,和實際的胺基酸位置差多少。差得越少,得分越高。 GDT的分值在0-100之間。2006-2016年間,這個數字最高在40左右。2018年,上一代的 AlphaFold得分一下子突破了50。
  • AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
    DeepMind 開放的新冠病毒蛋白質結構預測結果下載連結:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip為什麼要用深度學習預測新冠病毒蛋白結構?
  • 解決生物學50年來重大挑戰!人工智慧預測蛋白結構能力堪比實驗室水平
    」馬克斯-普朗克發育生物學研究所的進化生物學家Andrei Lupas說[2]。「我之前認為這個問題在我有生之年不會得到解決。」歐洲分子生物學實驗室的結構生物學家Janet Thornton說[3]。「它的發生比該領域的許多人預測的要早幾十年。
  • DeepMind的蛋白質摺疊AI解決了50年來的生物學重大挑戰
    編·譯作者 | 王建民科學家們表示,谷歌用於預測蛋白質3D形狀的深度學習計劃有望改變生物學。前言蛋白質是生命的基石,負責細胞內發生的大部分事情。蛋白質的工作方式和功能由其三維形狀決定-"結構即功能 "是分子生物學的公理。幾十年來,實驗室實驗一直是獲得良好蛋白質結構的主要途徑。
  • 「它將改變一切」,DeepMind AI解決生物學50年來重大挑戰,破解蛋白...
    蛋白質對於生命至關重要,它們是由胺基酸鏈組成的大型複雜分子,其作用取決於自身獨特的 3D 結構。弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    正因為蛋白質的結構如此重要,在過去的五十年中,科學家已經能使用低溫電子顯微鏡和核磁共振等實驗技術確定蛋白質的形狀,但是每一種方法都依賴大量的試驗與誤差反饋,每種結構可能需要花費數萬美元、歷時數年進行研究。因此生物學家轉攻 AI 方法,以完成這一困難且單調的過程。
  • AI數小時內解決困擾生物學50年的高精度蛋白質摺疊預測問題
    據《紐約時報》報導,這家與谷歌同屬一家母公司的公司DeepMind創造了一個人工智慧系統,它可以快速準確地預測蛋白質如何摺疊以獲得其3D形狀,這是一個令人驚訝的複雜問題,幾十年來一直困擾著研究人員。摸清蛋白質的結構可能需要數年甚至數十年的艱苦實驗,而目前的計算機模擬蛋白質摺疊的準確度還不夠。但據《泰晤士報》報導,DeepMind的系統,即AlphaFold,只需要幾個小時就能準確預測出蛋白質的結構。蛋白質是生命所必需的大分子。
  • 生物學50年的難題:被解決了
    CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。此外,AlphaFold還使用了內部置信度度量指標來判斷蛋白質結構中哪些部分是可靠的。之後,研究人員在公開的數據上訓練了這個系統,這些資料庫包括大約170000個蛋白質結構,其中便有許多未知結構的蛋白質序列。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    在過去的幾年裡,DeepMind公司開發的人工智慧AlphaGo已經在西洋棋和圍棋比賽中取得了超越人類的表現。而如今,DeepMind又向推動和加速新科學發現上邁出了重要的一步。前幾天,DeepMind宣布推出全新的AlphaFold系統,能夠預測並生成蛋白質的3D結構。