震驚科學界!DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...

2020-12-02 雷鋒網

AI在生物科學領域再次取得重大突破!

美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。

而攻克這一難題的正是其2018年一經推出便震驚科學界的AI系統——AlphaFold。

DeepMind在官方博客中稱:AlphaFold的最新版本,在通過胺基酸序列精確預測蛋白質摺疊結構方面,已經獲得權威蛋白質結構預測評估機構(Critical Assessment of protein Structure Prediction,CASP)的認可。

此消息一出,立刻登上了Nature雜誌封面,標題直接評論為:「它將改變一切!」。

同一時間,谷歌CEO兼執行長桑達爾·皮查伊 (Sundar Pichai)、斯坦福教授李飛飛、馬斯克等眾多科技大佬也在第一時間轉推祝賀!

那麼這場驚動科技圈、生物學界和科學界的重大突破,到底是一項怎樣的研究?

AlphaFold:精確度高達92.4GDT

首先要了解為什麼要預測蛋白質摺疊結構?

眾多周知,蛋白質對於生命至關重要。幾乎所有疾病,包括癌症、痴呆症都與蛋白質的功能有關。而蛋白質的功能由它的3D結構決定。

1972年諾貝爾化學獎得主克裡斯蒂安·安芬森(Christian Anfinsen)曾提出,基於蛋白質的1D胺基酸序列可計算並預測蛋白質的3D結構。

但一個現實挑戰是,蛋白質的3D結構在形成之前會有數以億計的摺疊方式。

美國分子生物學家Cyrus Levinthal指出,如果用蠻力來計算蛋白質所有可能的構型所需要的時間可能比宇宙的時間都要長,一個典型的蛋白質可能有10300種可能的構型。

因此,從1972年至今,如何準確預測蛋白質的摺疊方式一直是生物學界的一項重大挑戰。

然而,困擾生物學界50年的重大挑戰昨日被DeepMind的成功攻克。該公司的最新AlphaFold系統,在第14次CASP評估中的總體中位數得分達到了92.4GDT。

這意味著AlphaFold預測的平均誤差(RMSD)僅為1.6 埃(1埃等於0.1nm),相當於一個原子的寬度。

更重要的是,即使對於最具挑戰性的蛋白質——自由建模類蛋白質 ,AlphaFold的中值得分也達到87.0 GDT

CASP中自由建模類預測精度值不斷提高(GDT)

自由建模類蛋白質靶標的兩個示例

對此,CASP主席John Moult教授在新聞發布會上說,

DeepMind的AlphaFold系統在蛋白質結構預測中達到了無與倫比的準確性。50年來,計算機科學領域的巨大挑戰已得到很大程度的解決。

需要說明的是,CASP是評估蛋白質結構預測技術全球範圍內最權威的機構。它由John Moult和Krzysztof Fidelis兩位教授創立於1994年,每兩年進行一次盲審。其中,GDT(Global Distance Test ) 是CASP 用來測量預測準確性的主要指標,其範圍是從0-100。

簡單地說,GDT 可以大致地被認為是胺基酸殘基在閾值距離內與正確位置的百分比,90分左右的 GDT 可以被認為是與實驗方法得到的結果相競爭的。

對此,CALICO創始人兼執行長亞瑟·D·萊文森高度評價稱:

AlphaFold是上一代產品中的佼佼者,它以驚人的速度和精度預測蛋白質結構。這一飛躍證明了計算方法將轉變生物學研究,並為加速藥物發現過程具有廣闊的前景。

AlphaFold背後的AI機制

摺疊的蛋白質可以看作是一個「空間圖形」,其中殘基是節點和邊緊密連接在一起。


該圖代表了AlphaFold系統的神經網絡模型體系結構。該模型對蛋白質序列和胺基酸殘基進行操作——在兩種表示之間傳遞迭代信息以生成結構。

這一過程對於理解蛋白質內部的物理相互作用以及它們的進化史很重要。

對於AlphaFold的最新版本,研究人員創建了一個基於注意力機制的神經網絡系統,經過端到端的訓練來試圖解釋這個圖的結構,同時對它所構建的隱式圖進行推理。它通過使用多重序列對齊 (MSA) 和胺基酸殘基對的表示來精化這個圖形結構。

通過迭代這個過程,系統可以對蛋白質的基本物理結構做出準確的預測,並能夠在幾天的時間內確定高度精確的結構。此外,AlphaFold 還可以使用內部置信度來預測每個預測的蛋白質結構的哪些部分是可靠的。

AlphaFold系統所使用的數據,來自包括約170,000個蛋白質結構,以及未知結構的蛋白質序列的大型資料庫。在訓練時,它使用了大約128個 TPU v3內核 (大致相當於100-200個GPU) ,並僅運行了數周。這在當今機器學習中使用的大多數最先進的大型模型的上下文中是相對較小的計算量。

第二代AlphaFold

DeepMind聯合創始人兼首席,執行官Demis Hassabis表示:「 DeepMind的最終願景一直是構建通用AI,以此加快科學發現的步伐,幫助我們更好地了解周圍的世界」。

此次,AlphaFold系統攻克50年來的重大難題,意味著DeepMind又朝這一願景邁出了堅實的一步。

2018年,AlphaFold首次推出便一鳴驚人。在當時參加的「蛋白質結構預測奧運會」CASP比賽中,AlphaFold在所有參賽者中達到了最高的精確度,而且是第二名的8倍之多。

經過兩年的努力,DeepMind基於新的深度學習結構體系更新了AlphaFold,再次刷新了自己的記錄——從不足60GDT一躍上升為92.4GDT。

而與其他同類AI相比,AlphaFold的準確率也同樣遙遙領先。

DeepMind開發團隊表示,AlphaFold之能夠達到前所未有的精確度,其研究方法是受到了來自生物學、物理學和機器學習領域的啟發,另外過去半個多世紀有關蛋白質摺疊的研究成果野發揮了重要作用。

作為科學界的AI工具,AlphaFold的應用場景和價值已經得以顯現。

在今年疫情不斷蔓延下,DeepMind研究人員利用AlphaFold預測了冠狀病毒SARS-CoV-2的幾種蛋白質結構,包括ORF3a、ORF8等。

儘管這點蛋白結構具有挑戰性且相關序列很少,但與實驗確定的結構相比,AlphaFold在兩個預測中均獲得了很高的準確性。

除了加深對已知疾病的了解之外,AlphaFold的應用潛力還將擴展到未知的生物學領域。

由於DNA指定了構成蛋白質結構的胺基酸序列,研究人員從自然界大規模讀取蛋白質序列,可能要在數以億計的通用蛋白質資料庫(UniProt)中進行計數。更重要的是,該蛋白質資料庫可能只有約170000存在3D結構。

而AlphaFold這樣的AI技術可以幫助研究人員發現尚未確定的蛋白質。

引用連結:

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

https://www.cnbc.com/2020/11/30/deepmind-solves-protein-folding-grand-challenge-with-alphafold-ai.html

https://www.nature.com/articles/d41586-020-03348-4

雷鋒網雷鋒網(公眾號:雷鋒網)雷鋒網

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 震驚科學界!DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。而攻克這一難題的正是其2018年一經推出便震驚科學界的AI系統——AlphaFold。
  • 震驚科學界!DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。而攻克這一難題的正是其2018年一經推出便震驚科學界的AI系統——AlphaFold。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    【新智元導讀】近日,DeepMind在預測蛋白質結構方面邁出了一大步!公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!DeepMind這一歷史性進展有助於加快藥物發現速度,對理解人類生命形成機制至關重要。剛剛,一個困擾生物學家50年的難題,被AI解決了。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    每經記者:蔡鼎 每經編輯:杜宇每經AI快訊,美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。而攻克這一難題的正是其2018年一經推出便震驚科學界的AI系統——AlphaFold。
  • 50年難遇諾獎級裡程碑!DeepMind破解蛋白質摺疊難題
    公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!蛋白質摺疊50年來重大突破,AI破解預測難題蛋白質的形狀與其功能密切相關,預測蛋白質結構的能力可以幫助我們更好地理解蛋白質的功能和工作原理。世界上許多重大的挑戰,比如發展疾病的治療方法或者找到分解工業廢物的酶,從根本上來說都與蛋白質及其所扮演的角色有關。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    蛋白質存在於我們世界中的所有有機物體及奧妙人體中,全新的AlphaFold 算法揭秘了生物學界50年來試圖破解蛋白質分子摺疊的難題,這項AI帶來的重大突破,將幫助科學家弄清某些困擾人們的疾病機制、加速找出新型流行病的具體原因(比如今年的全球新冠大流行),促進新藥設計、幫助農業增產、解析可有效降解廢棄物的嶄新成分、甚至探索為大氣減碳的全新解決方案。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    鄭集楊 發自 凹非寺量子位 報導 | 公眾號 QbitAI一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    DeepMind破解蛋白質摺疊難題,Nature:這可能改變一切剛剛,一個困擾生物學家50年的難題,被AI解決了。去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。
  • AI破解蛋白質摺疊難題,施一公等結構學家未來的創新點將在哪裡?
    從人類基因組計劃開始,人類相信只要獲得了人類基因的「樂譜」,就能按圖索驥,解釋生命生理過程中的諸多機制。但從基因轉錄、翻譯再到胺基酸序列之後,科研界就似乎進入了一個極為狹窄的胡同,因為他們遇到了蛋白摺疊。
  • AI解決生物學50年來重大難題:破解蛋白質摺疊,顛覆結構生物學
    11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智慧技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題。最新一代算法 Alphafold 2,現在已經擁有了預測蛋白質 3D 摺疊形狀的能力,這一複雜的過程對於人們理解生命形成的機制至關重要。
  • DeepMind AI 人工智慧破解困擾科學家 50 年的蛋白質摺疊結構難題
    DeepMind AI 人工智慧破解困擾科學家 50 年的蛋白質摺疊結構難題過去推動的Folding@home計劃,就是希望透過使用者貢獻空閒運算效能,透過連網協作方式組成龐大運算資源,藉此研究蛋白質摺疊結構,就連NVIDIA過去也曾藉由GPU
  • DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分
    原來是結構生物學,迎來了一個「革命性」的突破。首先,研究人員把摺疊的蛋白質認為是一個「空間圖」,其中殘基是節點,邊緣連接著非常接近的殘基。盧帕斯驚呼:「這幾乎是完美的。」正是由於這一假設,引發了50年的探索,即能夠僅基於1D胺基酸序列通過計算預測蛋白質的3D結構。
  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    AI 破解了。11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智慧技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    「蛋白質摺疊」是一種令人難以置信的分子摺疊形式,科學界以外很少有人討論,但卻是一個非常重要的問題。生物由蛋白質構成,生物體功能由蛋白質形狀決定。理解蛋白質的摺疊方式可以幫助研究人員走進科學和醫學研究的新紀元。
  • 「它將改變一切」,DeepMind AI解決生物學50年來重大挑戰,破解蛋白...
    11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智慧技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題。最新一代算法 Alphafold 2,現在已經擁有了預測蛋白質 3D 摺疊形狀的能力,這一複雜的過程對於人們理解生命形成的機制至關重要。
  • 50年都未解開的蛋白質摺疊難題被AI破解了
    這就是著名的蛋白質摺疊結構預測。沒想到,這個假設竟成為了生物學界近50年來一個重大難題。要解決這個難題最大的挑戰在於:在自然界,蛋白質摺疊的方式實在太多了,據估算,一個典型的蛋白質有10300次方種可能的構型,它們可以自個兒把自個兒扭成一幅六親不認的樣子,即便是物理規則來了也要流淚,因為有些形狀實在難以想像。
  • AI破解困擾了50年的難題,這可能改變一切
    公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!DeepMind這一歷史性進展有助於加快藥物發現速度,對理解人類生命形成機制至關重要。 剛剛,一個困擾生物學家50年的難題,被AI解決了。
  • DeepMind破解蛋白質摺疊難題引爭議 正準備論文回應
    原標題:DeepMind破解蛋白質摺疊難題引爭議,正準備論文回應   當地時間11月30日,英國DeepMind
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。比起這個成果,相信大家跟我一樣更感興趣的是,這個DeepMind究竟是個什麼神奇公司,可以破解50年來無人能破的世界級計算難題?為創建超人類AI而生,讓馬斯克極度關注DeepMind跟傳奇的谷歌X實驗室不同,它並非谷歌親身,而是最初於2010年在英國成立的一家AGI(通用人工智慧)公司。
  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    生物學界最大的謎團之一,蛋白質摺疊問題被 AI 破解了。11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智慧技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題。最新一代算法 Alphafold 2,現在已經擁有了預測蛋白質 3D 摺疊形狀的能力,這一複雜的過程對於人們理解生命形成的機制至關重要。