DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!

2020-12-08 騰訊網

在過去的幾年裡,DeepMind公司開發的人工智慧AlphaGo已經在西洋棋和圍棋比賽中取得了超越人類的表現。而如今,DeepMind又向推動和加速新科學發現上邁出了重要的一步。前幾天,DeepMind宣布推出全新的AlphaFold系統,能夠預測並生成蛋白質的3D結構。這一系統在周日進行的國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手。

我們都知道,蛋白質是維持我們生命所必需的龐大而複雜的物質。我們身體的幾乎所有功能,例如收縮肌肉、感知光線或將食物轉化成能量等,都需要一種或多種蛋白質來完成。而蛋白質具體能做什麼就要取決於它獨特的3D結構了。

然而,純粹從其基因序列中找出蛋白質的3D結構是一項非常具有挑戰性的複雜任務。由於我們的DNA通常只包含蛋白質中胺基酸殘基的序列信息,而這些胺基酸殘基形成的長鏈將會摺疊成錯綜複雜的3D結構。這就是所謂的「蛋白質摺疊」問題。而蛋白質越大,需要考慮的胺基酸之間相互作用就越多,對其結構的建模過程就會更加複雜和困難。

每一個蛋白質都擁有錯綜複雜的3D結構丨DeepMind blog

錯誤摺疊的蛋白質有可能引發阿茲海默病、帕金森病、亨廷頓舞蹈病和囊性纖維化等疾病的發生。因此,準確預測蛋白質的結構,對於理解其在人體內的作用,以及對上述疾病進行診斷和治療是非常重要的。

在過去的五十年中,科學家們已經能夠利用冷凍電子顯微鏡、核磁共振或X射線晶體學等實驗技術在實驗室中確定蛋白質的形狀,但每種方法都依賴於大量的試錯,這可能需要花上好幾年時間,而預測每個結構也要花費數萬美元。幸運的是,得益於基因測序成本的快速降低,基因組學領域的數據變得豐富。因此,科學家們開始利用AI技術開發深度學習算法,在基因組學數據的基礎上對蛋白質結構進行預測。在此基礎上,AlphaFold誕生了。和以往方法不一樣的是,AlphaFold並未使用已經明確結構的蛋白質3D模型作為模板,而是從頭開始探索預測方法。

DeepMind團隊使用的方法都以深度神經網絡為基礎,來從基因序列中預測蛋白質的兩種物理性質:胺基酸對之間的距離及連接這些胺基酸的化學鍵之間的角度。首先,研究小組訓練了一個深度神經網絡,來預測蛋白質中每對胺基酸殘基之間距離的分布情況。然後,研究人員將這些數值轉化為評分,來對蛋白質結構的精確程度進行評估。同時,研究人員還另外訓練了一個神經網絡,利用這些距離數值來評估預測結構與真實結構的接近程度。

AlphaFold的模型示意圖丨DeepMind blog

如果你以為這就是AlphaFold能做的全部事情,那可就大錯特錯了。事實上,DeepMind的研究人員在這些評分函數的基礎上,還使用了兩種全新的方式來優化蛋白質結構評分:他們使用了一個生成神經網絡,不斷生成新的蛋白質片段來反覆替換一段舊的蛋白質結構,這樣一來,蛋白質結構的評分就被不斷提高了。另外,研究人員還使用了一種名為梯度下降的方式來讓AlphaFold預測的結構變得高度精確。梯度下降是一種機器學習中常用的數學技術,用來實現漸進式的細微改進。研究人員將這項技術用於整個蛋白質鏈,而不是結構中組裝前必須分開摺疊的片段,降低了預測過程的複雜性

圖中綠色為蛋白質的真實結構,藍色為AlphaFold預測得出的結構丨DeepMind blog

AlphaFold的實際表現也非常強勁:在比賽中,AlphaFold在98名參賽者中名列榜首,預測了43種蛋白質中的25種最準確結構,而同一類別的第二名參賽隊伍只預測出了43種中的3種。

研究人員表示,AlphaFold的成功表明了機器學習系統能夠整合多種信息來源,從而幫助科學家們快速為複雜問題提出創造性的解決方案。他們在博客中寫道:「正如AI通過AlphaGo和AlphaZero這樣的系統,能夠幫助人們掌握複雜的遊戲一樣,我們同樣希望有一天,AI取得的突破也能幫助我們掌握基本的科學問題。」

研究人員還表示,這項研究能夠幫助科學家們更有效地設計出治療疾病的新方法,能夠在藥物發現的過程中開發出新的潛力,同時也降低了實驗相關的成本,有望改善全世界數百萬患者的生活質量。

參考資料:

[1] AlphaFold: Using AI for scientific discovery. Retrieved December 3, 2018, from https://deepmind.com/blog/alphafold/

[2] Google's DeepMind predicts 3D shapes of proteins. Retrieved December 3, 2018, from https://www.theguardian.com/science/2018/dec/02/google-deepminds-ai-program-alphafold-predicts-3d-shapes-of-proteins

相關焦點

  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    代碼:https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13模型:https://www.biorxiv.org/content/10.1101/846279v1.full.pdf根據DeepMind的介紹,在預測蛋白質結構的物理性質方面使用了兩種不同的方法來構建預測模型
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    「我們的目標從來就不是贏得圍棋或雅達利比賽的勝利,而是開發能夠解決蛋白質摺疊這類問題的算法,」Hassabis 表示。DeepMind 用 AlphaFold 參加了 CASP,這是一年兩次的蛋白質摺疊奧運會,吸引了來自世界各地的研究小組。比賽的目的是根據胺基酸列表來預測蛋白質的結構,這些胺基酸列表會在幾個月內每隔幾天發送給參賽團隊。這些蛋白質的結構最近已經通過費力又費錢的傳統方法破解,但還沒有公開。
  • 向李昌鈺學破案,這是Deepmind預測蛋白質結構的秘密研究方法嗎?
    可能在社會責任感的感召下,人工智慧公司想在人類急需前沿科技的領域創造一些有價值、有意義的事情,比如生命科學。眾所周知,全世界頂級的圍棋選手人工智慧阿法狗之父,Deepmind公司最近又因為在生命科學領域的成就,上了科技界的熱搜榜。這個小成就就是,新的算法AlphaFold 可以僅根據基因預測生成蛋白質的三維形狀。
  • DeepMind 模型實現蛋白質3D結構預測
    在11月30日舉行的兩年一次的CASP蛋白質結構預測挑戰賽中,DeepMind團隊開發的AlphaFold深度神經網絡模型脫穎而出,勝過其他100個團隊,在解決生物學最嚴峻的挑戰之一——從蛋白質的胺基酸
  • AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
    DeepMind 開放的新冠病毒蛋白質結構預測結果下載連結:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip為什麼要用深度學習預測新冠病毒蛋白結構?
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。根據DeepMind的AlphaFold程序創建的模型,說明與冠狀病毒相關的「膜蛋白」的可能結構在此,我就不詳細解讀這個最新科研成果
  • DeepMind破解蛋白質摺疊難題
    去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。傳統上,得到蛋白質的形狀需要花費數年的時間。從1950年代開始,使用X射線束照射結晶的蛋白質並將衍射光轉化為蛋白質原子坐標的技術,確定了蛋白質的第一個完整結構。X射線晶體學已經證明了蛋白質結構的絕大部分。但是,在過去的十年中,低溫電子顯微鏡已成為許多結構生物學實驗室的首選工具。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。△圖源:Science從1994年起,隨著技術的進步,蛋白質的預測準確性在不斷增加,而在今年,迎來了重大突破,預測準確性得分達到了92.4/100。而這,便是DeepMind的AlphaFold 2系統帶來的。
  • DeepMind劃時代傑作!AlphaFold蛋白結構預測擊敗人類奪冠
    通過跨學科方法,DeepMind匯集了來自結構生物學,物理學和機器學習領域的專家,以應用尖端技術,僅根據其基因序列預測蛋白質的3D結構。在獲悉這一划時代的技術性突破後,動脈網試圖通過以下邏輯,還原DeepMind再次戰勝人類模型的「裡程碑」事件,以及DeepMind在醫療領域所做的探索。
  • 深度學習之Google Deepmind的Alphago人工智慧算法技術演變歷程
    ,我覺得更多的是要考慮該算法在該類問題上如何去刻畫出人類的直覺、經驗判斷、邏輯推理等。最近大家比較關心的圍棋人機大戰(Alphago vs 李世石)中,deep mind基於Nature2016文章的Alphago在5局制的比賽中已經取得了4-1的獲勝。
  • DeepMind破解蛋白質摺疊難題
    DeepMind破解蛋白質摺疊難題,Nature:這可能改變一切剛剛,一個困擾生物學家50年的難題,被AI解決了。去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。
  • DeepMind破解蛋白質摺疊難題
    去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。今天,在有「蛋白質奧林匹克競賽」稱呼的國際蛋白質結構預測競賽(CASP)上,AlphaFold擊敗了其餘的參會選手,能夠精確地基於胺基酸序列,預測蛋白質的3D結構。
  • DeepMind抗疫:預測新冠病毒相關蛋白結構
    「在共享的蛋白質資料庫中,我們的系統準確地為SARS-CoV-2刺突蛋白提供了預測實驗,這使我們相信,我們對其他蛋白質的模型預測可能是有用的。」DeepMind在博客文章中寫道。DeepMind的底氣,來自於AlphaFold——這個2018年12月問世便驚呆科學家的系統,它主要功能是用人工智慧加速科學發現。
  • 谷歌DeepMind又在全球賽事中擊敗人類!AI成功預測蛋白質3D結構
    CASP 也被認為是蛋白質結構領域「奧林匹克競賽」。 「蛋白質摺疊」是一種令人難以置信的分子摺紙形式,它非常神秘,是一個具有深遠意義的問題,在科學界之外很少有人討論。所有生物都是由蛋白質構成的,蛋白質的結構決定了它的功能。當 AI 了解了蛋白質的摺疊方式,我們可以期待人類進入科學和醫學的新時代。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智慧技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題。  最新一代算法 Alphafold 2,現在已經擁有了預測蛋白質 3D 摺疊形狀的能力,這一複雜的過程對於人們理解生命形成的機制至關重要。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...
    >DeepMind的AlphaFold系統在蛋白質結構預測中達到了無與倫比的準確性。該圖代表了AlphaFold系統的神經網絡模型體系結構。該模型對蛋白質序列和胺基酸殘基進行操作——在兩種表示之間傳遞迭代信息以生成結構。
  • 谷歌DeepMind 開發新 AI 工具:利用基因序列預測蛋白質結構
    北京時間12月4日早間消息,據美國《麻省理工科技評論》(MIT Technology Review)報導,谷歌旗下DeepMind開發一個新AI工具,它可以利用基因序列預測蛋白質結構。
  • DeepMind精準預測蛋白質結構
    每兩年,CASP都會以實驗室最新研究出的蛋白質結構為目標,開展一次蛋白質結構預測比賽。各參賽團隊在不知道該目標蛋白質的情況下,以功能需求為導向,設計該蛋白質結構,CASP會將各團隊的預測結果與目標蛋白質的真實實驗數據相比對,進行評分。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    AlphaFold:精確度高達92.4GDT首先要了解為什麼要預測蛋白質摺疊結構?眾多周知,蛋白質對於生命至關重要。幾乎所有疾病,包括癌症、痴呆症都與蛋白質的功能有關。而蛋白質的功能由它的3D結構決定。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    首先要了解為什麼要預測蛋白質摺疊結構?眾多周知,蛋白質對於生命至關重要。幾乎所有疾病,包括癌症、痴呆症都與蛋白質的功能有關。而蛋白質的功能由它的3D結構決定。該圖代表了AlphaFold系統的神經網絡模型體系結構。該模型對蛋白質序列和胺基酸殘基進行操作——在兩種表示之間傳遞迭代信息以生成結構。這一過程對於理解蛋白質內部的物理相互作用以及它們的進化史很重要。