生物版AlphaGo發威!DeepMind抗疫:預測新冠病毒相關蛋白結構

2020-12-06 量子位

乾明 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

疫情全球化蔓延之下,世界最頂級的AI研究機構加入抗疫陣列。

DeepMind利用其最新版本的AlphaFold系統,發現幾種與新冠病毒(SARS-CoV-2)相關的蛋白質的結構預測,並在今天對所有人公開。

他們表示,這些蛋白質結構還尚未被專家研究,希望能夠對抗疫科研作出貢獻。

「在共享的蛋白質資料庫中,我們的系統準確地為SARS-CoV-2刺突蛋白提供了預測實驗,這使我們相信,我們對其他蛋白質的模型預測可能是有用的。」DeepMind在博客文章中寫道。

DeepMind的底氣,來自於AlphaFold——這個2018年12月問世便驚呆科學家的系統,它主要功能是用人工智慧加速科學發現。

在2018年的「蛋白質結構預測奧運會」CASP比賽中,力壓其他97個參賽者,是第二名成績的8倍還要多。

所以在華盛頓大學利用蛋白質遊戲Foldit,集眾智對抗新冠病毒之後,不少人紛紛發問:為什麼AlphaFold沒有出現?

現在,它來了。

DeepMind出手,用AlphaFold抗疫

「我們感激許多其他實驗室的工作,如果沒有全球各地的研究人員的努力,這項工作是不可能的,」DeepMind表示。

正是在全球各地,尤其是中國公開新冠病毒研究資料的情況下,他們才能夠得以發現如此成果。

AlphaFold問世以來,DeepMind一直在優化系統,希望其能夠更加強大。對SARS-CoV-2相關蛋白結構預測,是他們最新研究成果的體現。

他們的模型中,還包括每個殘差的置信度,來幫助指出結構的哪些部分更有可能是正確的。

但DeepMind也補充道,只提供了缺乏合適模板或模板建模困難的蛋白質的預測,這些未被科學家研究的蛋白質,可能不是當前的焦點,但可能有助於研究人員理解SARS-CoV-2。

通常情況下,了解一種蛋白質的結構,能為理解它的功能提供重要的資源,但要確定這種結構,可能需要幾個月甚至更長時間的實驗。

現在,DeepMind已經將他們的蛋白結構預測放到了網絡上,供全球各地研究人員免費下載(連結在文末)。

DeepMind為什麼能夠這麼快?背後的力量來自於AlphaFold。

AlphaFold如何實現加速度?

與傳統預測蛋白質3D結構的方法不同,AlphaFold僅僅基於蛋白質的基因序列,就能預測蛋白質的3D結構。

這是一個非常複雜任務。

基因序列中只包含蛋白質組成部分胺基酸殘基的序列信息,這些胺基酸殘基會形成長鏈。預測這些長鏈如何摺疊成複雜的3D結構,被稱為「蛋白質摺疊問題」(protein folding problem)。

蛋白質越大,胺基酸之間的相互作用越多,建模也就更複雜,困難度也會成倍上升。

正如利文索爾佯謬(Levinthal’s paradox)中指出的那樣,在找到一個蛋白質正確的3D結構之前,要列舉一個典型的蛋白質所有可能的構型,需要的時間比宇宙存在的時間還要長。

DeepMind引入神經網絡來解決這些問題。

首先,他們訓練了一個神經網絡,用來預測蛋白質中每對殘基之間的距離分布。然後,將這些概率組合成一個分數,用來估計一個蛋白質結構的準確度。

此外,DeepMind還訓練了一個單獨的神經網絡,基於所有距離的總和,來評估初步給出的蛋白質結構與正確答案的接近程度,並基於這些評分函數,去找到符合預測的結構。

神經網絡模型的加持,以及龐大的算力驅動,AlphaFold不僅用時更短,而且結果比以前的任何模型都要精確,2018年亮相之後一舉引發全球關注。

從那時到現在,DeepMind一直在投入資源優化AlphaFold。

現在疫情全球化肆虐,各大科技巨頭紛紛捲入其中,沒有誰能夠獨善其身,也是時候貢獻力量共同抗疫了。

而且,這同樣是對他們技術的一次驗證:實驗中效果很強,但實際中怎麼樣呢?

該出來遛遛了~

DeepMind新冠病毒相關蛋白結構預測下載地址:

https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip

相關焦點

  • AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
    在昨天發表的博客文章中,DeepMind 表示,他們用 AlohaFold 生成了六種可能與新冠病毒有關的蛋白質結構預測結果,而且已經開放下載。這一結果可能對新冠病毒疫苗研發等工作起到推動作用。DeepMind 開放的新冠病毒蛋白質結構預測結果下載連結:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip為什麼要用深度學習預測新冠病毒蛋白結構?
  • 預測新冠病毒「蛋白質摺疊」重磅武器:AlphaFold!精度碾壓生物與...
    DeepMind:COVID-19相關蛋白結構的計算預測「人類對冠狀病毒的研究已經有幾十年的歷史,所以利用以往的資料庫對COVID-19疫情能做出較快的反應,短短幾天就研究出了新病毒的檢測方法。而此次COVID-19的罪魁禍首SARS-CoV-2病毒相關的蛋白質結構一直未能確定,傳統的方法可能需要幾個月甚至更長時間,這對我們理解病毒的功能和傳播機製造成了很大的障礙。鑑於傳統方法耗時過長,我們將新版的AlphaFold用於SARS-CoV-2相關的蛋白質結構預測,新系統可以在沒有類似蛋白質結構的前提下,得出精確預測。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。根據DeepMind的AlphaFold程序創建的模型,說明與冠狀病毒相關的「膜蛋白」的可能結構在此,我就不詳細解讀這個最新科研成果
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    2018年的11月2日,在第13屆全球蛋白質結構預測競賽(CASP)上,AlphaFold獲得了預測43種蛋白中的25種蛋白結構的最高分,在98名參賽者中排名第一。對於DeepMind的預測方法,由於當時沒有具體論文發布,眾多學者認為是計算能力突出使得AlphaFold獲得冠軍。
  • 生物界AlphaGo精準預測蛋白質結構
    今日,DeepMind宣布,其新一代AlphaFold人工智慧系統,在國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手,能夠精確地基於胺基酸序列,預測蛋白質的3D結構。其準確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學等實驗技術解析的3D結構相媲美。這一突破被多家媒體稱為「變革生物科學和生物醫學」的突破。
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    官網上對於工具的使用也有相關說明:如何使用這一工具?點擊棋盤上的彩色圓圈,或使用棋盤下方的導航工具,即可探索不同的開局變化,以及 AlphaGo 對於每一步棋的黑棋勝率預測。圓圈中的數字代表了該步棋的黑棋勝率。當輪到黑棋落子時,數值越接近 100 表示黑棋優勢越大;當輪到白棋落子時,數值越接近 0 表示白棋優勢越大。50 則表示均勢。
  • DeepMind破解蛋白質摺疊難題
    ,AlphaFold 對三分之二的蛋白靶點給出的預測結構與實驗手段獲得的結構相差無幾。,DeepMind 的方法可能特別有助於預測重要類別的蛋白質結構,如膜蛋白等。在冠狀病毒的結構中,像皇冠一樣的刺突稱為刺突糖蛋白(Spike Glycoprotein,以下簡稱 S 蛋白),是結合人體細胞上相應受體的罪魁禍首;E 蛋白是包膜蛋白,將病毒內部的遺傳物質包裹起來;還有膜蛋白(M 蛋白)和核衣殼蛋白(N 蛋白)等結構。
  • 精準預測蛋白結構的Al,會砸了結構生物學家的飯碗嗎?
    撰文 | 戴 威 責編 | 陳曉雪 AlphaFold預測結構奪冠,再次名聲大噪 了解一種新的蛋白結構有兩條路,一是靠實驗去 「看」,二是根據胺基酸序列用計算機去 「算」。
  • 預測蛋白結構的AlphaFold,會砸了結構生物學家飯碗嗎?
    利用計算預測蛋白質結構的CASP競賽創始於1994年,如今已成為評估預測技術的黃金標準,也是這一領域交流新技術的國際平臺。藍色為計算預測,綠色為實驗結果。圖源:deepmind.com在今年CASP比賽中,組織方在5月到8月間放出胺基酸序列,上百個參賽團隊可在5月至9月中旬間提交模型。
  • DeepMind劃時代傑作!AlphaFold蛋白結構預測擊敗人類奪冠
    任何給定的蛋白質可以做什麼取決於其獨特的3D結構。例如,構成我們免疫系統的抗體蛋白質是「Y形」的,並且類似於獨特的鉤子。通過鎖定病毒和細菌,抗體蛋白能夠檢測和標記引起疾病的微生物以進行消滅。類似地,膠原蛋白的形狀像繩索,其在軟骨,韌帶,骨骼和皮膚之間傳遞張力。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    如果科學家可以根據蛋白質的化學構成來預測其形狀,他們就能知道它是做什麼的,會如何出錯並造成傷害,並設計新的蛋白質來對抗疾病或履行其它職責,比如分解環境中的塑料汙染。AI 如何改變研究方法?比賽的目的是根據胺基酸列表來預測蛋白質的結構,這些胺基酸列表會在幾個月內每隔幾天發送給參賽團隊。這些蛋白質的結構最近已經通過費力又費錢的傳統方法破解,但還沒有公開。提交最準確預測的團隊將獲勝。
  • DeepMind破解蛋白質摺疊難題
    預測蛋白質結構變化的重要意義在於,包括癌症、痴呆等幾乎所有疾病,都與細胞內蛋白質結構變化相關,如果能夠掌握蛋白質結構的變化,將對疾病的預防、治療等帶來重要影響。通常情況下,識別單個蛋白質的結構需要耗費科學家數年時間。如今,AlphaFold能在幾天內提供精確到一個原子的結果。
  • 新冠病毒 S蛋白的結構,功能和抗原性
    的文章,詳細的闡釋了S蛋白在新冠病毒與宿主侵染和膜融合的機制。在之前Science文章中確定了新冠病毒S蛋白的三聚體結構,而在這篇文章的冷凍數據3D分類顯示出新冠病毒的Spike蛋白存在多種構象狀態,並在3.0Å解析度下重建了閉合的新冠病毒S三聚體和在3.3Å解析度重建了打開的單個SB區的三聚體。
  • 向李昌鈺學破案,這是Deepmind預測蛋白質結構的秘密研究方法嗎?
    不,我們要向李昌鈺博士學習破案手段,絕不放過任何蛛絲馬跡,靠豐富的想像力,進行推理,看能否找到Deepmind預測蛋白質結構的秘密研究方法。文件介紹了大量的蛋白質結構預測技術,預計有100個左右。我們在其中發現了唯一有一篇論文是來自Deepmind的:Equal contribution, 1- DeepMind, London, UK; 2 UCL, London, UK. andrewsenior@google.com。
  • DeepMind破解蛋白質摺疊難題
    預測蛋白質結構變化的重要意義在於,包括癌症、痴呆等幾乎所有疾病,都與細胞內蛋白質結構變化相關,如果能夠掌握蛋白質結構的變化,將對疾病的預防、治療等帶來重要影響。通常情況下,識別單個蛋白質的結構需要耗費科學家數年時間。如今,AlphaFold能在幾天內提供精確到一個原子的結果。
  • 蛋白質結構預測模型抗疫
    作者:DIGITIMES劉慧蘭隨著COVID-19(新冠肺炎)疫情蔓延全球,近幾年憑藉AI擊敗世界頂尖圍棋和星海爭霸II(StarCraft II)遊戲高手的DeepMind也加入抗疫行列。科學家們在測試病毒及開發疫苗之前,必須先了解病毒的運作方式,尤其是病毒的蛋白質結構,這樣的過程通常需耗時數個月,且未必能有結果。近年來,研究人員已使用DeepMind的深度學習系統AlphaFold來進行計算機預測。DeepMind一直在優化AlphaFold系統並增強其功能。
  • 新冠病毒蛋白結構模型資源庫面世
    一個國際團隊創建了一個新冠病毒蛋白質結構模型資源庫,可作為有力的分析工具,幫助科學家更好地理解新冠病毒  圖片來源:物理學家組織網  科技日報北京6月4日電(記者劉霞)據物理學家組織網近日報導,一個國際結構生物學家團隊對新冠病毒所包含蛋白質結構進行研究,並在此基礎上創建了一個名為「Web」的資源庫。該資源庫還包括對現有新冠病毒蛋白結構模型的評估等資源,可以幫助科學家更好地了解新冠病毒,促進新冠肺炎藥物和疫苗的研發工作。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    因此,科學家們開始利用AI技術開發深度學習算法,在基因組學數據的基礎上對蛋白質結構進行預測。在此基礎上,AlphaFold誕生了。和以往方法不一樣的是,AlphaFold並未使用已經明確結構的蛋白質3D模型作為模板,而是從頭開始探索預測方法。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。△圖源:Science從1994年起,隨著技術的進步,蛋白質的預測準確性在不斷增加,而在今年,迎來了重大突破,預測準確性得分達到了92.4/100。而這,便是DeepMind的AlphaFold 2系統帶來的。
  • ...團隊解析新冠病毒受體結合區RBD與受體蛋白ACE2複合物的晶體結構
    清華大學團隊解析新冠病毒受體結合區RBD與受體蛋白ACE2複合物的晶體結構 2020年2月18日,清華大學生命學院王新泉課題組和醫學院張林琦課題組緊密合作,利用X射線衍射技術,解析了新型冠狀病毒(2019-nCoV)表面刺突糖蛋白受體結合區(receptor-binding domain, RBD)與人受體ACE2蛋白複合物的晶體結構