AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果

2020-12-05 機器之心Pro

機器之心報導

參與:張倩、蛋醬、杜偉

最近,一款名為「Foldit」的遊戲風靡全球。在這款遊戲中,玩家可以在線幫助研究人員尋找具有對抗新型冠狀病毒潛力的蛋白結構,其本質是充分利用所有可利用的人力、算力。說到算力,不少人提到,希望科技巨頭 DeepMind 也參與到這場行動中。不負眾望,DeepMind 其實早已開始行動,並於昨日公布了他們的最新成果。

在昨天發表的博客文章中,DeepMind 表示,他們用 AlohaFold 生成了六種可能與新冠病毒有關的蛋白質結構預測結果,而且已經開放下載。這一結果可能對新冠病毒疫苗研發等工作起到推動作用。

DeepMind 開放的新冠病毒蛋白質結構預測結果下載連結:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip

為什麼要用深度學習預測新冠病毒蛋白結構?

蛋白質是維持生命所必需的大而複雜的分子。幾乎滲透到我們身體的每一個功能——收縮肌肉,感知光線,或將食物轉化為能量——都可以追溯到一種或多種蛋白質,以及它們是如何運動和變化的。

任何給定的蛋白質能做什麼取決於它獨特的 3D 結構。例如,構成我們免疫系統的抗體蛋白是「Y」形的。通過與病毒和細菌結合,抗體蛋白能夠檢測並標記致病微生物並進行消滅。

為了檢測病毒,開發疫苗,科學家必須首先理解病毒的機制,尤其是蛋白質結構。

然而,用傳統方法預測病毒蛋白質結構往往要花費數月時間,而且也不一定能獲得滿意的結果。對於來勢洶洶的新冠病毒疫情,幾個月的時間還是太長了。

深度學習系統的應用可以加快這一過程,其中最具代表性的要數 DeepMind 2018 年底推出的 AlphaFold 系統。

AlphaFold 為何被寄予厚望?

DeepMind 的人工智慧 AlphaGo 在西洋棋、圍棋等遊戲項目中取得了令世人矚目的表現,但卻沒有止步於此。該公司還不斷地嘗試將人工智慧應用於最具挑戰性的科學研究問題上,2018 年 12 月,DeepMind 推出了 Alphafold,它可以僅根據基因代碼預測蛋白質的 3D 結構。

在過去很多年時間裡,科學家已經能使用低溫電子顯微鏡和核磁共振等實驗技術確定蛋白質的形狀,但是每一種方法都依賴大量的試驗與誤差反饋,每種結構可能需要花費數萬美元、歷時數年進行研究。因此生物學家轉攻 AI 方法,以完成這一困難且單調的過程。

近年來,DeepMind 等科技公司越來越傾向於利用深度學習方法來解決基因組數據的預測問題,其中 Alphafold 就是成果之一。

在參加一年兩次的蛋白質摺疊奧運會 CASP 上,Alpafold 在預測蛋白質結構的物理性質上達到了高度的準確性,然後基於這些預測可以使用兩種不同的方法預測構建完整的蛋白質結構。

第一種方法建立在結構生物學的常用技術上,用新的蛋白質片段反覆替換蛋白質整體結構的某個部分。他們訓練了一個生成神經網絡來創造新的片段,這些片段被用來不斷提高蛋白質結構的評分。

先通過神經網絡預測胺基酸之間的距離和化學鍵角度,然後再根據兩種物理屬性對結構進行評分,最後通過梯度下降優化評分。

第二種方法是通過梯度下降來優化評分,得到的結構高度精確。梯度優化被用在整個蛋白質鏈,而不是組裝前必須單獨摺疊的片段,這種做法降低了預測過程的複雜性。

Alphafold 通過梯度下降方法預測蛋白質結構的 3D 動畫圖示。

預測蛋白質摺疊形狀非常重要,對解決很多世紀難題有重大影響。DeepMind 一位發言人曾在接受採訪時表示,「公司的長期任務是推進人工智慧研究的發展,並促使它們產生積極的效益。我們相信人工智慧在促進科學發現方面具有巨大的潛力,我們對公司在蛋白質摺疊等領域產生的影響感到非常自豪。DeepMind 團隊將繼續取得巨大的進步,並將我們的專業技能和知識應用於現實世界的挑戰之中」。

此次。DeepMind 使用 Alphafold 來預測新冠病毒的蛋白質結構可以解讀為一種將技術「應用於現實世界」的體現。

預測結果僅供參考,還未通過實驗驗證

在最新的博客文章中,DeepMind 表示:「我們決定發布幾種可能與新型冠狀病毒有關的病毒蛋白質結構,這幾種蛋白質結構還在進一步研究中。需要強調的是,這幾種結構預測尚未通過科學實驗的驗證,其準確性不能完全確定。」

通常,DeepMind 會在研究成果經過同行評審並正式發表在期刊之後,再進行官方發布。這一次跳過常規步驟,先行公開結構預測結果,也是基於疫情的嚴峻形勢和時間敏感性做出的決定。

DeepMind 表示,這一結構預測系統仍在開發過程中。可以確定的是,最新系統比之前的 CASP 13 系統更準確。此次發布的結果有助於科研界增進對病毒機制的了解,可為新冠肺炎的治療方案開發工作提供一個假設生成平臺。

參考連結:https://deepmind.com/research/open-source/computational-predictions-of-protein-structures-associated-with-COVID-19

相關焦點

  • 預測新冠病毒「蛋白質摺疊」重磅武器:AlphaFold!精度碾壓生物與...
    而這一次,DeepMind要幫助人類擊敗新冠病毒。要想檢測病毒並開發疫苗,科學家必須首先了解病毒,特別是病毒蛋白質的結構。這是一個漫長的過程,需要幾個月的時間,並且有時候是徒勞的。近年來,研究人員已經轉向計算機預測。世界各地的實驗室正在研究冠狀病毒,DeepMind的深度學習系統叫做「AlphaFold」。
  • DeepMind抗疫:預測新冠病毒相關蛋白結構
    DeepMind利用其最新版本的AlphaFold系統,發現幾種與新冠病毒(SARS-CoV-2)相關的蛋白質的結構預測,並在今天對所有人公開。他們表示,這些蛋白質結構還尚未被專家研究,希望能夠對抗疫科研作出貢獻。
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    2018年的11月2日,在第13屆全球蛋白質結構預測競賽(CASP)上,AlphaFold獲得了預測43種蛋白中的25種蛋白結構的最高分,在98名參賽者中排名第一。對於DeepMind的預測方法,由於當時沒有具體論文發布,眾多學者認為是計算能力突出使得AlphaFold獲得冠軍。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    提交最準確預測的團隊將獲勝。儘管是首次參加比賽,AlphaFold 就在 98 名參賽者中名列榜首,準確地從 43 種蛋白質中預測出了 25 種蛋白質的結構。而同組比賽中獲得第二名的參賽者僅準確預測出了 3 種。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    前幾天,DeepMind宣布推出全新的AlphaFold系統,能夠預測並生成蛋白質的3D結構。這一系統在周日進行的國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手。 我們都知道,蛋白質是維持我們生命所必需的龐大而複雜的物質。我們身體的幾乎所有功能,例如收縮肌肉、感知光線或將食物轉化成能量等,都需要一種或多種蛋白質來完成。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    而哥大生物學助理教授Mohammed AlQuraishi,更是評價道:蛋白質結構AI進入「ImageNet時代」。如此重大的突破,究竟帶來了什麼呢?讓我們來快速且全面地了解一下。CASP中斬獲92.4的均分就在11月30日,第14次CASP評估的評價結果公布了。
  • 【AlphaFold精準預測蛋白結構】|蛋白質|胺基酸|生物學|複合物...
    繼圍棋、西洋棋等競技項目之後,近日谷歌旗下DeepMind開發的人工智慧程序AlphaFold在兩年一次的蛋白質結構預測挑戰賽CASP中再次大幅勝出。該程序在根據蛋白質胺基酸序列確定蛋白質三維結構方面取得巨大飛躍,準確性可與冷凍電子顯微術(亦稱冷凍電鏡)(Cryo-EM)和X-射線晶體學等實驗技術相媲美。
  • 預測蛋白結構的AlphaFold,會砸了結構生物學家飯碗嗎?
    利用計算預測蛋白質結構的CASP競賽創始於1994年,如今已成為評估預測技術的黃金標準,也是這一領域交流新技術的國際平臺。藍色為計算預測,綠色為實驗結果。圖源:deepmind.com在今年CASP比賽中,組織方在5月到8月間放出胺基酸序列,上百個參賽團隊可在5月至9月中旬間提交模型。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    蛋白質摺疊問題解讀視頻請戳:    視頻來源:https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
  • DeepMind破解蛋白質摺疊難題
    CASP 是評估預測技術的標準。更重要的是,CASP 選擇那些最近才經過實驗確定的蛋白質結構(有些在評估時仍在等待確定)作為研究小組測試其結構預測方法的目標; 而這些結構的預測方法並沒有提前公布。參與者必須直接預測蛋白質的結構,這些預測隨後會在可用時與實驗數據進行比較。
  • DeepMind劃時代傑作!AlphaFold蛋白結構預測擊敗人類奪冠
    最新研究就揭示這個過程中許多未知的狀態,這一研究成果公布在3月3日的Science雜誌上。AI如何成功預測蛋白質3D結構?此次讓DeepMind再一次嶄露頭角的CASP, 被認為是蛋白質結構領域「奧林匹克競賽」。
  • DeepMind破解蛋白質摺疊難題
    CASP 是評估預測技術的標準。更重要的是,CASP 選擇那些最近才經過實驗確定的蛋白質結構(有些在評估時仍在等待確定)作為研究小組測試其結構預測方法的目標; 而這些結構的預測方法並沒有提前公布。參與者必須直接預測蛋白質的結構,這些預測隨後會在可用時與實驗數據進行比較。
  • DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分
    CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。這個過程,只用了半小時證,實驗結果完全符合AlphaFold的預測結構。
  • DeepMind 團隊 CASP 奪冠:用 AlphaFold 預測蛋白質結構
    通過強有力的跨學科方法,DeepMind 匯集了結構生物學、物理學和機器學習領域的專家,應用前沿技術,僅僅基於蛋白質的遺傳序列來預測蛋白質的 3D 結構。 我們的系統,AlphaFold,在過去的兩年裡我們一直在努力研究它,它建立在多年前使用大量基因組數據預測蛋白質結構的研究基礎之上。
  • 阿爾法狗團隊公布6種新冠病毒蛋白質結構預測,助力疫苗研發
    當地時間3月5日,DeepMind正式交出答卷,在官方博客中表示,其用AlphaFold生成了六種可能與新冠病毒有關的蛋白質結構預測結果,而且已經開放下載。這一結果可能對新冠病毒疫苗研發等工作起到推動AlphaFold預測的一種蛋白結構說到AlphaFold,可能大家都不陌生,它由曾開發出阿爾法狗的研究團隊研發,是Alpha家族的新成員。在2018年12月一問世就引起科學界關注。它可以僅根據基因代碼預測蛋白質的3D結構。
  • 向李昌鈺學破案,這是Deepmind預測蛋白質結構的秘密研究方法嗎?
    不,我們要向李昌鈺博士學習破案手段,絕不放過任何蛛絲馬跡,靠豐富的想像力,進行推理,看能否找到Deepmind預測蛋白質結構的秘密研究方法。讓算法預測出正確結果的可能性就會大大提高。第二步、新算法從哪裡成名?這種新算法在一次知名大賽中斬頭露角,這裡有必要介紹一下這個大賽,大賽也是為了促進提高預測準確性的最新方法的研究和測量進展而設立的。
  • 生物界AlphaGo精準預測蛋白質結構
    今日,DeepMind宣布,其新一代AlphaFold人工智慧系統,在國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手,能夠精確地基於胺基酸序列,預測蛋白質的3D結構。其準確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學等實驗技術解析的3D結構相媲美。這一突破被多家媒體稱為「變革生物科學和生物醫學」的突破。
  • DeepMind破解蛋白質摺疊難題
    CASP 是評估預測技術的標準。更重要的是,CASP 選擇那些最近才經過實驗確定的蛋白質結構(有些在評估時仍在等待確定)作為研究小組測試其結構預測方法的目標; 而這些結構的預測方法並沒有提前公布。參與者必須直接預測蛋白質的結構,這些預測隨後會在可用時與實驗數據進行比較。
  • AlphaFold2是什麼狗?(會後解讀)
    前言蛋白質結構預測問題是結構生物學一個裡程碑式的問題,每兩年,人類會組織一場蛋白質結構預測大賽,而在接下來的幾天,第十四屆,堪稱該領域奧林匹克的比賽,CASP14就要開始了。在芝加哥大學研究機器學習和粗粒化蛋白質摺疊的方法。最後進入了世界上又是「最豪華」的商業公司,一個曾經把柯潔下棋下到流淚的公司,deepmind,開啟了alphafold2的研究之路。這人的履歷就是為蛋白質摺疊這個問題而生的!
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...
    但一個現實挑戰是,蛋白質的3D結構在形成之前會有數以億計的摺疊方式。美國分子生物學家Cyrus Levinthal指出,如果用蠻力來計算蛋白質所有可能的構型所需要的時間可能比宇宙的時間都要長,一個典型的蛋白質可能有10∧300種可能的構型。