AI醫療新進展,谷歌DeepMind基於基因序列預測蛋白質的三維結構

2020-11-29 百家號

蛋白質結構是指蛋白質分子的空間結構。蛋白質主要由碳、氫、氧、氮等化學元素組成,是一類重要的生物大分子。

了解蛋白質結構在疾病診斷和治療中非常重要,它可以提高科學家對人體的認識,並有助於支持蛋白質設計和其它生物工程研究。

所有蛋白質都是由20種不同胺基酸連接形成的多聚體,在形成蛋白質後,這些胺基酸又被稱為殘基。要發揮生物學功能,蛋白質需要正確摺疊為一個特定構型。

有多種科學方法可用於預測DNA中殘留胺基酸的蛋白質分子的天然三維狀態(即蛋白質鏈如何摺疊以達到天然狀態)。甚至還有一個眾包遊戲(FoldIt)試圖利用人類的直覺來預測可行的蛋白質形式。

但是對三維結構進行建模是一項非常複雜的任務,因為蛋白質摺疊可能存在多種排列方式,這取決於諸如各種胺基酸之間的相互作用等因素。

近日,谷歌在倫敦的研發中心DeepMind, 宣布在幫助完成僅基於基因序列預測蛋白質的三維結構的複雜任務方面,取得重大突破。

它在一篇關於使用AI來預測蛋白質如何摺疊的項目的博客文章中寫道: 「AlphaFold [DeepMind的AI系統]生成的蛋白質的三維模型比以前的任何模型都更準確,在生物學的一個核心挑戰上取得重大進展。「

DeepMind表示,其方法依賴於多年前使用大數據來預測蛋白質結構的研究。

具體而言,它正在將深度學習方法應用於基因組數據。

「幸運的是,由於基因測序成本的快速降低,基因組學領域的數據非常豐富。因此,在過去幾年中,依賴於基因組數據的預測問題的深度學習方法變得越來越流行。DeepMind由此研發了AlphaFold,我們今年提交給了CASP [ 蛋白質結構預測技術關鍵評估的社區範圍實驗 ],「這篇博客文章中寫到。

「我們很自豪地成為CASP組織者所稱的『在預測蛋白質結構的計算方法方面的空前進步』的一部分,在參賽隊伍中排名第一(我們的參賽作品是A7D)。」

「我們的團隊特別關注從零開始建模目標形狀的難題,而不使用以前解決的蛋白質作為模板。當預測蛋白質結構的物理性質時,我們獲得了高度的精確度,然後使用兩種不同的方法來構建全蛋白質結構的預測,」它補充道。

DeepMind說,它使用的兩種方法依賴於使用深度神經網絡訓練來預測其基因序列中的蛋白質特性。

「我們的網絡預測的屬性是:(a)胺基酸對之間的距離和(b)連接這些胺基酸的化學鍵之間的角度。第一個發展是對常用技術的進步,這些技術可以估計胺基酸對是否彼此接近,」它解釋說。

「我們訓練了一個神經網絡來預測蛋白質中每對殘基之間的距離的單獨分布。然後將這些概率組合成評估所提出的蛋白質結構的準確度的分數。我們還訓練了一個單獨的神經網絡,它使用所有距離匯總來估計擬議結構與正確答案的接近程度。「

然後,它使用新方法嘗試構建蛋白質結構的預測,搜索與其預測相匹配的已知結構。

「我們的第一種方法建立在結構生物學中常用的技術上,並且用新的蛋白質片段反覆替換蛋白質結構的片段。我們訓練了一個生成神經網絡來產生新的片段,以用於不斷提高所提出的蛋白質結構的得分,「它寫道。

「第二種方法通過梯度下降優化得分—— 一種常用於機器學習的數學技術,用於進行小的,漸進的改進——由此得出高度精確的結構。該技術用於整個蛋白質鏈,而不是用於在組裝之前必須單獨摺疊的片段,從而降低了預測過程的複雜性。」

「DeepMind將迄今為止使用計算方法所取得的成果描述為「蛋白質摺疊進展的早期跡象」,並聲稱它們證明了「AI用於科學發現的實用性」。

但它也強調證明深度學習方法具有任何「可量化的影響」還為時過早。

「儘管我們在用AI對治療疾病、管理環境等產生量化影響之前還有很多工作要做,但我們知道潛力是巨大的,」它寫道。

相關焦點

  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    如今,該公司已將人工智慧技術應用到最具挑戰性的科學研究問題中,其剛剛推出的 AlphaFold 可以僅根據基因「代碼」預測生成蛋白質的 3D 形狀。DeepMind 表示,AlphaFold 是「該公司首個證明人工智慧研究可以驅動和加速科學新發現的重要裡程碑」。
  • DeepMind正在開發可以利用基因序列預測蛋白質結構的新AI工具
    打開APP DeepMind正在開發可以利用基因序列預測蛋白質結構的新AI工具 電子發燒友 發表於 2018-12-04 16:09:28
  • 谷歌DeepMind 開發新 AI 工具:利用基因序列預測蛋白質結構
    北京時間12月4日早間消息,據美國《麻省理工科技評論》(MIT Technology Review)報導,谷歌旗下DeepMind開發一個新AI工具,它可以利用基因序列預測蛋白質結構。
  • 向李昌鈺學破案,這是Deepmind預測蛋白質結構的秘密研究方法嗎?
    眾所周知,全世界頂級的圍棋選手人工智慧阿法狗之父,Deepmind公司最近又因為在生命科學領域的成就,上了科技界的熱搜榜。這個小成就就是,新的算法AlphaFold 可以僅根據基因預測生成蛋白質的三維形狀。可惜,公司並沒有公布這個算法的論文。我們就這樣放棄嘛?
  • 谷歌DeepMind又在全球賽事中擊敗人類!AI成功預測蛋白質3D結構
    在 12 月 2 日坎昆舉行的會議上,組織者宣布,在第 13 屆全球蛋白質結構預測競賽(Critical Assessment of protein Structure Prediction,CASP)上,DeepMind 的最新人工智慧程序 AlphaFold 擊敗了所有人:成功預測生命基本分子——蛋白質的三維結構。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    而蛋白質具體能做什麼就要取決於它獨特的3D結構了。 然而,純粹從其基因序列中找出蛋白質的3D結構是一項非常具有挑戰性的複雜任務。由於我們的DNA通常只包含蛋白質中胺基酸殘基的序列信息,而這些胺基酸殘基形成的長鏈將會摺疊成錯綜複雜的3D結構。這就是所謂的「蛋白質摺疊」問題。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    在這個推理過程,還會用到生物學中已知的信息進行完善,如:進化中的同源序列,多序列比對(MSA)和胺基酸殘基對等。通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。此外,AlphaFold還使用了內部置信度度量指標來判斷蛋白質結構中哪些部分是可靠的。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    DeepMind破解蛋白質摺疊難題,Nature:這可能改變一切剛剛,一個困擾生物學家50年的難題,被AI解決了。去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。今天,在有「蛋白質奧林匹克競賽」稱呼的國際蛋白質結構預測競賽(CASP)上,AlphaFold擊敗了其餘的參會選手,能夠精確地基於胺基酸序列,預測蛋白質的3D結構。
  • DeepMind破解蛋白質摺疊難題
    去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。這個假設引起了長達五十年的探索,即僅僅基於蛋白質的 1D 胺基酸序列就能夠計算預測蛋白質的 3D 結構。然而,這個假設面臨的一個主要的挑戰是,理論上蛋白質在進入最終的 3D 結構之前可以摺疊的方式數量是一個天文數字。
  • AI破解蛋白質摺疊難題,施一公等結構學家未來的創新點將在哪裡?
    從人類基因組計劃開始,人類相信只要獲得了人類基因的「樂譜」,就能按圖索驥,解釋生命生理過程中的諸多機制。但從基因轉錄、翻譯再到胺基酸序列之後,科研界就似乎進入了一個極為狹窄的胡同,因為他們遇到了蛋白摺疊。
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    代碼:https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13模型:https://www.biorxiv.org/content/10.1101/846279v1.full.pdf根據DeepMind的介紹,在預測蛋白質結構的物理性質方面使用了兩種不同的方法來構建預測模型。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。1972年諾貝爾化學獎得主克裡斯蒂安·安芬森(Christian Anfinsen)曾提出,基於蛋白質的1D胺基酸序列可計算並預測蛋白質的3D結構。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    1972年諾貝爾化學獎得主克裡斯蒂安·安芬森(Christian Anfinsen)曾提出,基於蛋白質的1D胺基酸序列可計算並預測蛋白質的3D結構。這一過程對於理解蛋白質內部的物理相互作用以及它們的進化史很重要。對於AlphaFold的最新版本,研究人員創建了一個基於注意力機制的神經網絡系統,經過端到端的訓練來試圖解釋這個圖的結構,同時對它所構建的隱式圖進行推理。它通過使用多重序列對齊 (MSA) 和胺基酸殘基對的表示來精化這個圖形結構。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。1972年諾貝爾化學獎得主克裡斯蒂安·安芬森(Christian Anfinsen)曾提出,基於蛋白質的1D胺基酸序列可計算並預測蛋白質的3D結構。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    但這一思路的挑戰在於,在形成三維結構之前,蛋白質的理論摺疊方式是一個天文數字。  一直以來,CASP 選擇近期才經過實驗確定的蛋白質結構,作為參賽團隊測試其蛋白質結構預測方法的目標(有些結構即使在評估時仍然處於待確定狀態)。這些蛋白質結構不會事先公布,參賽者也必須對其結構進行盲測,最後將預測結果與實驗數據進行對比。正是基於這種嚴苛的評估原則,CASP 一直被稱為預測技術評估方面的「黃金標準」。
  • DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分
    CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。之後,研究人員在公開的數據上訓練了這個系統,這些資料庫包括大約170000個蛋白質結構,其中便有許多未知結構的蛋白質序列。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。遊戲意味著有規則可循,所以在有一定規律可循的事情上,Deepmind可以發現其中的規律,並比人類做得更出色。因而,通過Deepmind開發的Alophafold發現蛋白質摺疊規律並成功預測,顯然也在情理之中。
  • DeepMind 團隊 CASP 奪冠:用 AlphaFold 預測蛋白質結構
    近日,團隊發現了僅僅基於蛋白質的遺傳序列來預測蛋白質的 3D 結構的方法。雷鋒網 AI 科技評論編譯如下。 今天,我們非常興奮地與大家分享 DeepMind 在展示人工智慧研究如何推動和加速新的科學發現方面的第一個重要裡程碑。
  • DeepMind劃時代傑作!AlphaFold蛋白結構預測擊敗人類奪冠
    通過跨學科方法,DeepMind匯集了來自結構生物學,物理學和機器學習領域的專家,以應用尖端技術,僅根據其基因序列預測蛋白質的3D結構。在獲悉這一划時代的技術性突破後,動脈網試圖通過以下邏輯,還原DeepMind再次戰勝人類模型的「裡程碑」事件,以及DeepMind在醫療領域所做的探索。