研究蛋白質的AI得到了諾貝爾獎級別的重大進展

2020-12-03 煎蛋

總部位於英國的AI公司DeepMind自開發出AlphaGo以後,已經成為了人工智慧領域裡的領航者。

然而,有不少人詬病其未能在更加具有應用性的問題裡有所突破。

在此背景下,DeepMind的研究人員正在努力讓AI解決更根本的重大科學難題。他們使用最新版本的AlphaFold AI引擎,似乎實現了一個雄心勃勃的目標。

大約50年以來,分子生物學家一直猜測,蛋白質分子長鏈在空間中的摺疊結構,是由鏈上的胺基酸種類和順序唯一決定的——由此我們就可以按部就班地拼接胺基酸來得到特定功能的酶,或者僅通過小分子的順序來預測蛋白質大分子的功能,而無需實驗——但這並不是一個容易解決的問題。

實際上,潛在結構的數目是如此之大,以至於研究人員推測,對所有可能的分子排列進行採樣所花費的時間將超過宇宙的壽命。

但是,如果我們能夠解決這個難題(即蛋白質摺疊問題),將極大地加快藥物開發和疾病建模的能力,並帶來遠遠超出當前想像的應用。

因此,儘管面臨挑戰,但數十年來,研究人員一直在努力尋找解決方案。

1990年代開始進行了名為CASP(蛋白質結構預測的關鍵評估)的嚴格實驗,用於檢驗科學家們設計出的能夠預測蛋白質摺疊的理論系統。

如今,在CASP的第三個十年中,似乎已經產生了最有希望的解決方案——DeepMind的AlphaFold提供了準確性前所未有的3D蛋白質結構預測模型。

在實驗中,DeepMind為AlphaFold使用了一種新的深度學習架構,該架構能夠理解和計算3D蛋白質的「空間圖」,從而預測支撐其摺疊結構的分子結構。

AI系統被餵了大約170000種蛋白質的結構數據,作為培訓,參與到今年的CASP挑戰中(CASP14),得分為92.4 GDT。

該數值高於通常的溼實驗方法得到的結果——90 GDT閾值,而DeepMind表示,其預測平均僅偏離約1.6埃(約一個原子的寬度)。

歐洲分子生物學實驗室的基因組學研究員Ewan Birney說:「當我看到這些結果時,我幾乎從椅子上摔了下來。我知道CASP多麼嚴格——它基本上確保了計算模型必須從頭開始蛋白質摺疊。令人沮喪的是,看到這些模型可以如此精確地做到這一點,而我們有很多方面需要理解,但這確實是科學的巨大進步。」

值得注意的是,該研究尚未經過同行評審,也未在科學雜誌上發表(儘管DeepMind的研究人員說快了)。

即使這樣,即使尚未看到完整的報告和詳細的結果,該領域的專家已經讚嘆不已。

皇家學會主席,結構生物學家Venki Ramakrishnan說:「這項計算代表了蛋白質摺疊問題的驚人進展,而那是生物學有50年歷史的重大問題。」

完整的論文尚未發布,但是您可以在此處查看摘要:https://predictioncenter.org/casp14/doc/CASP14_Abstracts.pdf。

*解釋一下大概就是說,蛋白質分子長鏈上的胺基酸與空間結構的關係,最理想的情況當然是把它轉化為物理-數學問題。從更基本的物理特性出發,轉為數學模型,然後直接證明,得到定律。如同萬有引力可以推導出天體的運行軌跡一樣。

但是那個目前做不到。所以只能寄希望於統計-數值模型。就是我們從大量數據裡發掘出一個規律性的東西,但是規律的本質我們還不清楚。

AlphaFold就是得到了當前最優的模型。它給出的預測結果,和直接實驗測量蛋白質一樣好。然後它的計算時間也足夠快。

相關焦點

  • 騰訊發布AI醫學進展:首次破解「禿頭元兇」SRD5A2的蛋白質結構
    DoNews 11月17日消息(記者 程夢玲)騰訊通過其官方技術傳播帳號「鵝廠技術派」發文稱,騰訊11月17日發布了一項重要AI醫學進展——禿頭元兇「SRD5A2」的蛋白質結構被首次破解。
  • 騰訊AI Lab 聯合研究登上Nature子刊,獨創方法提升蛋白質結構預測...
    通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • AI解決生物學50年來重大難題:破解蛋白質摺疊,顛覆結構生物學
    蛋白質對於生命至關重要,它們是由胺基酸鏈組成的大型複雜分子,其作用取決於自身獨特的 3D 結構。弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    蛋白質摺疊問題  蛋白質的形狀與它的功能密切相關,而預測蛋白質結構對於理解其功能和工作原理至關重要。很多困擾全人類的重大問題(如尋找分解工業廢料的酶)基本上都與蛋白質及其扮演的角色有關。  多年以來,蛋白質結構一直是熱門的研究話題,研究者使用核磁共振、X 射線、冷凍電鏡等一系列實驗技術來檢測和確定蛋白質結構。
  • 下一個諾貝爾獎:蛋白質摺疊
    如果用一句IT術語來講,蛋白質把模塊化做到了極致。問題來了,到底是怎麼從一條多肽鏈經過摺疊變成一個分子機器的,科學家們全部都茫然了。如果你能夠破解這個過程,下一個諾貝爾獎就會等著你。蛋白質摺疊蛋白質是以胺基酸為基本單位構成的生物高分子。
  • 下一個諾貝爾獎:蛋白質摺疊
    如果你能夠破解這個過程,下一個諾貝爾獎就會等著你。蛋白質摺疊蛋白質是以胺基酸為基本單位構成的生物高分子。蛋白質分子上胺基酸的序列和由此形成的立體結構構成了蛋白質結構的多樣性。蛋白質具有一級、二級、三級、四級結構,蛋白質分子的結構決定了它的功能。
  • 蛋白質組學研究進展與趨勢
    90年代初期,各種技術已比較成熟,在這樣的背景下,經過各國科學家的討論,才提出蛋白質組這一概念。        國際上蛋白質組研究進展十分迅速,不論基礎理論還是技術方法,都在不斷進步和完善。相當多種細胞的蛋白質組資料庫已經建立,相應的國際網際網路站也層出不窮。
  • AI破解生物界50年重大挑戰!DeepMind精準預測蛋白質結構
    如果我們想要設計出有特定功能的蛋白質,我們必須了解不同的結構都具備怎樣的功能。一般來說,藥理學家會通過大量的觀察和統計,得到粗略的經驗:怎樣的蛋白質結構大致具備怎樣的功能,但由於蛋白質是納米量級上的3D結構,通過這樣不斷枚舉的「笨」辦法設計藥物是非常棘手的。
  • 細胞內蛋白質摺疊研究取得進展
  • 破解生物界50年重大挑戰!DeepMind用AI精準預測蛋白質結構
    如果我們想要設計出有特定功能的蛋白質,我們必須了解不同的結構都具備怎樣的功能。一般來說,藥理學家會通過大量的觀察和統計,得到粗略的經驗:怎樣的蛋白質結構大致具備怎樣的功能,但由於蛋白質是納米量級上的3D結構,通過這樣不斷枚舉的「笨」辦法設計藥物是非常棘手的。
  • 蛋白質研究「端粒相關蛋白對人類重大疾病作用機制的研究」重大...
    端粒酶的發現為蛋白質研究開拓了新的方法。科學家發現,端粒酶由RNA和蛋白質組成,端粒酶在卵巢、睪丸及幹細胞中表現活躍,但在體細胞中幾乎很難發現,所以端粒隨著細胞不斷分裂而縮短、導致人類組織和細胞衰老直至死亡。如果能夠找到並控制包括端粒酶在內的端粒相關蛋白,就有可能為預防、診斷和治療重大疾病以及衰老性疾病提供關鍵信息。
  • DeepMind的蛋白質摺疊AI解決了50年來的生物學重大挑戰
    研究人員說,在20世紀80年代和90年代,使用計算機預測蛋白質結構的早期嘗試表現不佳。當其他科學家將這些方法應用於其他蛋白質時,發表的論文中對方法的崇高要求往往會被瓦解。John Moult 和 Krzysztof Fidelis 兩位教授於 1994 年創辦了CASP,每兩年進行一次盲審,以促進蛋白質結構預測方面的新 SOTA 研究。
  • AI每日精選:北京地鐵研究刷臉安檢;LG電子波士頓開設機器人實驗室
    2.消息稱蘋果2億美元收購人工智慧初創公司Xnor.ai消息人士透露,蘋果公司收購了西雅圖初創公司 Xnor.ai,後者是一家專業致力於研究設備人工智慧技術的公司。消息人士稱,蘋果公司以大約 2 億美元的價格收購了 Xnor.ai。
  • 他有13個諾貝爾獎級別的成果
    楊振寧大家都知道,不過,大多數人可能只知道他獲得過諾貝爾獎,還有那句著名的詩:你是上帝恩賜給我最後的禮物。但楊振寧究竟對科學做出的貢獻有多大、以及他在物理學上的影響程度,很多人就一無所知了,有人這樣評價楊振寧學術上的地位:他是成果豐碩的物理學家,與牛頓、愛因斯坦這些偉大的物理學家處於同一級別,連霍金也望塵莫及。
  • 青島能源所等在蛋白質相互作用研究中取得進展
    青島能源所等在蛋白質相互作用研究中取得進展 2015-02-04 青島生物能源與過程研究所   日前,中國科學院青島生物能源與過程研究所代謝物組學團隊研究員馮銀剛和中科院生物物理研究所研究員柯莎(Sarah Perrett)研究組在翻譯控制腫瘤蛋白(TCTP)參與蛋白質相互作用研究中取得新進展
  • 蛋白質糖基化研究獲進展
    vertebrate-specific Y subfamily of UDP-N-acetyl-α-d-galactosamine:polypeptide N-acetylgalactosaminyltransferases」的文章,首次提出了內質網中可能存在新的蛋白質O-GalNAc糖基化調控機制,這一成果公布在國際糖生物學研究領域權威雜誌Glycobiology上。
  • 2020年度「引文桂冠獎」公布,表彰「諾貝爾獎級別」的科學家
    科睿唯安旗下科學信息研究所(ISI)的分析表明,他們的研究成果被普遍認為達到「諾貝爾獎級別」。自2002年以來,ISI分析師每年都會基於Web of Science™核心合集的論文和引文數據,遴選諾貝爾獎獎項所涉及的生理學或醫學、物理學、化學及經濟學領域中全球最具影響力的頂尖研究人員。
  • 解決生物學50年來重大挑戰 生物界"AlphaGo"精準預測蛋白質結構
    拿它預測的結構與實際結構對比,可以看到基本完全吻合(下圖,綠色是實驗得到的實際結構,藍色是計算預測結構)。首先,17萬的數據應該遠遠不夠,準確性存疑;再者,蛋白質結構摺疊問題太過高深,如果真能夠破解,DeepMind很快就能獲得諾貝爾獎。 因此,在驚嘆AlphaFold取得成果的同時,我們還需要冷靜等待生物學家的實驗驗證。 除了解決的問題值得我們關注,其實研究方法也更有思考價值。
  • 科學網—關注蛋白質修飾研究最新進展與應用前景
  • AI醫療新進展,谷歌DeepMind基於基因序列預測蛋白質的三維結構
    蛋白質結構是指蛋白質分子的空間結構。蛋白質主要由碳、氫、氧、氮等化學元素組成,是一類重要的生物大分子。 了解蛋白質結構在疾病診斷和治療中非常重要,它可以提高科學家對人體的認識,並有助於支持蛋白質設計和其它生物工程研究。