一個困擾生物學家50年的問題,被AI突破了

2020-12-05 騰訊網

眾所周知,蛋白質就是一串胺基酸而已。

可是,拿到胺基酸的排列順序,你能猜出它會摺疊出怎樣的三維結構麼?恐怕很難。就算是天天研究蛋白質的科學家們,也被這個問題困擾了50年。

如今有隻AI,能以前所未有的準確率預測蛋白結構。它給出的答案與蛋白質的真實結構之間,大約只差一個原子的寬度:

藍色為AI預測結果,綠色為標準答案丨DeepMind

這隻AI名叫AlphaFold,來自谷歌DeepMind,和會下棋的AlphaGo師出同門。它剛剛在蛋白結構預測比賽CASP14上,超越所有對手獲得優勝。

消息發表之後,學界備受鼓舞。AlphaFold的存在,仿佛讓科學家擁有了上帝視角。Nature把馬普所生物學家Andrei Lupas的一句評論當做了新聞標題:它會改變一切

怎樣的一場比賽

拿到一個胺基酸序列,每隻AI都會給出自己預測的三維結構。

那麼,擁有近100位參賽選手的CASP挑戰賽,是依靠什麼來衡量各位選手的得分?

首先,標準答案是通過低溫電子顯微鏡(Cryo-EM)等等學界標配的實驗方法檢測蛋白質本身,得出的相對精確的三維結構。

然後,對比標答和選手答案之間的相似度,利用的方法叫做Global Distance Test(全球距離測試,簡稱GDT)。GDT滿分為100,通常只要選手得分超過90,就認為一道題目做對了。

GDT評測標準丨DeepMind

把所有題目算在一起,AlphaFold得分的中位數達到了92.4,大約2/3的題目都做對了。這個成績比其他選手高出一大截。

即便在最難的一組題目「自由建模(Free-Modelling Category)」當中,AlphaFold的中位數也有87.0分,比第二名高出25分。

CASP挑戰賽兩年一屆,從1994年開始至今已經舉辦了14屆,大致相當於蛋白結構預測界的奧林匹克。

比賽創辦人之一、馬裡蘭大學教授John Moult毫不吝惜對這隻AI的讚美。他說,從某種程度上看,(蛋白結構預測)問題已經解決了。

對於那些AlphaFold預測與標答出現分歧的題目,Moult教授也認為,並不能確定是AI預測出了差錯,還是實驗室結果本身有問題。

AI是怎樣煉成的

那麼,AlphaFold的工作原理是怎樣的?

DeepMind研究團隊說,一個摺疊的蛋白質可以視為一張空間圖(Spatial Graph):構成蛋白質的每個殘基(residue)都是圖中一個節點(node),然後有邊(edge)把距離相近的節點連在一起。

如此一來,過往已知結構的那些蛋白質,都可以用這樣的眼光來看待。在日復一日的訓練之中,AI逐漸熟悉了圖上節點相連的規律。再遇到陌生考題的時候,便可以按照之前摸出的規律,連出一幅新的圖來。

殘基相連的方式預測丨DeepMind

2018年,AlphaFold官宣之初,便拿下了CASP13冠軍。雖然,那時它的得分中位數沒有達到90,也就是總體上沒達到系統判定正確的分數線,卻也遠遠超越了其他選手。

從那時起,歡呼和質疑一併到來了。許多人都擔心,這隻AI用某種人們不知道的方式作了弊。

不過,在一種名叫Orf3a的蛋白質上,AlphaFold證明了自己。加州大學伯克利分校的分子神經生物學家Stephen Brohawn說,AI預測出的蛋白結構,和後來實驗室用低溫電子顯微鏡做出的成像十分接近。

那麼,AI擁有這樣的能力,到底意味著什麼?

影響了誰的工作

大約半個世紀以前,有位名叫克裡斯蒂安·安芬森的科學家,在研究RNA酶的時候發現:對一些蛋白質來說,只要環境不變,它的天然結構便只由胺基酸序列決定。

安芬森丨National Institutes of Health

換句話說,給定一個胺基酸序列,理論上就可以預測出蛋白質的三維結構

安芬森因此獲得了1972年的諾貝爾化學獎。他提出的這條假說也有了個響亮的名號:安芬森原則

後來的幾十年間,科學家們在預測蛋白結構的路上艱難地前行,希望有朝一日能把「理論上」這幾個字去掉。

畢竟,蛋白質的功能,要靠摺疊成特定的結構才能實現。

而那些設計新藥或者新酶的科學家們,如果能了解某種蛋白質的結構,便可以更好地預判某種蛋白質能不能和特定的分子結合,進而帶來他們希望看到的反應。

假如AI能夠準確預測蛋白質的結構,許多科學家的工作(沒有被取代的話)可能都會變得更高效。

參考文獻

[1] The AlphaFold team. (2020, November 30). AlphaFold: A solution to a 50-year-old grand challenge in biology. Retrieved from https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

[2] Callaway, E. (2020, November 30). 'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures. Retrieved December 01, 2020, from https://www.nature.com/articles/d41586-020-03348-4

[3] Robert F. ServiceNov. 30, 2., Charles PillerNov. 29, 2., Jop de VriezeNov. 25, 2., Jon CohenNov. 25, 2., Shreya DasguptaNov. 25, 2., Kai KupferschmidtNov. 24, 2., . . . Lucy HicksOct. 30, 2. (2020, November 30). 'The game has changed.' AI triumphs at solving protein structures. Retrieved December 01, 2020, from https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures

作者:慄子

編輯:Luna

一個AI

今年AlphaFold還預測了新冠病毒幾種蛋白的結構,就等對答案了。

本文來自果殼,未經授權不得轉載.

如有需要請聯繫sns@guokr.com

相關焦點

  • 一個困擾生物學家50年的問題,被AI突破了
    就算是天天研究蛋白質的科學家們,也被這個問題困擾了50年。如今有隻AI,能以前所未有的準確率預測蛋白結構。CASP挑戰賽兩年一屆,從1994年開始至今已經舉辦了14屆,大致相當於蛋白結構預測界的奧林匹克。比賽創辦人之一、馬裡蘭大學教授John Moult毫不吝惜對這隻AI的讚美。他說,從某種程度上看,(蛋白結構預測)問題已經解決了。
  • AI再發力,解決困擾生物學家近50年的一個基本問題
    這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。而就在最近,谷歌開發的人工智慧系統 AlphaFold 將蛋白質結構預測的準確度提高到了原子水平,可以說基本解決了這個「蛋白質摺疊問題」。 這比許多科學家的預期還要早幾十年,顯示出 AI 對解決重大科學問題的潛力。 01.
  • AI數小時內解決困擾生物學50年的高精度蛋白質摺疊預測問題
    據《紐約時報》報導,這家與谷歌同屬一家母公司的公司DeepMind創造了一個人工智慧系統,它可以快速準確地預測蛋白質如何摺疊以獲得其3D形狀,這是一個令人驚訝的複雜問題,幾十年來一直困擾著研究人員。近50年前,科學家們假設,你可以只知道一個蛋白質的胺基酸序列就能預測它的結構。但事實證明,解決這個 "蛋白質摺疊問題 "具有巨大的挑戰性,因為根據DeepMind公司的聲明,理論上同一蛋白質有很多方式可以摺疊成3D結構,令人匪夷所思。
  • 清華女教授再次取得突破,攻克困擾國際50年難題
    2017年,清華女教授顏寧出走美國,在當時引起不小的轟動,這位才華橫溢的美女科學家離開時曾說:換一種環境,希望能夠在科學上取得新突破。那麼這3年來,她突破了嗎?顏寧,從小就表現出聰明的才智和過人的天賦,先是以優異的成績考入清華大學生物科學與技術系,本科畢業後前往美國普林斯頓大學分子生物學系學習,師從著名生物學家施一公先生
  • 生物學的一個基本大問題迎來重大突破
    」一直是生物學中的一個重大挑戰,並且已經困擾生物學家50多年。直到現在,終於有佳訊傳來:由DeepMind開發的人工智慧系統AlphaFold,在根據胺基酸序列確定蛋白質的三維形狀方面取得了重大突破。1994年,一些科學家組建了一個社群論壇,名為CASP(預測蛋白質結構的關鍵評估),讓從事蛋白質摺疊研究的科學家可以分享最新的進展。
  • 生物學的一個基本大問題迎來重大突破!
    然而一直以來,「蛋白質摺疊問題」一直是生物學中的一個重大挑戰,並且已經困擾生物學家50多年。直到現在,終於有佳訊傳來:由DeepMind開發的人工智慧系統AlphaFold,在根據胺基酸序列確定蛋白質的三維形狀方面取得了重大突破。
  • AI破解困擾了50年的難題,這可能改變一切
    公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!DeepMind這一歷史性進展有助於加快藥物發現速度,對理解人類生命形成機制至關重要。 剛剛,一個困擾生物學家50年的難題,被AI解決了。
  • 沒錯,戰勝柯潔的AI系統,已經開始解決困擾科學家50年的生物難題
    如今,這家總部位於英國的公司,又開始進軍生物醫學領域,甚至攻克了科學家們認為人力還需要幾十年才能拿下的難題,那就是蛋白質摺疊的問題。大約在50年前,科學家們就開始思考蛋白質如何構建其複雜的三維結構的。我們知道,胺基酸是蛋白質的最基本單元,它們之間的結合會形成肽鏈,而肽鏈本身或者通過結合就能形成蛋白質。
  • 谷歌人工智慧解決蛋白質摺疊問題,結束人類50年困擾
    DeepMind於12月初宣布了一項重大突破,他們的AI系統AlphaFold已經解決了「蛋白質摺疊問題」,這是生物學中已經困擾了科學家50年的巨大難題。蛋白質摺疊問題的突破可以幫助我們了解疾病並發現新的藥物。生物學家安德烈·盧帕斯(Andrei Lupas)告訴《自然》(Nature),這是在 「改變遊戲規則」。
  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。在今年的國際蛋白質結構預測競賽 CASP 中,DeepMind 開發的 AlphaFold 最新版本擊敗了其他選手,在準確性方面比肩人類實驗結果,被認為是蛋白質摺疊問題的解決方案。這一突破證明了 AI 對於科學發現,尤其是基礎科學研究的影響。
  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    「這些算法今天已經足夠成熟強大,足以被應用於真正具有挑戰性的科學問題上了。」蛋白質對於生命至關重要,它們是由胺基酸鏈組成的大型複雜分子,其作用取決於自身獨特的 3D 結構。弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    蛋白質存在於我們世界中的所有有機物體及奧妙人體中,全新的AlphaFold 算法揭秘了生物學界50年來試圖破解蛋白質分子摺疊的難題,這項AI帶來的重大突破,將幫助科學家弄清某些困擾人們的疾病機制、加速找出新型流行病的具體原因(比如今年的全球新冠大流行),促進新藥設計、幫助農業增產、解析可有效降解廢棄物的嶄新成分、甚至探索為大氣減碳的全新解決方案。
  • AI攻破50年生物學難題!《自然》:「這將會改變一切」
    50年難題,正在人工智慧的幫助下迅速拉上帷幕。將近20年的時間跨度,凸顯了半個世紀以來一直困擾著生物學家的計算難題:已知一個蛋白的胺基酸序列,要怎樣才能求出其三維結構?對於現代生物學來說,測出一個蛋白的胺基酸序列相對簡單(可用蛋白質譜法),但確定蛋白的三維結構則非常難(需要用到X射線晶體學和冷凍電鏡)。如何從胺基酸序列跨到蛋白的三維結構,難倒了一代代的生物學家。若能解決蛋白摺疊問題,科學家就不必浪費大量時間和資金確定蛋白的結構,而是可以將精力放在更重要的問題上,甚至還能針對性地設計具有獨特功能的蛋白。
  • 擊敗李世石的AI公司,又研發出生物版「阿爾法狗」:破解50年生物學...
    當地時間11月30日,谷歌旗下的人工智慧公司DeepMind宣布,其研發的AI系統AlphaFold成功解開了一個困擾人類長達50年之久的生物學難題——「蛋白質摺疊問題」。 這一驚人的成果立刻引發了關注。
  • 「填色問題」困擾數學界60年,這個生物學家的方法是終極答案嗎?
    在平面著色問題問世 60 多年後,一位業餘數學愛好者近日取得了新的突破。平面著色問題可以追溯到 1950 年,當時,芝加哥大學學生 Edward Nelson 提出了一個看似簡單的圖形問題,卻讓數學家們花費了幾十年去解答。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    原來是結構生物學,迎來了一個「革命性」的突破。11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。而過去十幾年,其他方法只能在40分左右徘徊。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    AI在生物科學領域再次取得重大突破!美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。但一個現實挑戰是,蛋白質的3D結構在形成之前會有數以億計的摺疊方式。美國分子生物學家Cyrus Levinthal指出,如果用蠻力來計算蛋白質所有可能的構型所需要的時間可能比宇宙的時間都要長,一個典型的蛋白質可能有10∧300種可能的構型。因此,從1972年至今,如何準確預測蛋白質的摺疊方式一直是生物學界的一項重大挑戰。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年巨大挑戰
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。但一個現實挑戰是,蛋白質的3D結構在形成之前會有數以億計的摺疊方式。美國分子生物學家Cyrus Levinthal指出,如果用蠻力來計算蛋白質所有可能的構型所需要的時間可能比宇宙的時間都要長,一個典型的蛋白質可能有10∧300種可能的構型。因此,從1972年至今,如何準確預測蛋白質的摺疊方式一直是生物學界的一項重大挑戰。
  • 最近,人工智慧解決了長達50年的生物學難題,一個巨大的突破
    50年來,研究人員一直在努力預測蛋白質是如何實現它們的三維結構的,但這並不是一個容易解決的問題。事實上,所有可能的分子結構的數量大得令人難以置信,研究人員推測,要對所有可能的分子結構進行採樣,需要比宇宙年齡更長的時間。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...
    美國時間11月30日,谷歌母公司Alphabet旗下人工智慧公司DeepMind公開宣布,生物學界50年來的重大難題——蛋白質摺疊預測,已被其成功攻克。美國分子生物學家Cyrus Levinthal指出,如果用蠻力來計算蛋白質所有可能的構型所需要的時間可能比宇宙的時間都要長,一個典型的蛋白質可能有10∧300種可能的構型。因此,從1972年至今,如何準確預測蛋白質的摺疊方式一直是生物學界的一項重大挑戰。