谷歌人工智慧解決蛋白質摺疊問題,結束人類50年困擾

2020-12-11 瑞拉的深邃幻想

DeepMind於12月初宣布了一項重大突破,他們的AI系統AlphaFold已經解決了「蛋白質摺疊問題」,這是生物學中已經困擾了科學家50年的巨大難題。

蛋白質摺疊問題的突破可以幫助我們了解疾病並發現新的藥物。生物學家安德烈·盧帕斯(Andrei Lupas)告訴《自然》(Nature),這是在 「改變遊戲規則」。 他補充道,「這將改變醫學,改變研究,改變生物工程。甚至改變一切。」

DeepMind是一家人工智慧(AI)研究實驗室,在2014年被Google收購,現在已經成為Google母公司Alphabet的獨立全資子公司。

DeepMind這家公司聽起來陌生,但實際上大家對它的產品應該還算熟悉:大名鼎鼎的圍棋界超級無敵大黑馬阿爾法狗(AlphaGo)就是由他們開發的。仔細看看,就能發現,AlphaFold與AlphaGo的命名方式如出一轍。畢竟圍棋在西方就叫做「Go」,而蛋白質摺疊翻譯成英語則是「Protein folding」。

蛋白質是一種大分子,與核酸、多糖等一起被稱為生物大分子。它是在細胞中完成工作的基本組成部分,約佔人體全部質量的18%。最重要的是,蛋白質幫助人們維持正常代謝功能,與生命中的各種現象有關。

人體內蛋白質的種類很多,性質功能各不相同,但都是由20種基本胺基酸(Amino acid)按不同比例組合而成的,並在體內不斷進行代謝與更新。它們最開始時是一串胺基酸(可以想像成一條穿著珍珠的項鍊),但很快就會摺疊成一個獨特的三維形狀(想像一下將這串珍珠項鍊弄亂)。

如果為了更好地理解後續AlphaFold所做出的貢獻和成就,就需要展開說得更詳細一些,得從蛋白質的一級結構、二級結構和三級結構講起了。

蛋白質的基本組成單位是胺基酸。而蛋白質的一級結構指的就是其胺基酸序列。胺基酸通過脫水縮合連成肽鏈,多肽主鏈骨架原子沿一定的軸盤旋或摺疊而形成的特定的構象就是二級結構。

一條或者多條多肽鏈組合在一起,便組成了蛋白質三級結構。具體一點地說,蛋白質會由所含胺基酸殘基的親水性、疏水性、帶正電、帶負電等特性通過殘基間的相互作用而摺疊成一個立體的三級結構。本文要講的蛋白質摺疊問題就是跟這三級結構的摺疊情況有關。

根據1972年的諾貝爾化學獎得主安芬森提出的著名假設,蛋白質分子的一級結構決定其立體結構。也就是說,如果從蛋白質的一級結構就能知道它的三級立體結構,那麼就可以直接從基因推測其編碼蛋白質所對應的生物學功能。

但現在的問題是,雖然蛋白質可以在短時間內,從一級結構摺疊至三級立體結構,研究者卻無法在短時間中從胺基酸序列開始,計算出蛋白質結構,甚至無法得到準確的三維結構。因此,研究蛋白質摺疊的過程,可以說是破譯摺疊密碼的過程。

這個摺疊後的三維形狀至關重要,因為它決定了蛋白質的工作方式。如果開發新藥物的科學家知道蛋白質的形狀,他就更容易找到一個可以與之結合的分子,使這個蛋白質可以改變它的行為。問題在於,很難預測蛋白質將會呈現哪種形狀。

用疫情中的冠狀病毒來舉例這個過程的話,病毒的序列不但顯示了它的來源,還將顯示將來會呈現的形狀及導致的身體狀況,或者說是生物現象。所以從序列開始,就需要做出計算來獲知它的立體結構,並通過尋找一個結合的分子去改變這個結構,從而改變這個結構帶來的生物現象。但是,這個蛋白質變化很快,計算卻太難,需要大量的時間。

研究這些形狀預測問題的研究人員為了更好的交流,每隔兩年,都會提交有關某些蛋白質未來形狀的預測來證明自己的能力以及想要獲得進步。他們會在一個「結構預測的關鍵評估」(Critical Assessment of Structure Prediction / CASP)會議上進行同行評審。所以,這個會議因為那些奇奇怪怪的預測,有時候會被認為是成年人之間的科幻比賽。

到了2018年,DeepMind的AI作出的預測已經超越了這個CASP會議裡的每個人,讓這些人類研究員感到了恐慌以及鬱悶。畢竟,那是一種要被搶去飯碗的不妙感。DeepMind在那一年贏得了明顯的勝利,但它距離解決蛋白質摺疊問題差得還是太遠了。

令人驚嘆的是,短短兩年過去,現在,DeepMind的AlphaFold系統已經能夠以驚人的速度和準確性預測出胺基酸串會摺疊成什麼樣子的立體形狀。AI當然並不完美,但是在這件事上卻做得非常出色:當它出現錯誤時,通常也只有一個原子的寬度。這與科學家在實驗室中進行實驗時所犯的錯誤差不多大,只是這些科學家的實驗速度會慢得多,費用也高昂得多。

「這很重要,」 CASP的共同創始人和負責人約翰·穆爾特(John Moult)告訴《自然》。「從某種意義上說,問題已經解決。」

現在我們來說說這個AI技術的進步對生物學來說有多重要。雖然AlphaFold的技術仍然有待完善,但假設研究人員能夠精準實現這一目標,這一突破將可能加快並提高我們開發新藥的能力。

讓我們來看看AI在提升研發速度方面的真正能力。為了更了解AlphaFold可以在多大程度上促進科學家的工作,我們可以舉個人類科學家的例子來說明:德國Max Planck研究所的進化生物學家Andrei Lupas花了十年,試圖弄清楚一種蛋白質的形狀。但是,無論他在實驗室中嘗試了什麼,都無法得到真正的結果。於是他試用了AlphaFold,在半小時內得到了答案。是的,就是這麼令人沮喪又令人驚喜。

看了以上這些,很多人仍然不明白這項AI 技術對我們普通人來說意味著什麼。實際上,許多疾病都是由錯誤摺疊的蛋白質引起的。例如阿茨海默症(老年痴呆)、囊性纖維病變、家族性高膽固醇症、家族性澱粉樣蛋白症、某些腫瘤、白內障等。

而從阿茨海默症到目前的冠狀疫情大流行,AlphaFold都會有影響。它可以幫助我們了解疾病,找到新的治療方法,還可以幫助我們快速確定哪些現有藥物可以有效地應用於新的或變異的病毒。換句話說,花了人們一整年的時間去研究的新冠疫苗,如果在一年前就有了這個AI的幫助,指不定全球疫情都快要結束了。

未來,當另一種從未見過的疫情發生時,在我們的後兜裡安裝一個像AlphaFold這樣的系統,可能會讓我們像會分析對方戰力的超級機器人那般,無所懼怕。但是要使這些成為可能,DeepMind必須與科學家共享技術。這家實驗室目前表示,正在探索實現這一目標的方法。

接著我們來講講這個在生物方面的探索為什麼對人工智慧來說也很重要。在過去的幾年中,DeepMind通過玩遊戲而舉世聞名。他們建立的AI系統不斷傳出勝績,使得像西洋棋、圍棋和星際爭霸這樣的戰略遊戲中的專業遊戲玩家倍受打擊。就像IBM的Deep Blue和Garry Kasparov之間的西洋棋比賽一樣,這些比賽主要用來證明DeepMind可以使AI超越人類的能力。

現在,DeepMind用AlphaFold證明它已經成長,從玩電子遊戲逐漸升級為解決具有現實意義的生死攸關的科學問題。就像是一個只會玩遊戲到處挑戰的熊孩子,現在終於長大成人,成為了一個實驗室裡為人類做貢獻的科學家。

解決蛋白質摺疊問題就是這一個完美的證明DeepMind的AI長大了的方案。目前,DeepMind是構建神經網絡的全球領導者。神經網絡是一種受人腦神經元啟發的人工智慧。這種AI的優點在於它不需要人類使用很多規則對其進行預編程,只需向神經網絡提供足夠的某些事例或者案例即可。它可以學習並檢測這些案例中的數據或模式,然後基於此得出推論。

例如,可以為這個AI顯示成千上萬個胺基酸串,並顯示它們會摺疊成什麼形狀。逐漸地,它給出的胺基酸串摺疊方式趨於成形並進行驗證,隨後基於該檢測模式,一直做更新的嘗試。由於人力的關係,可能會得出一些人類專家未檢測到的規律或模式。因而,它可以預測其他更多蛋白質的摺疊方式。

顯然,這些不斷嘗試的過程,正是神經網絡擅長的方面。而DeepMind明顯也意識到了這一點,將正確類型的AI與正確類型的謎題結合在一起。甚至,還整合了一些更複雜的知識,例如關於物理學和與進化相關的胺基酸序列方面的知識。由於DeepMind仍在準備發表同行評審的論文,所以細節比較少,但想來離公布不遠了。

其他實驗室其實也已經利用神經網絡的力量在生物學上取得了一定的突破。今年年初,AI研究人員通過向神經網絡提供有關已知具有抗菌特性的2335個分子的數據來訓練神經網絡。然後,他們用它來預測在1.07億種可能性中,還有哪些其他分子也具有這些特性。通過這種方式,他們確定了新型的抗生素。

DeepMind的研究人員正在用跟人類息息相關的成就來結束這一年,這項成就表明了AI的成熟程度。對於整個2020年以及整個世界來說,都是個極致的好消息。

相關焦點

  • 谷歌人工智慧解決蛋白質摺疊問題
    打開APP 谷歌人工智慧解決蛋白質摺疊問題 賈桂鵬 發表於 2020-12-06 09:07:00 美團Q3總收入354億元 同比增長28.8% 美團發布2020年第三季度財報。本季度總收入354億元,同比增長28.8%,環比增長43.2%。經營溢利由2019年第三季度的人民幣14億元增加至本季度的人民幣67億元,其中投資於上市實體公允價值變動收益人民幣58億元。經營利潤率由2019年同期的5.3%增至本季度的19.0%。
  • 谷歌Deepmind稱解決蛋白質摺疊難題 或加速藥物研發
    ,從而解決了過去50年的一項「重大挑戰」。每個活細胞體內都有成千上萬種不同的蛋白質,這些蛋白質也是細胞生存的基礎。預測蛋白質如何摺疊非常重要,因為這決定了蛋白質的性質。幾乎所有疾病,包括癌症和老年痴呆症,都與蛋白質的功能有關。歐洲生物信息學研究所的珍妮特·桑頓(Dame Janet Thornton)教授表示:「蛋白質是最美麗的結構。準確預測蛋白質的摺疊非常具有挑戰性,多年來一直困擾著很多人。」
  • AI再發力,解決困擾生物學家近50年的一個基本問題
    蛋白質是一切生命活動的基礎物質,它是運輸氧氣的載體,是幫助抵禦病毒的抗體,也是消化食物的酶。蛋白質之所以能夠承擔多種多樣的功能,很大程度上是因為它們具有豐富而複雜的空間結構。可是,蛋白質如何摺疊成這些獨特的形狀呢?這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。
  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智慧技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題。最新一代算法 Alphafold 2,現在已經擁有了預測蛋白質 3D 摺疊形狀的能力,這一複雜的過程對於人們理解生命形成的機制至關重要。
  • DeepMind解決蛋白質摺疊難題!運算時間縮至數小時
    谷歌人工智慧部門DeepMind在預測蛋白質結構方面邁出了一大步。公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,並將解決問題的運算時間從數月縮短至數小時,這有助於加快藥物發現速度,有可能破解一個類似於繪製人類基因組的問題。
  • DeepMind開發一款軟體可準確預測蛋白質在幾天時間裡會摺疊成什麼...
    據報導,Alphabet旗下人工智慧公司DeepMind開發了一款軟體,可以準確預測蛋白質在幾天時間裡會摺疊成什麼樣的結構,從而解決了過去50年的一項「重大挑戰」。每個活細胞體內都有成千上萬種不同的蛋白質,這些蛋白質也是細胞生存的基礎。預測蛋白質如何摺疊非常重要,因為這決定了蛋白質的性質。幾乎所有疾病,包括癌症和老年痴呆症,都與蛋白質的功能有關。歐洲生物信息學研究所的珍妮特·桑頓(Dame Janet Thornton)教授表示:「蛋白質是最美麗的結構。準確預測蛋白質的摺疊非常具有挑戰性,多年來一直困擾著很多人。」
  • DeepMind的蛋白質摺疊AI解決了50年來的生物學重大挑戰
    蛋白質的工作方式和功能由其三維形狀決定-"結構即功能 "是分子生物學的公理。幾十年來,實驗室實驗一直是獲得良好蛋白質結構的主要途徑。從20世紀50年代開始,利用X射線束射向結晶的蛋白質,並將衍射光轉化為蛋白質的原子坐標的技術,首次確定了蛋白質的完整結構。X射線晶體學產生了絕大部分的蛋白質結構。
  • 【譯】蛋白質摺疊問題50年的歷程
    1962年的諾貝爾化學獎授予了Max Perutz和John Kendrew, 以表彰他們在確定球蛋白結構方面所做的開創性工作(1-3), 而今年是其50周年紀念. 他們的工作奠定了結構生物學的基礎, 從蛋白質和其他生物分子的角度解釋了分子層面上的生物學機制. 他們的工作也提出這樣的問題, 如何用物理原理來闡明蛋白質的結構.
  • 谷歌DeepMind又在全球賽事中擊敗人類!AI成功預測蛋白質3D結構
    CASP 也被認為是蛋白質結構領域「奧林匹克競賽」。 「蛋白質摺疊」是一種令人難以置信的分子摺紙形式,它非常神秘,是一個具有深遠意義的問題,在科學界之外很少有人討論。所有生物都是由蛋白質構成的,蛋白質的結構決定了它的功能。當 AI 了解了蛋白質的摺疊方式,我們可以期待人類進入科學和醫學的新時代。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    剛剛,一個困擾生物學家50年的難題,被AI解決了。 去年年底,谷歌DeepMind推出了一種名為AlphaFold(一個用人工智慧加速科學發現的系統,它基於蛋白質的基因序列,就能預測蛋白質的3D結構)的算法。
  • AI破解蛋白質摺疊難題,這意味著什麼?-虎嗅網
    剛剛,一個困擾生物學家50年的難題,被AI解決了。去年年底,谷歌DeepMind推出了一種名為AlphaFold的算法。但超人遊戲從來都不是主要目標,遊戲為程序提供了訓練場,一旦程序足夠強大,就可以解決現實世界中的問題!蛋白質摺疊50年來重大突破,AI破解預測難題蛋白質的形狀與其功能密切相關,預測蛋白質結構的能力可以幫助我們更好地理解蛋白質的功能和工作原理。
  • Science 蛋白質摺疊問題50年的歷程【譯】
    1962年的諾貝爾化學獎授予了Max Perutz和John Kendrew, 以表彰他們在確定球蛋白結構方面所做的開創性工作(1-3), 而今年是其50周年紀念. 他們的工作奠定了結構生物學的基礎, 從蛋白質和其他生物分子的角度解釋了分子層面上的生物學機制. 他們的工作也提出這樣的問題, 如何用物理原理來闡明蛋白質的結構.
  • 摺疊革命,深度學習通過胺基酸序列預測蛋白質結構
    17年4月,在Cell Systems上的一篇文章中,系統生物學家Mohammed AIQuraishi闡述了一種可以用來預測蛋白質結構的新計算方法,不但達到現在計算方法準確性,而且速度可以提高到一百萬倍以上。「蛋白質摺疊在近半個世紀裡,一直以來都是困擾生物化學家們最重要的難題,但是這種方法給解決這類難題提供了一個新方向。」
  • 除了下圍棋,AI還能預測「難纏」的蛋白質結構,它是怎麼做到的?
    可是,蛋白質如何摺疊成這些獨特的形狀呢?這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。而就在最近,英國DeepMind公司研究人員創建的人工智慧系統AlphaFold將蛋白質結構預測的準確度提高到了原子水平,可以說基本解決了這個「蛋白質摺疊問題」。這比許多科學家的預期要早了幾十年,顯示出人工智慧對解決重大科學問題的潛力。
  • DeepMind AI系統攻破生物學界50多年重大難題
    美國時間 11 月 30 日,谷歌母公司 Alphabet 旗下人工智慧公司 DeepMind 公開宣布,生物學界 50 年來的重大難題——蛋白質摺疊預測,已被其成功攻克。Alphabet 旗下人工智慧公司 DeepMind 在預測蛋白質結構方面邁出了一大步。
  • 解決生物學50年來重大挑戰!人工智慧預測蛋白結構能力堪比實驗室水平
    Alphafold的表現超過了大約100個其他團隊,準確性達到了與實驗室方法不分伯仲的水平[1],一舉解決了困擾學界長達五十年之久的蛋白質摺疊問題。 「它將改變醫學。
  • DeepMind稱AI能精確預測蛋白摺疊 將加速藥物設計
    細胞內部有成千上萬種不同的蛋白質,這些蛋白質可以使細胞保持健康狀態。蛋白質通過無規則的捲曲摺疊構成特定的三維結構,並決定蛋白質的功能,因此如果人們能夠預測蛋白質摺疊的形狀和結構,那麼將對於治療癌症和阿爾茨海默病等疾病的藥物研發起到關鍵作用。
  • 「阿爾法摺疊」精準預測蛋白質三維結構
    幾十年來,研究人員利用X射線晶體學或低溫電子顯微鏡(cryo-EM)等實驗技術來破譯蛋白質的三維結構,但這種方法可能需要數月甚至數年,且未必見效。目前,在生命體內發現的2億多個蛋白質中,只有17萬個蛋白質的結構被破解。1994年,為更好預測和破解蛋白質三維結構,馬裡蘭大學結構生物學家約翰·穆爾特等人發起了CASP競賽,每兩年舉行一次。
  • DeepMind破解蛋白質摺疊難題引爭議,正準備論文回應
    當地時間11月30日,英國DeepMind團隊宣布在蛋白質結構問題上取得重大進展,其第二代「阿爾法摺疊」(AlphaFold)方法精準預測蛋白質的三維結構,摘得國際蛋白質結構預測競賽(CASP)冠軍。這一進展被輿論視為繼AlphaGo以3:0戰勝世界圍棋冠軍後,人工智慧的再度發威。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。而過去十幾年,其他方法只能在40分左右徘徊。