除了下圍棋 AI還能預測"難纏"的蛋白質結構

2021-01-09 科普頻道

在2020年各種重大科學新聞評選中,「人工智慧預測蛋白質三維結構」是上榜率很高的一項內容。50年來,科學家們一直在努力解決生物學最大的挑戰之一——預測一串胺基酸在變成工作蛋白質時摺疊成的精確三維形狀。2020年,他們通過一款人工智慧程序,實現了這一目標。那麼,這個工作的意義是什麼?人工智慧又是如何做到這一點的?

困擾科學家近50年的難題

我們的生命離不開蛋白質。蛋白質是一切生命活動的基礎物質,它是運輸氧氣的載體,是幫助抵禦病毒的抗體,也是消化食物的酶。蛋白質之所以能夠承擔多種多樣的功能,很大程度上是因為它們具有豐富而複雜的空間結構。

可是,蛋白質如何摺疊成這些獨特的形狀呢?這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。而就在最近,英國DeepMind公司研究人員創建的人工智慧系統AlphaFold將蛋白質結構預測的準確度提高到了原子水平,可以說基本解決了這個「蛋白質摺疊問題」。這比許多科學家的預期要早了幾十年,顯示出人工智慧對解決重大科學問題的潛力。

蛋白質佔據我們每個人體重的大約20%,是除水分(60%)以外第二多的物質種類,其它的脂質、碳水化合物、核酸以及各種無機物加起來,也僅僅佔到20%。蛋白質在人體中含量如此之高並不奇怪,因為蛋白質是生命活動的主要承擔者,沒有蛋白質就沒有生命。

人類的生命活動須臾都離不開蛋白質的參與。無論是身體收縮肌肉、眼睛感知光亮,還是消化系統將食物轉化為能量,我們身體的每一項功能之所以能夠正常運轉,幾乎都依賴於蛋白質。

目前地球上已知的蛋白質大約有兩億種,每一種蛋白質都有獨特的空間結構。蛋白質在生物體中能夠發揮多種多樣的功能,很大程度上取決於它們的三維結構。

例如,我們免疫系統中的抗體蛋白是「Y」形的,並且會形成獨特的鉤狀,這使得它們能夠附著在病毒和細菌上,檢測和標記致病微生物,將其徹底消滅。膠原蛋白的形狀像擰起來的繩索,因而能夠在軟骨、韌帶、骨骼和皮膚之間傳遞張力。還有在被稱為「基因魔剪」的CRISPR-Cas9基因編輯技術中,Cas9蛋白質利用CRISPR基因序列作為嚮導,像剪刀一樣靈巧地剪切和粘貼DNA片段。

然而,確定蛋白質的空間結構一直是生物學中的巨大挑戰。1972年,也就是將近50年前,諾貝爾化學獎得主克裡斯蒂安·安芬森就猜測,蛋白質的胺基酸序列應該可以完全決定其空間結構。可是要如何根據蛋白質的胺基酸序列來確定它的空間結構呢?這就是困擾科學家們近50年的「蛋白質摺疊問題」。

蛋白質如何將自己摺疊起來

蛋白質就像是一臺精心組裝的機器,它的零件是我們身體內的20種胺基酸。在基因編碼合成胺基酸序列的過程中,一個個胺基酸分子遵照基因序列中蘊含的遺傳信息指令,像珠子一樣有序綴連起來,形成多肽鏈,構成蛋白質的一級結構。

然而,通常的機器只要按照設計圖將零件組裝起來就可以運轉,而胺基酸分子連接成多肽鏈後,蛋白質分子的建造還沒有結束,它還需要進一步摺疊出空間結構才能發揮功能。可是基因序列只決定胺基酸序列的合成,並不包含更多信息指導它如何摺疊成獨特的三維結構。

事實上,胺基酸序列的摺疊方式蘊含在自身之中,它們自己設計自己如何摺疊。一級多肽鏈中的胺基酸分子像是懂得彼此溝通一樣,它們有些相互排斥,有些彼此吸引,形成螺旋、摺疊成褶皺,構成蛋白質的二級結構。接著,它還會進一步摺疊成獨特的空間結構,像一根毛線繞成線團那樣,構成蛋白質的三級結構。

整個蛋白質摺疊的過程看似隨機,卻又仿佛遵循著一張設計藍圖,一旦組成蛋白質的胺基酸序列確定下來,它的摺疊方式也就完全確定了。這實際上很符合直覺,我們可以想像,如果同樣的胺基酸序列可以摺疊成不同結構的蛋白質,發揮不同的功能,我們的身體內部會陷入怎樣的混亂狀態。

自然界經過漫長的生命進化過程,蛋白質分子在眨眼之間就能夠自發地完成整個摺疊過程。但科學家們發現,如果想要通過計算胺基酸分子間的相互作用來預測它們如何摺疊,那麼要窮盡所有可能的蛋白質構型,需要的時間將比整個宇宙年齡還要長。

這個問題困擾了科學家們很長時間。但是在人工智慧進入這個領域後,預測蛋白質摺疊的準確性很快獲得提升。

AI出手精確預測蛋白質結構

人工智慧(AI)的一種實現手段是時下流行的機器學習。2016年打敗人類圍棋冠軍的AlphaGo和此次預測蛋白質結構的AlphaFold,利用的都是機器學習算法。它的大致思路是,先將大量已有的數據——包括結果(比如圍棋棋譜、貓狗圖片等)輸入計算機,然後計算機對這些數據進行分析,利用它驚人的計算能力從這些數據中尋找特徵或規律。這樣,對於以後輸入的新數據,它就能作出「富有經驗」的高明反應了。

更為先進的人工智慧算法甚至允許只輸入很少量的學習樣本,就能掌握相關技能。比如AlphaGo的升級版本根本不需要輸入棋譜,只要知道圍棋的規則,就能根據算法對規則進行自我摸索和訓練,通過自己跟自己對弈,最終獲得超越人類頂級圍棋高手的能力。

AlphaFold解決蛋白質摺疊問題的過程與AlphaGo學習下圍棋的過程類似,只不過輸入的是大量蛋白質的序列和結構數據——這些數據來自實驗室中實際測得的數據。Alpha-Fold從中找尋胺基酸分子之間的相互作用、蛋白質片段之間的演化關係,從而獲得了預測蛋白質結構的強大能力。最終,只要知道蛋白質的胺基酸序列,就能迅速而準確地預測出它的結構,相當於通過精妙的算法,將蛋白質的一級結構和三級結構準確地聯繫了起來。

在2018年的蛋白質結構預測競賽中,AlphaFold在所有參賽團隊中排名第一,準確地從43種蛋白質中預測出了24種蛋白質的結構,取得了前所未有的進步。

到了2020年,AlphaFold的升級版本從生物學、物理學和機器學習領域的最新進展中汲取靈感,升級算法,再次以壓倒性的優異成績奪冠。這一次,AlphaFold預測的多種蛋白質結構與實驗結果僅僅存在原子尺度的細微差異,達到了與傳統的試驗方法相媲美的程度,可以說AlphaFold基本解決了蛋白質摺疊問題。

AI會讓生物學家失業嗎

AlphaFold取得裡程碑性質的進展,讓人類有望在諸多領域得到來自AI的切實助力。例如在醫藥領域,阿爾茨海默症、帕金森症候群、亨廷頓症候群等神經系統病變都與蛋白質的錯誤摺疊有關,這直接導致蛋白質結構和功能出現異常。而AI的介入將讓人類更有效地了解這些錯誤摺疊背後的機理,從而提出更加有效的治療方案。又如新冠病毒,大約由30種蛋白質組成,在2020年蛋白質結構預測競賽中,AlphaFold精確預測了其中一種蛋白質(ORF8)的結構。

工業領域同樣會受到這一成就的積極影響。以酶化工為例,多種蛋白酶已經作為反應催化劑獲得了廣泛應用。其中很多種都是人類近年才發現的新型蛋白質,它們個個身懷絕技,有些能夠分解原油、有些能夠降解塑料。對於這些蛋白質的結構和催化機理,我們目前都只有非常初步的認識,AI無疑將大大加速相關研究的進展。

有趣的是,在聽聞AlphaFold解決了蛋白質摺疊問題的消息後,很多人調侃說,結構生物學家以後要失業了。不過事實上,AlphaFold只是為結構生物學家們提供了獲得蛋白質結構的一種手段,正如傳統的核磁共振、X射線衍射和冷凍電鏡方法一樣。這些特定結構在生命體中如何發揮功能,才是更需要結構生物學家們回答的問題。

如著名結構生物學家顏寧所言,結構只是用來做出生物學發現的手段。比如弄清楚剪切體這個龐然大物的結構之後,由此揭示出「幾百個蛋白質如眾星捧月般簇擁著RNA,一剪子一鉤針地剪接DNA序列中的內含子和外顯子」,這個過程才是真正的神奇。

除了預測蛋白質結構,Alpha-Fold也將促進蛋白質設計的發展。在未來,AI或許可以幫助人類根據自身獨特需要,創造出自然界中原本不存在的蛋白質。屆時,必將是生命科學的一次飛躍。

相關焦點

  • 除了下圍棋 AI還能預測「難纏」的蛋白質結構 它是怎麼做到的?
    原標題:除了下圍棋,AI還能預測「難纏」的蛋白質結構,它是怎麼做到的?但是在人工智慧進入這個領域後,預測蛋白質摺疊的準確性很快獲得提升。   3 AI出手精確預測蛋白質結構   人工智慧(AI)的一種實現手段是時下流行的機器學習。2016年打敗人類圍棋冠軍的AlphaGo和此次預測蛋白質結構的AlphaFold,利用的都是機器學習算法。
  • 除了下圍棋,AI還能預測「難纏」的蛋白質結構,它是怎麼做到的?
    但是在人工智慧進入這個領域後,預測蛋白質摺疊的準確性很快獲得提升。3 AI出手精確預測蛋白質結構人工智慧(AI)的一種實現手段是時下流行的機器學習。2016年打敗人類圍棋冠軍的AlphaGo和此次預測蛋白質結構的AlphaFold,利用的都是機器學習算法。
  • 除了下圍棋,AI還能預測「難纏「的蛋白質結構,它是怎麼做到的?
    但是在人工智慧進入這個領域後,預測蛋白質摺疊的準確性很快獲得提升。3 AI出手精確預測蛋白質結構人工智慧(AI)的一種實現手段是時下流行的機器學習。2016年打敗人類圍棋冠軍的AlphaGo和此次預測蛋白質結構的AlphaFold,利用的都是機器學習算法。
  • 繼圍棋戰勝人類之後,AlphaGo所屬團隊又瞄準了蛋白質結構預測
    這一次,Deep Mind 團隊將目光放到了生物學的蛋白質結構領域,其中的細分領域在於蛋白質摺疊,也就是蛋白質的二級結構預測,能夠測出蛋白質的3D形狀。根據英國《衛報》的報導,在墨西哥坎昆舉辦的一場國際會議中,DeepMind 的最新AI—— AlphaFold 成功地根據基因序列預測出蛋白質的 3D 形狀。
  • AlphaGo顛覆生物圈,精準預測蛋白質結構
    具體而言,是DeepMind的第二代AlphaFold 在國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手,能夠精確地基於胺基酸序列,預測蛋白質的3D結構。 其準確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學等實驗技術解析的3D結構相媲美。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    原創 顏寧、張陽等 返樸12月1日,谷歌旗下的DeepMind公司宣布,其新一代AlphaFold人工智慧系統在國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手,精確預測了蛋白質的三維結構,準確性可與冷凍電子顯微鏡(cryo-EM)、核磁共振或 X 射線晶體學等實驗技術相媲美
  • AI精準預測蛋白質結構,結構生物學何去何從? | 返樸
    最終,谷歌旗下DeepMind公司的人工智慧系統AlphaFold2在2018年的Alphafold基礎上迭代創新,超常發揮,一枝獨秀,基本解決了「從胺基酸序列預測蛋白質結構」這個困擾人類50年的生物學第二遺傳密碼問題。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    當然,學術界在蛋白 質結構預測這麼多年的積累,也給AlphaFold2的成功奠定了基礎。其實,我自己很高興他們取得了這麼大突破。這個工作首先證明了蛋白質結構預測 問題是可以被解決的。這其實不是一個簡單的問題,因為蛋白質結構和序列的複雜 關係,常常讓人們特別是做結構預測的人懷疑,蛋白質摺疊這個問題是不是可解, 或者是有唯一解。
  • 解決生物學50年來重大挑戰 生物界"AlphaGo"精準預測蛋白質結構
    具體而言,是DeepMind的第二代AlphaFold 在國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手,能夠精確地基於胺基酸序列,預測蛋白質的3D結構。其準確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學等實驗技術解析的3D結構相媲美。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。△圖源:Science從1994年起,隨著技術的進步,蛋白質的預測準確性在不斷增加,而在今年,迎來了重大突破,預測準確性得分達到了92.4/100。而這,便是DeepMind的AlphaFold 2系統帶來的。
  • 蛋白質結構預測模型抗疫
    作者:DIGITIMES劉慧蘭隨著COVID-19(新冠肺炎)疫情蔓延全球,近幾年憑藉AI擊敗世界頂尖圍棋和星海爭霸II(StarCraft II)遊戲高手的DeepMind也加入抗疫行列。科學家們在測試病毒及開發疫苗之前,必須先了解病毒的運作方式,尤其是病毒的蛋白質結構,這樣的過程通常需耗時數個月,且未必能有結果。近年來,研究人員已使用DeepMind的深度學習系統AlphaFold來進行計算機預測。DeepMind一直在優化AlphaFold系統並增強其功能。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    「我們的目標從來就不是贏得圍棋或雅達利比賽的勝利,而是開發能夠解決蛋白質摺疊這類問題的算法,」Hassabis 表示。值得一提的是,AlphaFold 關注從頭開始建模目標形狀,且並不使用先前已經解析的蛋白質作為模板。AlphaFold 在預測蛋白質結構的物理性質上達到了高度的準確性,然後基於這些預測可以使用兩種不同的方法預測構建完整的蛋白質結構。
  • AI成功預測蛋白質3D結構
    在 AlphaGo 徵服了 Atari 經典遊戲,並在西洋棋和中國圍棋中達到超人表現之後,DeepMind 現在將其人工智慧轉向了人類科學中最棘手的醫療領域。現在,DeepMind 或許已經實現了預測功能。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    在過去的幾年裡,DeepMind公司開發的人工智慧AlphaGo已經在西洋棋和圍棋比賽中取得了超越人類的表現。而如今,DeepMind又向推動和加速新科學發現上邁出了重要的一步。前幾天,DeepMind宣布推出全新的AlphaFold系統,能夠預測並生成蛋白質的3D結構。
  • 又一AI工具在全球賽事中擊敗人類 成功預測蛋白質結構
    正是這些基因定義限制了它們的三維結構,這又決定了它們的能力。例如,抗體蛋白的形狀像「Y」,使它們能夠鎖定病毒和細菌,並且膠原蛋白的形狀像繩索,其在軟骨,骨骼,皮膚和韌帶之間傳遞張力。蛋白質摺疊是什麼?蛋白質的基本單位為胺基酸,而蛋白質的一級結構指的就是其胺基酸序列,蛋白質會由所含胺基酸殘基的親水性、疏水性、帶正電、帶負電等特性通過殘基間的相互作用而摺疊成一立體的三級結構。
  • DeepMind 團隊 CASP 奪冠:用 AlphaFold 預測蛋白質結構
    原標題:DeepMind 團隊 CASP 奪冠:用 AlphaFold 預測蛋白質結構 雷鋒網 AI 科技評論按:在 2016 年和 2017 年,谷歌旗下 DeepMind 團隊的研究成果 AlphaGo 可以說是科技界當之無愧的焦點。
  • 騰訊AI Lab 聯合研究登上Nature子刊,獨創方法提升蛋白質結構預測...
    通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • AI破解蛋白質摺疊難題,施一公等結構學家未來的創新點將在哪裡?
    1972年,諾貝爾化學獎得主克裡斯蒂安·安芬森(Christian Anfinsen)提出一個著名的觀點,即理論上,蛋白質的胺基酸序列應該完全決定其結構。正是由於這一假設,引發了50年的探索,即能夠僅基於1D胺基酸序列通過計算預測蛋白質的3D結構。
  • 生物界AlphaGo精準預測蛋白質結構
    提到DeepMind公司,我們首先想到的可能是幾年前,它開發的人工智慧AlphaGo「橫掃」頂尖人類圍棋職業選手,變革了圍棋的思考方式。除了在棋類比賽中所向披靡以外,DeepMind也在加速科學發現上邁出了重要一步。
  • 生物界「AlphaGo」精準預測蛋白質結構
    提到DeepMind公司,我們首先想到的可能是幾年前,它開發的人工智慧AlphaGo「橫掃」頂尖人類圍棋職業選手,變革了圍棋的思考方式。除了在棋類比賽中所向披靡以外,DeepMind也在加速科學發現上邁出了重要一步。