除了下圍棋 AI還能預測「難纏」的蛋白質結構 它是怎麼做到的?

2021-01-19 東方財富網

原標題:除了下圍棋,AI還能預測「難纏」的蛋白質結構,它是怎麼做到的?

  在2020年各種重大科學新聞評選中,「人工智慧預測蛋白質三維結構」是上榜率很高的一項內容。50年來,科學家們一直在努力解決生物學最大的挑戰之一——預測一串胺基酸在變成工作蛋白質時摺疊成的精確三維形狀。2020年,他們通過一款人工智慧程序,實現了這一目標。那麼,這個工作的意義是什麼?人工智慧又是如何做到這一點的?

  蚓激酶蛋白質三維結構示意圖新華社發

  1 困擾科學家近50年的難題

  我們的生命離不開蛋白質。蛋白質是一切生命活動的基礎物質,它是運輸氧氣的載體,是幫助抵禦病毒的抗體,也是消化食物的酶。蛋白質之所以能夠承擔多種多樣的功能,很大程度上是因為它們具有豐富而複雜的空間結構。

  可是,蛋白質如何摺疊成這些獨特的形狀呢?這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。而就在最近,英國DeepMind公司研究人員創建的人工智慧系統AlphaFold將蛋白質結構預測的準確度提高到了原子水平,可以說基本解決了這個「蛋白質摺疊問題」。這比許多科學家的預期要早了幾十年,顯示出人工智慧對解決重大科學問題的潛力。

  蛋白質佔據我們每個人體重的大約20%,是除水分(60%)以外第二多的物質種類,其它的脂質、碳水化合物、核酸以及各種無機物加起來,也僅僅佔到20%。蛋白質在人體中含量如此之高並不奇怪,因為蛋白質是生命活動的主要承擔者,沒有蛋白質就沒有生命。

  人類的生命活動須臾都離不開蛋白質的參與。無論是身體收縮肌肉、眼睛感知光亮,還是消化系統將食物轉化為能量,我們身體的每一項功能之所以能夠正常運轉,幾乎都依賴於蛋白質。

  目前地球上已知的蛋白質大約有兩億種,每一種蛋白質都有獨特的空間結構。蛋白質在生物體中能夠發揮多種多樣的功能,很大程度上取決於它們的三維結構。

  例如,我們免疫系統中的抗體蛋白是「Y」形的,並且會形成獨特的鉤狀,這使得它們能夠附著在病毒和細菌上,檢測和標記致病微生物,將其徹底消滅。膠原蛋白的形狀像擰起來的繩索,因而能夠在軟骨、韌帶、骨骼和皮膚之間傳遞張力。還有在被稱為「基因魔剪」的CRISPR-Cas9基因編輯技術中,Cas9蛋白質利用CRISPR基因序列作為嚮導,像剪刀一樣靈巧地剪切和粘貼DNA片段。

  然而,確定蛋白質的空間結構一直是生物學中的巨大挑戰。1972年,也就是將近50年前,諾貝爾化學獎得主克裡斯蒂安·安芬森就猜測,蛋白質的胺基酸序列應該可以完全決定其空間結構。可是要如何根據蛋白質的胺基酸序列來確定它的空間結構呢?這就是困擾科學家們近50年的「蛋白質摺疊問題」。

  2 蛋白質如何將自己摺疊起來

  蛋白質就像是一臺精心組裝的機器,它的零件是我們身體內的20種胺基酸。在基因編碼合成胺基酸序列的過程中,一個個胺基酸分子遵照基因序列中蘊含的遺傳信息指令,像珠子一樣有序綴連起來,形成多肽鏈,構成蛋白質的一級結構。

  然而,通常的機器只要按照設計圖將零件組裝起來就可以運轉,而胺基酸分子連接成多肽鏈後,蛋白質分子的建造還沒有結束,它還需要進一步摺疊出空間結構才能發揮功能。可是基因序列只決定胺基酸序列的合成,並不包含更多信息指導它如何摺疊成獨特的三維結構。

  事實上,胺基酸序列的摺疊方式蘊含在自身之中,它們自己設計自己如何摺疊。一級多肽鏈中的胺基酸分子像是懂得彼此溝通一樣,它們有些相互排斥,有些彼此吸引,形成螺旋、摺疊成褶皺,構成蛋白質的二級結構。接著,它還會進一步摺疊成獨特的空間結構,像一根毛線繞成線團那樣,構成蛋白質的三級結構。

  整個蛋白質摺疊的過程看似隨機,卻又仿佛遵循著一張設計藍圖,一旦組成蛋白質的胺基酸序列確定下來,它的摺疊方式也就完全確定了。這實際上很符合直覺,我們可以想像,如果同樣的胺基酸序列可以摺疊成不同結構的蛋白質,發揮不同的功能,我們的身體內部會陷入怎樣的混亂狀態。

  自然界經過漫長的生命進化過程,蛋白質分子在眨眼之間就能夠自發地完成整個摺疊過程。但科學家們發現,如果想要通過計算胺基酸分子間的相互作用來預測它們如何摺疊,那麼要窮盡所有可能的蛋白質構型,需要的時間將比整個宇宙年齡還要長。

  這個問題困擾了科學家們很長時間。但是在人工智慧進入這個領域後,預測蛋白質摺疊的準確性很快獲得提升。

  3 AI出手精確預測蛋白質結構

  人工智慧(AI)的一種實現手段是時下流行的機器學習。2016年打敗人類圍棋冠軍的AlphaGo和此次預測蛋白質結構的AlphaFold,利用的都是機器學習算法。它的大致思路是,先將大量已有的數據——包括結果(比如圍棋棋譜、貓狗圖片等)輸入計算機,然後計算機對這些數據進行分析,利用它驚人的計算能力從這些數據中尋找特徵或規律。這樣,對於以後輸入的新數據,它就能作出「富有經驗」的高明反應了。

  更為先進的人工智慧算法甚至允許只輸入很少量的學習樣本,就能掌握相關技能。比如AlphaGo的升級版本根本不需要輸入棋譜,只要知道圍棋的規則,就能根據算法對規則進行自我摸索和訓練,通過自己跟自己對弈,最終獲得超越人類頂級圍棋高手的能力。

  AlphaFold解決蛋白質摺疊問題的過程與AlphaGo學習下圍棋的過程類似,只不過輸入的是大量蛋白質的序列和結構數據——這些數據來自實驗室中實際測得的數據。Alpha-Fold從中找尋胺基酸分子之間的相互作用、蛋白質片段之間的演化關係,從而獲得了預測蛋白質結構的強大能力。最終,只要知道蛋白質的胺基酸序列,就能迅速而準確地預測出它的結構,相當於通過精妙的算法,將蛋白質的一級結構和三級結構準確地聯繫了起來。

  在2018年的蛋白質結構預測競賽中,AlphaFold在所有參賽團隊中排名第一,準確地從43種蛋白質中預測出了24種蛋白質的結構,取得了前所未有的進步。

  到了2020年,AlphaFold的升級版本從生物學、物理學和機器學習領域的最新進展中汲取靈感,升級算法,再次以壓倒性的優異成績奪冠。這一次,AlphaFold預測的多種蛋白質結構與實驗結果僅僅存在原子尺度的細微差異,達到了與傳統的試驗方法相媲美的程度,可以說AlphaFold基本解決了蛋白質摺疊問題。

  4 AI會讓生物學家失業嗎

  AlphaFold取得裡程碑性質的進展,讓人類有望在諸多領域得到來自AI的切實助力。例如在醫藥領域,阿爾茨海默症、帕金森症候群、亨廷頓症候群等神經系統病變都與蛋白質的錯誤摺疊有關,這直接導致蛋白質結構和功能出現異常。而AI的介入將讓人類更有效地了解這些錯誤摺疊背後的機理,從而提出更加有效的治療方案。又如新冠病毒,大約由30種蛋白質組成,在2020年蛋白質結構預測競賽中,AlphaFold精確預測了其中一種蛋白質(ORF8)的結構。

  工業領域同樣會受到這一成就的積極影響。以酶化工為例,多種蛋白酶已經作為反應催化劑獲得了廣泛應用。其中很多種都是人類近年才發現的新型蛋白質,它們個個身懷絕技,有些能夠分解原油、有些能夠降解塑料。對於這些蛋白質的結構和催化機理,我們目前都只有非常初步的認識,AI無疑將大大加速相關研究的進展。

  有趣的是,在聽聞AlphaFold解決了蛋白質摺疊問題的消息後,很多人調侃說,結構生物學家以後要失業了。不過事實上,AlphaFold只是為結構生物學家們提供了獲得蛋白質結構的一種手段,正如傳統的核磁共振、X射線衍射和冷凍電鏡方法一樣。這些特定結構在生命體中如何發揮功能,才是更需要結構生物學家們回答的問題。

  如著名結構生物學家顏寧所言,結構只是用來做出生物學發現的手段。比如弄清楚剪切體這個龐然大物的結構之後,由此揭示出「幾百個蛋白質如眾星捧月般簇擁著RNA,一剪子一鉤針地剪接DNA序列中的內含子和外顯子」,這個過程才是真正的神奇。

  除了預測蛋白質結構,Alpha-Fold也將促進蛋白質設計的發展。在未來,AI或許可以幫助人類根據自身獨特需要,創造出自然界中原本不存在的蛋白質。屆時,必將是生命科學的一次飛躍。

  (作者為大阪大學免疫前沿研究中心研究員。特約「十點科學」微信公眾號供稿)

  (原標題:人工智慧如何預測蛋白質結構)

(文章來源:北京日報)

(責任編輯:DF398)

相關焦點

  • 除了下圍棋,AI還能預測「難纏」的蛋白質結構,它是怎麼做到的?
    但是在人工智慧進入這個領域後,預測蛋白質摺疊的準確性很快獲得提升。3 AI出手精確預測蛋白質結構人工智慧(AI)的一種實現手段是時下流行的機器學習。2016年打敗人類圍棋冠軍的AlphaGo和此次預測蛋白質結構的AlphaFold,利用的都是機器學習算法。
  • 除了下圍棋,AI還能預測「難纏「的蛋白質結構,它是怎麼做到的?
    在2020年各種重大科學新聞評選中,「人工智慧預測蛋白質三維結構」是上榜率很高的一項內容。50年來,科學家們一直在努力解決生物學最大的挑戰之一——預測一串胺基酸在變成工作蛋白質時摺疊成的精確三維形狀。2020年,他們通過一款人工智慧程序,實現了這一目標。那麼,這個工作的意義是什麼?人工智慧又是如何做到這一點的?
  • 除了下圍棋 AI還能預測"難纏"的蛋白質結構
    在2020年各種重大科學新聞評選中,「人工智慧預測蛋白質三維結構」是上榜率很高的一項內容。50年來,科學家們一直在努力解決生物學最大的挑戰之一——預測一串胺基酸在變成工作蛋白質時摺疊成的精確三維形狀。2020年,他們通過一款人工智慧程序,實現了這一目標。那麼,這個工作的意義是什麼?人工智慧又是如何做到這一點的?
  • 繼圍棋戰勝人類之後,AlphaGo所屬團隊又瞄準了蛋白質結構預測
    這一次,Deep Mind 團隊將目光放到了生物學的蛋白質結構領域,其中的細分領域在於蛋白質摺疊,也就是蛋白質的二級結構預測,能夠測出蛋白質的3D形狀。根據英國《衛報》的報導,在墨西哥坎昆舉辦的一場國際會議中,DeepMind 的最新AI—— AlphaFold 成功地根據基因序列預測出蛋白質的 3D 形狀。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    我認為恰恰相反,它給很多領域提供了解決問題的新途 徑和新思維,因而會極大推動相關領域的發展,因此,會產生更多更大的機會。即 使對於蛋白質結構預測這個相對較小的領域來講,我們還有很多事情要做。 AlphaFold2這次只有2/3的蛋白做到實驗精度,還有1/3做不到,是否還有更快更好 的途徑來產生更高精度結構的算法?基於商業或其它考慮,我相信谷歌可能不會公 開代碼或Server。
  • AI精準預測蛋白質結構,結構生物學何去何從? | 返樸
    這次只有2/3的題目可以做到實驗精度,還有1/3做不到,是否還有更快更好的途徑來產生更高精度結構的算法?這是值得我們努力的方向。最終,谷歌旗下DeepMind公司的人工智慧系統AlphaFold2在2018年的Alphafold基礎上迭代創新,超常發揮,一枝獨秀,基本解決了「從胺基酸序列預測蛋白質結構」這個困擾人類50年的生物學第二遺傳密碼問題。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    這次只有2/3的題目可以做到實驗精度,還有1/3做不到,是否還有更快更好的途徑來產生更高精度結構的算法?這是值得我們努力的方向。最終,谷歌旗下DeepMind公司的人工智慧系統AlphaFold2在2018年的Alphafold基礎上迭代創新,超常發揮,一枝獨秀,基本解決了「從胺基酸序列預測蛋白質結構」這個困擾人類50年的生物學第二遺傳密碼問題。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    鄭集楊 發自 凹非寺量子位 報導 | 公眾號 QbitAI一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。
  • AlphaGo顛覆生物圈,精準預測蛋白質結構
    拿它預測的結構與實際結構對比,可以看到基本完全吻合(下圖,綠色是實驗得到的實際結構,藍色是計算預測結構)。除了實驗,隨著計算機的發展,該項技術在上世紀末便已用於預測蛋白質的結構,但效果並不理想。比賽團隊獲得約100種蛋白質的胺基酸序列,其結構未知。一些小組計算每個序列的結構,而另一些小組則通過實驗確定它。 然後,組織者將計算預測結果與實驗室結果進行比較,並為預測結果提供全球距離測試(GDT)分數。 研究小組有數周的時間來提交其結構預測。
  • 解決生物學50年來重大挑戰 生物界"AlphaGo"精準預測蛋白質結構
    拿它預測的結構與實際結構對比,可以看到基本完全吻合(下圖,綠色是實驗得到的實際結構,藍色是計算預測結構)。 在過去,人們一直是通過實驗室來了解蛋白質的結構。比如,使用X射線束照射結晶的蛋白質,並將衍射光轉化為蛋白質原子坐標,由此掌握蛋白質的第一個完整結構。 除了實驗,隨著計算機的發展,該項技術在上世紀末便已用於預測蛋白質的結構,但效果並不理想。
  • AI成功預測蛋白質3D結構
    CASP 也被認為是蛋白質結構領域「奧林匹克競賽」。 「蛋白質摺疊」是一種令人難以置信的分子摺紙形式,它非常神秘,是一個具有深遠意義的問題,在科學界之外很少有人討論。所有生物都是由蛋白質構成的,蛋白質的結構決定了它的功能。當 AI 了解了蛋白質的摺疊方式,我們可以期待人類進入科學和醫學的新時代。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    「我們的目標從來就不是贏得圍棋或雅達利比賽的勝利,而是開發能夠解決蛋白質摺疊這類問題的算法,」Hassabis 表示。值得一提的是,AlphaFold 關注從頭開始建模目標形狀,且並不使用先前已經解析的蛋白質作為模板。AlphaFold 在預測蛋白質結構的物理性質上達到了高度的準確性,然後基於這些預測可以使用兩種不同的方法預測構建完整的蛋白質結構。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    在過去的幾年裡,DeepMind公司開發的人工智慧AlphaGo已經在西洋棋和圍棋比賽中取得了超越人類的表現。而如今,DeepMind又向推動和加速新科學發現上邁出了重要的一步。前幾天,DeepMind宣布推出全新的AlphaFold系統,能夠預測並生成蛋白質的3D結構。
  • 蛋白質結構預測模型抗疫
    作者:DIGITIMES劉慧蘭隨著COVID-19(新冠肺炎)疫情蔓延全球,近幾年憑藉AI擊敗世界頂尖圍棋和星海爭霸II(StarCraft II)遊戲高手的DeepMind也加入抗疫行列。科學家們在測試病毒及開發疫苗之前,必須先了解病毒的運作方式,尤其是病毒的蛋白質結構,這樣的過程通常需耗時數個月,且未必能有結果。近年來,研究人員已使用DeepMind的深度學習系統AlphaFold來進行計算機預測。DeepMind一直在優化AlphaFold系統並增強其功能。
  • 又一AI工具在全球賽事中擊敗人類 成功預測蛋白質結構
    雖然蛋白質可在短時間中從一級結構摺疊至立體結構,研究者卻無法在短時間中從胺基酸序列計算出蛋白質結構,甚至無法得到準確的三維結構。事實上,科學家們估計,由於胺基酸之間相互作用的數量無法計算,要想確定一種典型蛋白質的正確結構,需要花費138億年以上的時間才能弄清其所有可能的結構。幸運的是,這是一份適合人工智慧(AI)的工作。
  • DeepMind 團隊 CASP 奪冠:用 AlphaFold 預測蛋白質結構
    原標題:DeepMind 團隊 CASP 奪冠:用 AlphaFold 預測蛋白質結構 雷鋒網 AI 科技評論按:在 2016 年和 2017 年,谷歌旗下 DeepMind 團隊的研究成果 AlphaGo 可以說是科技界當之無愧的焦點。
  • AI破解蛋白質摺疊難題,施一公等結構學家未來的創新點將在哪裡?
    要知道,AlphaGo面對的圍棋問題複雜度也就是10^171,蛋白質摺疊問題比圍棋複雜度高出129個數量級!在自然界中,蛋白質的胺基酸鏈,可以自發摺疊成無數令人難以想像的形狀,有些甚至在幾毫秒之內完成。大多數生物過程都圍繞蛋白質,而蛋白質的功能是極其依賴其3D結構的,即只有我們知道蛋白質是如何摺疊時,我們才能說真正知曉蛋白質的功能了。
  • 生物界AlphaGo精準預測蛋白質結構
    提到DeepMind公司,我們首先想到的可能是幾年前,它開發的人工智慧AlphaGo「橫掃」頂尖人類圍棋職業選手,變革了圍棋的思考方式。除了在棋類比賽中所向披靡以外,DeepMind也在加速科學發現上邁出了重要一步。
  • DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分
    CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。通過重複這一過程,該系統對蛋白質的潛在物理結構進行了強有力的預測,並能夠在幾天內確定高度準確的結構。X射線晶體結構,但是一直無法解釋它。
  • 騰訊AI Lab 聯合研究登上Nature子刊,獨創方法提升蛋白質結構預測...
    通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。