AI再發力,解決困擾生物學家近50年的一個基本問題

2020-12-23 澎湃新聞

原創 陸修遠 十點科學

下圍棋、打電競都不算啥,現在,AI 開始搶生物學家飯碗啦。

蛋白質的摺疊,好似摺紙,不同結構決定了不同功能。而AI似乎覷得了其中秘密。|DeepMind

作者|陸修遠

我們的生命離不開蛋白質。蛋白質是一切生命活動的基礎物質,它是運輸氧氣的載體,是幫助抵禦病毒的抗體,也是消化食物的酶。蛋白質之所以能夠承擔多種多樣的功能,很大程度上是因為它們具有豐富而複雜的空間結構。

可是,蛋白質如何摺疊成這些獨特的形狀呢?這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。而就在最近,谷歌開發的人工智慧系統 AlphaFold 將蛋白質結構預測的準確度提高到了原子水平,可以說基本解決了這個「蛋白質摺疊問題」。 這比許多科學家的預期還要早幾十年,顯示出 AI 對解決重大科學問題的潛力。

01.

困擾科學家近50年的難題

蛋白質佔據我們每個人體重的大約20%,是除水分(60%)以外第二多的物質種類,其它的脂質、碳水化合物、核酸以及各種無機物加起來,也僅僅佔到20%。蛋白質在人體中含量如此之高並不奇怪,因為蛋白質是生命活動的主要承擔者,沒有蛋白質就沒有生命。

人類的生命活動須臾都離不開蛋白質的參與。無論是身體收縮肌肉、眼睛感知光亮,還是消化系統將將食物轉化為能量,我們身體的每一項功能之所以能夠正常行使,幾乎都依賴於蛋白質。

生命的每一項活動都依賴於蛋白質。左下為紅細胞,右下為抗體蛋白。|圖蟲創意

目前地球上已知的蛋白質大約有兩億種,每一種蛋白質都有獨特的空間結構。蛋白質在生物體中能夠發揮多種多樣的功能,很大程度上取決於它們的三維結構。

例如,我們免疫系統中的抗體蛋白是「Y形」的,並且會形成獨特的鉤狀,這使得它們能夠附著在病毒和細菌上,檢測和標記致病微生物,將其徹底消滅。膠原蛋白的形狀像擰起來的繩索,因而能夠在軟骨、韌帶、骨骼和皮膚之間傳遞張力。還有在被稱為「基因魔剪」的 CRISPR-Cas9 基因編輯技術中,Cas9 蛋白質利用 CRISPR 基因序列作為嚮導,像剪刀一樣靈巧地剪切和粘貼 DNA 片段。

然而,確定蛋白質的空間結構一直是生物學中的巨大挑戰。1972年,也就是將近50年前,諾貝爾化學學獎得主 Christian Anfinsen 就猜測,蛋白質的胺基酸序列應該可以完全決定其空間結構。可是要如何根據蛋白質的胺基酸序列來確定它的空間結構呢?這就是困擾科學家們近50年的「蛋白質摺疊問題」。

02.

蛋白質如何將自己摺疊起來?

蛋白質就像是一臺精心組裝的機器,它的零件是我們身體內的20種胺基酸。在基因編碼合成胺基酸序列的過程中,一個個胺基酸分子遵照基因序列中蘊含的遺傳信息指令,像珠子一樣有序綴連起來,形成多肽鏈,構成蛋白質的一級結構。

然而,通常的機器只要按照設計圖將零件組裝起來就可以運轉,而胺基酸分子連接成多肽鏈後,蛋白質分子的建造還沒有結束,它還需要進一步摺疊出空間結構才能發揮功能。可是基因序列只決定胺基酸序列的合成,並不包含更多信息指導它如何摺疊成獨特的三維結構。

事實上,胺基酸序列的摺疊方式蘊含在自身之中,它們自己設計自己如何摺疊。一維多肽鏈中的胺基酸分子像是懂得彼此溝通一樣,它們有些相互排斥,有些彼此吸引,形成螺旋、摺疊成褶皺,構成蛋白質的二級結構。接著,它還會進一步摺疊成獨特的空間結構,像一根毛線繞成線團那樣,構成蛋白質的三級結構。

胺基酸連接形成一維的多肽鏈,然後進一步摺疊形成具有獨特三維結構的蛋白質。有些時候,還會形成更複雜的四級結構。|DeepMind

整個蛋白質摺疊的過程看似隨機,卻又仿佛遵循著一張設計藍圖,一旦組成蛋白質的胺基酸序列確定下來,它的摺疊方式也就完全確定了。這實際上很符合直覺,我們可以想像,如果同樣的胺基酸序列可以摺疊成不同結構的蛋白質,發揮不同的功能,我們的身體內部會陷入怎樣的混亂狀態。

自然界經過漫長的生命進化過程,蛋白質分子在一眨眼之間就能夠自發地完成整個摺疊過程。但科學家們發現,如果想要通過計算胺基酸分子間的相互作用來預測它們如何摺疊,那麼要窮盡所有可能的蛋白質構型,需要的時間將比整個宇宙年齡還要長。

這個問題困擾了科學家們很長時間。但是在人工智慧進入這個領域後,預測蛋白質摺疊的準確性很快獲得提升。

03.

AI出手!精確預測蛋白質結構

人工智慧(AI)的一種實現手段是時下流行的機器學習。2016年打敗人類圍棋冠軍的AlphaGo和此次預測蛋白質結構的AlphaFold,利用的都是機器學習算法。它的大致思路是,先將大量已有的數據——包括結果(比如圍棋棋譜、貓狗圖片等)輸入計算機,然後計算機對這些數據進行分析,利用它驚人的計算能力從這些數據中尋找特徵或規律 。這樣,對於以後輸入的新數據,它就能作出「富有經驗」的高明反應了。

2016年,人工智慧阿爾法狗(AlphaGo)打敗圍棋九段李世石。2017年,進化的阿爾法狗又讓天才圍棋少年柯潔碰了壁。圖為李世石。|來自網絡

更為先進的人工智慧算法甚至允許只輸入很少量的學習樣本,就能掌握相關技能。比如AlphaGo的升級版本根本不需要輸入棋譜,只要知道圍棋的規則,就能根據算法對規則進行自我摸索和訓練,通過自己跟自己對弈,最終獲得超越人類頂級圍棋高手的能力。

AlphaFold解決蛋白質摺疊問題的過程與AlphaGo學習下圍棋的過程類似,只不過輸入的是大量蛋白質的序列和結構數據——這些數據來自實驗室中實際測得的數據。AlphaFold從中找尋胺基酸分子之間的相互作用、蛋白質片段之間的演化關係,從而獲得了預測蛋白質結構的強大能力。最終,只要知道蛋白質的胺基酸序列,就能迅速而準確地預測出它的結構,相當於通過精妙的算法,將蛋白質的一級結構和三級結構準確地聯繫了起來。

AI 通過精妙的算法,由胺基酸序列(最左)即可預測出蛋白質結構(最右)。|thenewstack

在2018年的蛋白質結構預測競賽 (CASP)中,AlphaFold 在所有參賽團隊中排名第一,準確地從43種蛋白質中預測出了24種蛋白質的結構,取得了前所未有的進步。

到了2020年,AlphaFold的升級版本從生物學、物理學和機器學習領域的最新進展中汲取靈感,升級算法,再次以壓倒性的優異成績奪冠。這一次,AlphaFold預測的多種蛋白質結構與實驗結果僅僅存在原子尺度的細微差異,達到了與傳統的試驗方法相媲美的程度,可以說AlphaFold基本解決了蛋白質摺疊問題。

04.

生物學家要失業了嗎?並未!

AlphaFold取得裡程碑性質的進展,讓人類有望在諸多領域得到來自AI的切實助力。例如在醫藥領域,阿爾茨海默症、帕金森症候群、亨廷頓症候群等神經系統病變都與蛋白質的錯誤摺疊有關,這直接導致蛋白質結構和功能出現異常。而AI的介入將讓人類更有效地了解這些錯誤摺疊背後的機理,從而提出更加有效的治療方案。

還有這次疫情。新冠病毒大約由 30 種蛋白質組成,在 CASP14 競賽中,AlphaFold 精確預測了其中一種蛋白質(ORF8)的結構。|Fusion Medical Animation

工業領域同樣會受到這一成就的積極影響。以酶化工為例,多種蛋白酶已經作為反應催化劑獲得了廣泛應用。其中很多種都是人類近年才發現的新型蛋白質,它們個個身懷絕技,有些能夠分解原油、有些能夠降解塑料。對於這些蛋白質的結構和催化機理,我們目前都只有非常初步的認識,AI無疑將大大加速相關研究的進展。

有趣的是,在聽聞AlphaFold解決了蛋白質摺疊問題的消息後,很多人調侃說,結構生物學家以後要失業了。不過事實上,AlphaFold只是為結構生物學家們提供了獲得蛋白質結構的一種手段,正如傳統的核磁共振、X射線衍射和冷凍電鏡方法一樣。這些特定結構在生命體中如何發揮功能,才是更需要結構生物學家們回答的問題。

如著名結構生物學家顏寧所言,結構只是用來做出生物學發現的手段。比如弄清楚剪切體這個龐然大物的結構之後,由此揭示出「幾百個蛋白質如眾星捧月般簇擁著RNA,一剪子一鉤針地剪接 DNA 序列中的內含子和外顯子」,這個過程才是真正的神奇。

除了預測蛋白質結構,AlphaFold 也將促進蛋白質設計的發展。在未來,AI或許可以幫助人類根據自身獨特需要,創造出自然界中原本不存在的蛋白質。屆時,必將是生命科學的一次飛躍。

作者|陸修遠 大阪大學免疫前沿中心

審稿|李劍南 大阪大學蛋白質研究所

編輯 | 陳天真

責編 | 高佩雯

參考連結:

https://www.deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

https://www.deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery

[ AlphaFold 視頻簡介 ]

文章由「十點科學」(ID:Science_10)公眾號發布,轉載請註明出處。

原標題:《AI再發力,解決困擾生物學家近50年的一個基本問題》

閱讀原文

相關焦點

  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    CASP14 組織者、年近七旬的 UC Davis 科學家 Andriy Kryshtafovych 在大會上感嘆道,I wasn't sure that I would live long enough to see this(我活久見了)[1]。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    原來是結構生物學,迎來了一個「革命性」的突破。11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。而過去十幾年,其他方法只能在40分左右徘徊。
  • 一個小手術解決了困擾患者8年的老毛病
    困擾港城居民8年的老毛病,居然被軍工醫院五官科的小手術解決了,為此患者張先生樂壞了。32歲患者張先生,8年前出現鼻塞,頭痛症狀,偶有鼻出血,經藥物治療有所好轉。然而8年間,他鼻塞頭痛症狀反覆發作,近一個月來症狀更加嚴重,不得已就診於軍工醫院五官科。經鼻內窺鏡、鼻竇ct等檢查,軍工醫院五官科主任王勝軍診斷張為鼻中隔偏曲,為他進行了鼻中隔偏曲矯正術,順利解決了張先生8年的困擾。
  • 困擾數學家50年的問題,竟被博士小姐姐用一周業餘時間解決了
    斯人已逝,但他留給了世界豐富的知識遺產,最知名的莫過於「生命遊戲」,還有一個困擾數學界50年的難題「康威扭結」(Conway Knot)。令人意想不到的是,最近這個問題被德州大學奧斯汀分校的一位博士小姐姐Lisa Piccirillo解決了,而且她只用了一周的業餘時間。
  • 困擾多數女孩的問題,腰腹兩側的贅肉,這幾個動作成功解決
    困擾多數女孩的問題,腰腹兩側的贅肉,這幾個動作成功解決現在的多數女孩肚子和大腿上基本都有贅肉,而且由於久坐的原因,身材比例變得十分不協調,為了改變這種現狀,還有不少人買了減肥藥來吃。任何東西都不是隨隨便便就能得到的,而且還要嚴格制定一個計劃表,每天哪個時間段進行鍛鍊,那麼就必須嚴格按照這個表來執行。首先在決心上就要有高度的自律,不要想著動不動就半途而廢,只要有了這樣的心理事情才能做到事半功倍。在網上看到的動作這幾個都還挺適合在家裡做,只需要有個瑜伽墊就能搞定:1.
  • 託馬斯·弗裡德曼:AI解決不了的問題,印度客服上!
    普立茲獎終身評審、專欄作者託馬斯·弗裡德曼於2019年2月26日在《紐約時報》刊文:《人工智慧目前仍然需要人類智慧的支持》上周,24/7的創始人P.V.坎南和夏姆加·納加拉漢邀請我故地重遊,給他們的紀錄片增加一些新的內容。現在,他們的公司已經更名為[24]7.ai。服務大廳非常安靜,公司也鼓勵運營人員播放自己的音樂。
  • 困擾佳能用戶的一個老問題終於解決了
    (懇請大家在淘寶搜索"一點點驚喜")背景知識佳能從2015年2月開始引入LP-E17,標稱規格為7.2V 1040mAh(約7.5Wh)。那你說我買原裝電池不就沒有這些困擾了麼?說來奇怪,LP-E17原裝電池自問世之後就長期處於缺貨狀態。此前750D、760D配送了一批,再之後就很難見到原包零售產品了。↓京東自營旗艦店無SKU↓
  • 濰坊金寶生態花園業主被困擾近3年
    在用水尖峰時段頻頻停水 問題困擾業主近3年在金寶生態花園某多層居民樓的6樓,記者來到了譚先生家中,一提到這頻繁停水的問題,他說自己的心情完全可以用「不勝其煩」來形容。「有時早上7點多就停水,中午11點往後又停,到了晚上七八點鐘這水還得再停,而這停水的時間和頻率都不確定,什麼時候來水也是個未知數。」
  • Cydia再次更新了,困擾多年的問題終於解決!
    在不少越獄用戶反映Cydia1.1.28版有問題之後,Cydia之父Saurik今日再次出手,一天之內替Cydia更新了2次,這兩次的更新最主要問題就是解決用戶載入與插件源錯誤問題
  • 近九成大學生被皮膚問題困擾 解決「容貌焦慮」還需健康生活方式
    石素馨的皮膚過敏已經困擾了她好幾年。高二時,她鼻子兩側的臉頰突然特別容易泛紅,皮膚發燙、發癢、起皮,總想用手去撓。這個看起來芝麻大點的小問題,讓她輾轉四五家醫院。在一家美容機構,一位護理師用尖尖的小針戳破她臉上的痘痘,再用一個小圓鐵環用力擠痘痘,另一位護理師把她的肩膀死死地按在床上,防止她亂動。劉敏希疼得哇哇大叫,唯一支撐她的,是擺脫痘痘、「變得和別人一樣」的期待。  劉敏希著急,爸媽比她更急。「我從來沒想過一個中年男性會對美容院這麼了解。」爸爸對這件事的上心程度讓她驚訝。
  • 打球要輪圓了打,是鞭打,不是抽打,學會畫圈,就會解決發力問題
    打球要輪圓了打,是鞭打,不是抽打,學會畫圈,就會解決發力問題 2020-04-03 19:18  羽毛球技術圈TB
  • 滅蟑螂公司|2次作業徹底將蟑螂困擾問題解決
    家裡有蟑螂怎麼辦,面對密密麻麻、令人頭皮發麻的蟑螂大軍,應該如何處理,上海專業除殺蟑螂公司奔奔蟲控幫你快速解決打不死的小強,讓你再無蟑螂困擾! 家裡有很多蟑螂應該怎麼辦,奔奔蟲控幫你解決小強困擾問題 你是否覺得這樣的場景只有在影視中才能看到?
  • 河南新野:查擺問題找短板 脫貧攻堅再發力
    趁著天氣上難得的時機,上港鄉召集鄉黨政領導班子成員、4個村第一書記、16個村支部書記、扶貧專幹、鄉直部門負責人,召開「脫貧攻堅排查整改專題匯報會」,集中查擺問題,找準短板,以時不我待的危機感和捨我其誰的勇氣,謀思路、話出路,加壓增責,脫貧攻堅再發力,奮力奪取新勝利。
  • 都在說GPT-3和AlphaFold,2020沒點別的AI技術突破了?
    報告認為,2020年是巨大飛躍的一年。從OpenAI的GPT-3,再到AlphaFold,都是令人振奮的成就。與此同時,數據科學在機器學習、自然語言處理(NLP)、計算機視覺等領域中蓬勃發展。與傳統的計算機視覺模型不同,DETR將目標檢測問題作為NLP模型中的預測問題來解決。Facebook聲稱DETR是「一種重要的目標檢測和全景分割新方法」。它包括一個基於集合的全局損失,該損失使用二分匹配以及一個Transformer編碼器-解碼器體系結構來強制進行唯一的預測。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    七八月50餘項能力的開源開放及升級,是夏日火熱的積澱,希望可以幫助您更高效實現產業智能化應用落地,快來一同閱讀您最關心的內容吧。fbx 文件,配合自定義設計模板,以實現擬人、卡通、動漫等多樣的風格建模效果,解決批量個性化建模問題。
  • 美軍新1艘瀕海艦服役 將解決令人困擾的可靠性問題
    作者署名:小新根據外國媒體《防務新聞》報導,當地時間周六,美國海軍最新一艘瀕海戰鬥艦加入現役,以解決該艦令人困擾的可靠性問題,並為今後幾年使小型水面戰鬥人員發揮作用開闢道路。一項高水平的努力正在進行中,以解決其複雜的高速驅動系統的問題,這些問題限制了船舶的任務可用性,並最終實現其長期延遲的任務包。任務包將使這些船要麼成為水面戰船體,要麼是一艘掃雷艦,要麼是一艘反潛艦。
  • 解決了「散裝衛生巾」,也解決不了月經問題
    更有趣的是,還讓我們見識到了神秘而自信的男人們是如何對女性在衛生巾問題上指點江山的。但是,關於女性月經的問題,是全靠衛生巾可以解決的嗎?即使真有一天,月經用品都免稅了,甚至免費了,女性就不會再因為月經苦惱了嗎?
  • 了不起的成就,中國貧困農民基本解決溫飽問題
    了不起的成就,中國貧困農民基本解決溫飽問題 2001年5月26日18:15 羊城晚報   江澤民總書記在中央扶貧開發工作會議上指出:國家「八七」扶貧攻堅計劃已基本完成,黨中央、國務院確定的在上個世紀末基本解決農村貧困人口溫飽問題的戰略目標已基本實現。
  • 曾困擾國乒幾代人的技術難題:有歐洲人想了個辦法,但沒解決問題
    早在1979年平壤世乒賽男團決賽,中國桌球男隊三位出戰的直拍選手便受到了歐洲桌球傳統強隊——匈牙利隊的三位橫拍選手的阻擊,最終以1比5告負。當年我們輸球的一個很大原因,就是反手被對方所壓制。在這之後的數十年裡,直拍反手位的技術改良成為了國乒一直苦心研究的難題,困擾了一代又一代的專業運動員和業餘桌球迷朋友,甚至是世界冠軍。
  • 道金斯:一個生物學家的世界觀 | 溪山線上讀書沙龍
    1962 年從牛津畢業以後,道金斯師從尼可拉斯·廷伯根( Nikolaas Tinbergen,著名動物行為學家, 1973 年諾貝爾生理學獎得主)門下,在加州大學伯克利分校教了一段時間書, 1971 年重回牛津。有關社會生物學的想法在那時便已露雛形,幾年後,便成了眾所周知的《自私的基因》。