下圍棋的 DeepMind 成了「藥神」,這事兒和你我都有關

2020-12-10 極客公園


AI 介入醫學讓救治變得更高效,同時也在顛覆人類認識科學的方式。

「這將改變醫學,改變研究,改變生物工程,」生物學家 Andrei Lupas 這樣評價 Alphabet 旗下的 DeepMind 最新推出的蛋白質結構預測 AI——AlphaFold 2。

「它將改變一切。」最後這句話直接被《自然》雜誌用作封面標題。

Lupas 之所以這麼說,因為他本人花了十年時間,用盡各種實驗方法也沒能弄清楚一種蛋白質摺疊後的形狀,但藉助 AlphaFold 2 後,他在半個小時內就看清了那團彩色的,像是被手掌捏出特定形狀的「珠子項鍊」。

蛋白質會摺疊成特別的三維形狀,很像「珠子項鍊」|視覺中國


知道「珠子項鍊」摺疊後的三維形狀至關重要,因為它決定了蛋白質如何工作。開發新藥的科學家要是能知道蛋白質的形狀,或許就能幫助他想出可以與蛋白質結合的分子。分子一旦和蛋白質結合,就能改變它,從而治癒疾病。

以新冠為例,科學家一直在試圖研究新冠病毒表面的刺突蛋白是如何與人類細胞中的受體相互作用的。而像老年痴呆症這種由錯誤摺疊的蛋白質引起的疾病,人們一旦看清了蛋白質的結構,就能在現有的藥物中快速匹配治療或者嘗試新的療法。

儘管學界都知道蛋白質結構至關重要,但要弄清楚卻不是件容易的事情,如今人工智慧的成熟應用給了預測蛋白質結構另一種可能。

在有著「蛋白質奧林匹克競賽」之稱的國際蛋白質結構預測競賽(CASP)上,AlphaFold 2最終擊敗其他人類選手,拿到了冠軍。談及這個 AI 模型預測的準確性,有的參賽者甚至沮喪地說,「我懷疑很多人會離開這個領域,因為核心問題可以說已經解決了。」

科技圈同樣興奮不已,Google CEO Sundar Pichai、斯坦福教授李飛飛和特斯拉 CEO 埃隆·馬斯克第一時間在社交媒體上轉發祝賀。


困擾了學界 50 年的難題

1972 年的諾貝爾化學獎得主 Christian Anfinsen 最早提出,胺基酸(珠子)按照一定順序排列,會讓蛋白質(項鍊)形成一個固定的三維結構。而基於「珠子」的序列可以計算並預測「項鍊」會扭成什麼形狀。

蛋白質對生命體而言至關重要。幾乎所有疾病,包括癌症、痴呆症都與蛋白質的功能有關。蛋白質的功能完全取決於它的三維結構形狀,而蛋白質功能則關係著我們健康與疾病的一切。因此,了解了蛋白質的三維結構有助於人們設計新藥、防治疾病,無論是遺傳疾病還是感染疾病。

但蛋白質「項鍊」能摺疊出數以億計的形狀,對其結構的預測就成了一件有著巨大挑戰的難題。

1969 年,美國分子生物學家 Cyrus Levinthal 指出,用暴力計算法列舉一個典型蛋白質的所有可能構型所需的時間比已知宇宙的年齡還要長,他估計一個典型蛋白質有 10^300 種可能構型

現實中,目前人類只是試圖破解一種蛋白質的形狀就需要數年的時間,和昂貴的儀器設備。科學家們在實驗室中一般使用諸如 X 射線晶體學(X-ray crystallography)和核磁共振光譜法(NMR spectroscopy)這樣的傳統技術確定蛋白質的三維結構,以了解蛋白質分子中每一原子的相對位置。

從 1994 年開始,每兩年就會舉辦一次國際蛋白質結構預測競賽(CASP),評審團會拿科學家團隊用電腦所預測的蛋白質結構與使用實驗室方法得出的三維結構結果進行比較。

例如,華盛頓大學的 David Baker 開發了一套名為「Rosetta」的電腦程式來預測蛋白質結構。他的思路是:如果能夠窮盡兩兩胺基酸分子之間所有可能的位置及其對應的能量狀態,就能得到蛋白質結構了。但現實挑戰是,目前計算機的計算能力並不足以支撐這種窮舉,一旦遇到複雜的蛋白質,這套程序就不適用了。

AlphaFold 和 AlphaFold 2 的分數對比|nature


2016 年以前,CASP 大賽中最高預測分數最高也只到了 40GDT 左右,離代表實驗室結果的 90GDT 還有很大差距。美國時間 11 月 30 日,DeepMind 的 AlphaFold 2 在評估中的總體中位數得分達到了 92.4GDT。想比兩年前的 AlphaFold,AlphaFold 2 刷新了記錄,從 60GDT 一躍上升為 92.4GDT。

「在某種意義上,難題已經被解決了。」CASP 的共同創始人 John Moult 告訴《自然》。


AI「畢業了」

第一版的 AlphaFold 雖然刷新了 CASP 的紀錄,但卻沒能激起很大的水花,因為它並不算真正的 AI 完全體,它還借鑑了上面提到的「Rosetta」等電腦程式的成果。但 AlphaFold 2 就不一樣,它是一個 AI 完全體。AlphaFold 2系統所使用的數據,來自包括約 17 萬個蛋白質結構,以及未知結構的蛋白質序列的大型資料庫。在訓練時,它使用了大約 128 個 TPU v3 內核(大致相當於 100-200 個 GPU),並僅運行了數周。

「從 17 萬個已經知道三維結構的蛋白質分子中,科學家們挑一個,把它的胺基酸序列信息『餵』給算法,算法大致『猜測』出一個三維結構。然後,算法把它的猜測和已知的三維結構進行對比,並且根據猜測的結果是不是靠譜,繼續調整猜測的策略。這樣反覆用 17 萬個三維結構訓練,算法逐漸就獲得了直接從胺基酸序列預測蛋白質三維結構的能力。」浙江大學生命科學研究院教授王立銘「簡化」了 AlphaFold 系統的運行過程。

他還認為,用 AI 預測蛋白結構實際上是在踐行這樣一種思路:既然我們知道胺基酸的順序決定了蛋白質的三維結構,有沒有可能不做實驗,直接從胺基酸的順序出發,推測蛋白質分子的三維結構呢?

目前人類知道胺基酸順序的蛋白質分子有 1.8 億個,其中三維結構信息被徹底看清的只有 17 萬個,還不到 0.1%。僅僅通過耗時耗錢的實驗顯然是「杯水車薪」。

BBC 記者 Helen Briggs 表示,AI 的學習速度驚人,它用幾天的時間就能達到實驗室幾十年的研究水平。

但要實現這樣高效的研發,DeepMind 必須與科學家分享這項 AI 技術。DeepMind 的聯合創始人兼 CEO Demis Hassabis 表示,先讓 AlphaFold 變得更有用,以便之後科學家們使用。此前,DeepMind 公布了第一版 AlphaFold 足夠多的技術細節,讓科學家們複製這個 AI 預測的方法。

目前,DeepMind 還沒有公開關於 AlphaFold 2 的更多技術細節,和未來知識共享的計劃。但這個全新的 AI 模型已經讓科學界和科技圈激動不已。

過去幾年,DeepMind 靠旗下的電競 AI AlphaStar 和圍棋 AI AlphaGo「出圈」。它們在《星際爭霸》和圍棋策略遊戲中碾壓了職業玩家。而現在,DeepMind 似乎要「畢業」了,不只在遊戲中證明自己的智慧,開始解決具有現實世界意義的科學問題。而這些問題,生死攸關。

王立銘教授幻想了這樣一個場景:「一名癌症患者找到醫生,醫生測定了他體內腫瘤細胞的基因序列,發現他體內某一個特殊蛋白質發生了變異,因此導致了癌症。同時,醫生還能對這種特殊蛋白質進行結構預測,有針對性地設計一個藥物與之結合,破壞其功能,從而治療癌症。所有這一切只需要幾天時間。」在未來,疾病的診斷和治療將變得高度個性化。

更重要的,AI 介入醫學讓救治變得更高效,其實也在顛覆人類認識科學的方式。

通過「暴力」訓練,前幾年的 AlphaGo Zero 甚至可以做到,只需要知道圍棋的基本規則,比如怎麼吃子、怎麼判斷勝負,就可以在完全無視人類所有經驗的條件下學成絕技。人類之前在小樣本中歸納、演繹、總結再實踐的過程被顛覆了,現在是這些經驗有時候並非完全必需,只要有足夠多數據,AI 就能直接算出結果。

「只要那些複雜問題需要巨大的組合空間搜索能力才能解決;具有需要優化的明確目標函數;具有大量數據或者具有一個準確有效的模擬方法。」AlphaFold2 研究團隊說道,「那它們就能被 AI 一一破解。」


本文作者:biu

題圖來源:DeepMind

責任編輯:於本一

本文由極客公園 GeekPark 原創發布,轉載請添加極客君微信 geekparker。


相關焦點

  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    除了官網上的簡單介紹,作為 DeepMind 圍棋大使、AlphaGo 的「教練」,樊麾也在其個人微博上宣布「AlphaGo 教學工具終於上線。」他表示,教學工具共有兩萬多個變化,三十七萬多步棋組成,通過 AlphaGo 的視角,分析並建議圍棋開局的諸多下法。
  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    例如,胰島素如何控制血液中的糖水平以及抗體如何對抗冠狀病毒,都由蛋白質的結構來決定。我們都知道,DeepMind以戰勝人類而著名,在西洋棋,圍棋,星際爭霸II和老式的Atari經典遊戲中都佔據了上風。
  • 「燒錢機器」DeepMind持續多年虧損後,仍無商業...
    DeepMind聯合創始人胡馬延謝赫(Humayun Sheikh)曾表示,「如果不是谷歌以6億美元的價格收購, DeepMind人工智慧實驗室可能已經破產。」自2014年被收購以來,DeepMind的巨額研發資金和虧損全部由Google來買單。不過在長期虧損之下,今年的DeepMind在財務方面似乎也有了一些好消息。
  • DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分
    原來是結構生物學,迎來了一個「革命性」的突破。這一巨大的突破,直接引爆了全網,Nature、Science紛紛報導,生物界和AI大牛們也紛紛祝賀。首先,研究人員把摺疊的蛋白質認為是一個「空間圖」,其中殘基是節點,邊緣連接著非常接近的殘基。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    「對於我們來說,這真的是一個關鍵時刻,」DeepMind 聯合創始人兼 CEO Demis Hassabis 表示,「這個項目就像燈塔,這是我們關於人和資源的首次重大投資,用於解決一個根本性的、現實世界的重要問題。」
  • Google DeepMind 團隊發布新算法,下一個被 AI 虐哭的是誰?
    如果此前 AlphaGo 版本是靠著機器學習和算力的一力降十會的話,此次的新算法就是雙手互搏,無師自通,不光如此,MuZero 的 「魔爪」從圍棋伸向了各個領域,包括西洋棋、日本的將棋和 Atari 電子遊戲。你冬練三九夏練三伏,別人一出世就自帶超強自學能力,而且人家全家輸的次數屈指可數,還都是輸給自己人,你說這比賽讓人怎麼打?
  • AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
    機器之心報導參與:張倩、蛋醬、杜偉最近,一款名為「Foldit」的遊戲風靡全球。在這款遊戲中,玩家可以在線幫助研究人員尋找具有對抗新型冠狀病毒潛力的蛋白結構,其本質是充分利用所有可利用的人力、算力。幾乎滲透到我們身體的每一個功能——收縮肌肉,感知光線,或將食物轉化為能量——都可以追溯到一種或多種蛋白質,以及它們是如何運動和變化的。任何給定的蛋白質能做什麼取決於它獨特的 3D 結構。例如,構成我們免疫系統的抗體蛋白是「Y」形的。通過與病毒和細菌結合,抗體蛋白能夠檢測並標記致病微生物並進行消滅。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    鄭集楊 發自 凹非寺量子位 報導 | 公眾號 QbitAI一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。這個案例已被YouTube Original拍攝成紀錄片《The Age of A.I》的一部分,片中患有肌萎縮性側索硬化症(ALS )而無法正常說話的前橄欖球運動員Tim Shaw,在谷歌及deepmind團隊的幫助下,不僅可通過自己模糊的聲音轉換成精準的文字,還可以根據輸入的文字模擬自己患病前的正常聲音進行發聲。
  • DeepMind破解蛋白質摺疊難題
    以戰勝人類而著名,在西洋棋,圍棋,星際爭霸II和老式的Atari經典遊戲中都佔據了上風。蛋白質摺疊50年來重大突破,AI破解預測難題蛋白質的形狀與其功能密切相關,預測蛋白質結構的能力可以幫助我們更好地理解蛋白質的功能和工作原理。世界上許多重大的挑戰,比如發展疾病的治療方法或者找到分解工業廢物的酶,從根本上來說都與蛋白質及其所扮演的角色有關。
  • 深度學習之Google Deepmind的Alphago人工智慧算法技術演變歷程
    一、簡介有些人會有如下質疑「Alphago都用了蒙特卡洛搜索樹了,這變成了一部分搜索問題了並不是人工智慧算法了或者說不夠智能了」,但我的拙見是人在思考問題的時候除了直覺、經驗判斷、邏輯推理之外也會去枚舉、搜索,所以我覺得算法包含一部分搜索並不能直接說該算法這不夠智能或者這不是智能算法了
  • 「國產狗」勝「日本狗」,圍棋龍星戰騰訊絕藝報「一箭之仇」
    「圍棋龍星戰(AI RYUSEI)」,從名字可以看出這場比賽參賽的選手不是人類,而是 AI。DeepZenGo 獲得亞軍,而中國的「天壤」(來自天壤智能)和「神算子」(來自清華)分別取得第三和第五的成績。絕藝是誰?如果是圍棋界的人士,可能對絕藝已經非常熟悉;而非圍棋界的人士,可能除了 AlphaGo 外,並不知道還有這麼一個「國產狗」絕藝。
  • DeepMind AlphaStar:Demo很強大,但比賽輸了
    看來,人工智慧在徵服這個「最複雜遊戲」的過程中還需要學會應對很多戰術和突發情形。在全球首場星際爭霸 2 的「人機大戰」中,AI 和人類玩家都使用了神族。人工智慧表示:Pimba,所以我用神族(其實當然不是了,是因為神族的兵種最容易計算)。
  • Deepmind AMA:關於最強ALphaGo如何煉成的真心話,都在這裡了!
    由於在AMA前一天Deepmind剛剛發表了《Mastering the game of Go without human knowledge》(不使用人類知識掌握圍棋)的論文,相關的提問和討論也異常熱烈。什麼是AMA?AMA(Ask Me Anything)是由Reddit的特色欄目,你也可以將其理解為在線的「真心話大冒險」。
  • 升級版AlphaGo 5月決戰柯潔,DeepMind揭秘計算機全新棋風
    據機器之心現場了解,中國圍棋協會和浙江省體育局攜手谷歌三方將聯合主辦「中國烏鎮·圍棋峰會」。本次峰會將從 5 月 23 日至 27 日在浙江烏鎮展開,除 AlphaGo 與柯潔的三番棋對戰之外,還將舉辦配對賽和團體賽兩場形式不同的交流比賽。
  • DeepMind新GNN模型,將谷歌地圖預估到達準確率提升50%!
    例如,儘管上下班尖峰時間都會發生在早上、晚上,但具體的確切時間可能每天、每月都有很大差異;一條小巷的擁堵,就會蔓延到下一個大路——這一點,地圖往往無法實時監控;另外,道路質量、限速、事故和封路等因素,都會給預測模型帶來麻煩。
  • 『燒錢機器』DeepMind持續多年虧損後,仍無商業...
    DeepMind聯合創始人胡馬延•謝赫(Humayun Sheikh)曾表示,「如果不是谷歌以6億美元的價格收購, DeepMind人工智慧實驗室可能已經破產。」自2014年被收購以來,DeepMind的巨額研發資金和虧損全部由Google來買單。不過在長期虧損之下,今年的DeepMind在財務方面似乎也有了一些好消息。
  • AlphaGo是如何學會下圍棋的
    「這一切發生的比我想像中快太多。」法國研究員雷米·庫倫說。他的背後,是曾經的世界最佳圍棋AI,Crazystone。 AlphaGo系統 DeepMind計劃自稱為「人工智慧界的阿波羅」,於2014年被谷歌收購。
  • 阿爾法狗之後的圍棋世界
    就在最近幾天,在中國鄂爾多斯主辦的圍棋世界大會上,其中有一個計算機圍棋大賽環節。(說個花絮,計算機圍棋都是快棋,而且計算機不需要休息,預賽一天下五輪,淘汰賽一天下三輪,只是解說很辛苦,而且根本跟不上ai的節奏),原本圍棋界認為,絕藝奪冠毫無懸念,只是看誰能搶下第二名的位置,殊不知,絕藝居然輸了兩場,只得到了第三名的位置!而賽前被寄予厚望的,來自於清華大學的神算子,居然也沒能殺入八強。
  • DeepMind 綜述深度強化學習:智能體和人類相似度竟然如此高!
    、到圍棋、再到無限制撲克等領域,AI 的表現都大大超越了專業選手,這一進展引起了眾多認知科學家的關注。最終,通過這種較慢的學習形式實現了快速的 Episodic deep RL ,這表示快速學習的基礎正源於緩慢學習。「快速學習的基礎是緩慢學習」並不是僅僅在強化學習裡有效的巧合。實際上在下文中,DeepMind 進一步說明了這是在心理學和神經科學領域也廣泛有效的基礎法則。