提速30萬倍!谷歌AI可準確預測化學分子性質

2021-01-10 生物谷



今年2月,《自然》封面報導了用人工智慧診斷皮膚癌的重磅研究,彰顯了人工智慧在疾病

診斷

上的無限潛力。


近期,谷歌(Google)的博客上刊登了一篇文章,介紹了谷歌在人工智慧與機器學習領域取得的最新進展。在這篇文章中,谷歌與DeepMind以及瑞士巴塞爾大學(University of Basel)一同做出了突破——利用機器學習的方法,他們能準確預測分子的性質!這對於藥物發現來說,有著重要的裡程碑意義。


新的化學分子預示著新的無限可能,因此尋找新分子一直是化學研究中令人激動的一環。在歷史上,化學家們往往使用薛丁格方程的數值近似來做計算化學上的研究,其中就包括了一種叫做「密度泛函理論」的量子力學方法。這種方法在化學上有重要價值——它能分析預測分子的性質,因此有著廣泛的應用價值。然而,這一方法對計算能力的要求很高,因此每次進行研究分析的計算量有限,這也在一定程度上限制了它的應用。如果能找到一種全新、準確、而又快速的分子性質預測方法,無疑將為整個領域帶來突破。


來自谷歌的科學家們想到了近年來火熱的人工智慧。先前,他們發現,人工智慧在病理診斷上展現出了遠超人類的能力——在

乳腺癌

的診斷中,專業的病理學家花了30個小時做的病理分析,竟不如一款人工智慧準確。此外,人們也發現,人工智慧

診斷

皮膚癌的準確度也要高於皮膚科醫生。同理,人工智慧方法也許能大幅提高化學發現的準確度與效率,為該領域帶來改變。


為了驗證這一想法,研究人員首先開發了多款基於機器學習的方法,並從資料庫中提取出了超過10萬種化學分子,供這些方法學習。後續的檢驗表明,經過深度學習後,這些機器學習方法的近似誤差接近「密度泛函理論」,其中神經網絡(neural network)與核嶺回歸(kernel ridge regression)兩類方法的表現尤佳。概念性的驗證無疑給研究人員打了一劑強心針,也讓他們決定繼續進行深入研究。


在後續工作中,研究人員選擇了深度的神經網絡作為突破口。神經網絡在識別圖像相關的數據上,已經展現出了獨有的優勢,這一點對化學分子的性質預測而言格外有利。人們能將分子結構簡化為圖像,用點來代替原子,用線來代替化學鍵。這樣一來,神經網絡就能直接讀取這些分子的結構,並學習它們的性質。先前,不少研究已經催生了一些類似的神經網絡工具,而谷歌的研究人員則進一步將它們進行了調整與整合,將它們合併成一個叫做「信息傳遞神經網絡」(Message Passing Neural Networks,縮寫MPNN)的框架。研究人員們相信,這款神經網絡能有效地預測分子的性質。


他們拿了業內的標準來作為檢測的依據。在主要的13種化學性質中,這款神經網絡能準確地預測其中的11種性質,這足以為化學家們提供有用的信息。更關鍵的是,它比常規的「密度泛函理論」要快上30萬倍!


研究人員相信,能夠對化學分子的性質進行預測,將在化學領域、藥物發現領域的應用中釋放巨大潛力。最終,這些預測結果將助力人們設計並開發出新的藥物,造福人類。(

生物谷

Bioon.com)

相關焦點

  • 業界| 分子性質預測新突破:谷歌新型神經網絡助力化學研究
    為了幫助化學家更快地預測出分子的性質並協助進一步的開發(比如發現新藥物或新材料),計算機科學家也在嘗試構建能夠基於分子的基本數據預測分子性質的算法和模型。近日,谷歌等機構的研究者發表了兩篇論文介紹了他們在這方面的研究進展——達到了當前最佳的預測表現。在本文中,機器之心編譯介紹了其成果介紹文章和兩篇論文的摘要,研究詳情請參閱對應論文。
  • AI也能有嗅覺!谷歌正訓練人工智慧預測分子氣味
    來源:獵雲網編譯:葉展盛一批人工智慧、生命科學和化學方面的專家正在通過圖神經網絡來識別分子、預測氣味。這批專家建立的模型性能已經超越了目前的所有方法,該模型誕生於DREAM嗅覺預測挑戰賽。這些研究員主要來自於谷歌、加拿大高等研究所、多倫多矢量人工智慧研究所、多倫多大學和亞利桑那州立大學。這些研究人員相信,隨著機器學習在分子識別領域應用水平的提高,機器智能將可以進行氣味識別,就像讓人工智慧模擬視覺、聽覺等其他感知能力。另外,研究人員還在嘗試讓機械臂獲得觸覺。
  • 速度提高100萬倍,哈佛醫學院提出可預測蛋白質結構的新深度模型
    蛋白質結構預測是生命科學領域的一大難題。近日,來自哈佛大學醫學院的研究人員提出了一種基於胺基酸序列預測蛋白質結構的新方法,準確率可媲美當前最佳方案,但預測速度提升了100萬倍。生命所必需的每一次基礎生物學進展幾乎都是由蛋白質帶來的。
  • Science封面:谷歌實現量子化學模擬,迄今為止全球首例
    接下來,他們會將量子模擬的算法擴大到更複雜更大分子的化學反應中,而這會非常容易,只需要更多的量子位和較小的算法調整即可。他強調稱,未來我們甚至可以使用量子模擬來開發新的化學物質。10個量子比特上模擬Hartree-Fock對分子幾何形狀的能量預測其誤差成因可能來源於量子硬體堆棧中。Sycamore具有54比特,由140多個單獨可調的元件組成,每個元件都由高速模擬電脈衝控制。
  • Science封面:谷歌實現量子化學模擬,迄今為止全球首例!
    8月27日,谷歌量子計算研究團隊宣布其使用量子計算機對化學反應路徑進行建模取得了突破性進展,這是迄今為止首次,也是最大規模的化學量子計算。雖然氮氫反應是較為基礎的化學反應,甚至不需要配備量子計算機來模擬就可以輕鬆得出結果,但研究人員Babbush介紹,此項研究驗證了當前量子計算機開發的算法可以達到實驗預測所需的精度,開拓了一條通往量子化學系統逼真的模擬路徑。
  • AI醫療新進展,谷歌DeepMind基於基因序列預測蛋白質的三維結構
    有多種科學方法可用於預測DNA中殘留胺基酸的蛋白質分子的天然三維狀態(即蛋白質鏈如何摺疊以達到天然狀態)。甚至還有一個眾包遊戲(FoldIt)試圖利用人類的直覺來預測可行的蛋白質形式。 但是對三維結構進行建模是一項非常複雜的任務,因為蛋白質摺疊可能存在多種排列方式,這取決於諸如各種胺基酸之間的相互作用等因素。
  • 谷歌DeepMind又在全球賽事中擊敗人類!AI成功預測蛋白質3D結構
    之後豪普特曼和卡爾勒建立了應用 X 射線分析的以直接法測定晶體結構的純數學理論,在晶體研究中具有劃時代的意義,特別在研究大分子生物物質如激素、抗生素、蛋白質及新型藥物分子結構方面起了重要作用,因此而獲得 1985 年諾貝爾化學獎。2017 年諾貝爾化學獎授予發明了冷凍電鏡技術的三位科學家,以獎勵其對探明生物分子高解析度結構的貢獻。
  • 【技能】ChemDraw在分析化學領域的應用—預測核磁共振化學移位
    ChemDraw是全球領先的化學繪圖軟體,ChemDraw應用領域比較廣泛,如分析化學、化學工程、高分子材料、化學工程等,本教程將舉例說明ChemDraw在分析化學中的應用。分析化學是關於研究物質的組成、含量、結構和形態等化學信息的分析方法及理論的一門科學,是化學的一個重要分支。
  • DeepMind開發一款軟體可準確預測蛋白質在幾天時間裡會摺疊成什麼...
    DeepMind開發一款軟體可準確預測蛋白質在幾天時間裡會摺疊成什麼樣的結構 來源:TechWeb • 2020-12-01 10:18:01
  • 谷歌AI可預測新冠病毒蛋白質結構 或有助於遏制全球爆發
    圖:谷歌旗下人工智慧研究公司DeepMind執行長戴密斯·哈薩比斯(Demis Hassabis)3月6日消息,據外媒報導,谷歌旗下人工智慧(AI)部門DeepMind正在加入全球努力,以幫助了解更多關於新型冠狀病毒的信息,這種病毒引發的疫情正在世界大部分地區迅速傳播。
  • Cell:斯坦福團隊發現孕婦血液中的「分子時鐘」,可準確預測孕期和預產期
    圖片來自論文研究團隊通過機器學習方法,利用這些代謝物建立了預測模型,發現在三組獨立的人群當中,該模型均能準確預測懷孕的具體時期。對模型進行進一步精簡後,研究團隊發現僅用母親血液中的 5 個代謝物就能準確預測懷孕的具體時期。除此之外,包含 2 個或 3 個血液分子的預測模型就可以準確判斷孕期女性是否已經超過 20 周、24 周、28 周、32 周和 37 周等,這是與流產、胎兒存活以及不同早產時期相關的孕期關鍵時間點。
  • 美國谷歌的量子黑科技實現了最大規模的化學模擬
    通過使用量子設備對分子電子能量進行Hartree-Fock計算,並通過變分量子本徵求解(VQE)來進行糾錯處理完善其性能,來實現對化學過程進行準確的計算預測。Google 團隊已經發布了相關的實驗代碼於github,人們可以從化學量子計算的開源庫 OpenFermion進行獲取。
  • 中國實現100萬倍谷歌量子霸權了?還是媒體集體誤讀?
    在9月6號之後,關於「潘建偉院士宣布實現100萬倍谷歌量子優越性」的內容刷爆各媒體頭條,震蕩科技圈。有讀者郵件量子客詢問此事的真偽,由於沒有可靠的信息源支持,筆者多方求證,也沒有得到官方的證實。據原文記錄,谷歌量子計算機在解決隨機線路問題時,以200秒時間處理的問題,在美國全球第一的超級計算機「山頂」上需要10000年的時間,一時間全球鼎沸。後來IBM稱在改善條件的情況下可以將問題的經典計算機處理時間縮短至幾天,阿里巴巴量子計算團隊也充分證明可將問題縮減至20天(參考量子客文章:阿里發文否定谷歌量子霸權10000年優勢,20天即可)。
  • 中國實現100萬倍谷歌量子霸權,部分報導有誤
    在9月6號之後,關於「潘建偉院士宣布實現100萬倍谷歌量子優越性」的內容刷爆各媒體頭條,震蕩科技圈。有讀者郵件量子客詢問此事的真偽,由於沒有可靠的信息源支持,筆者多方求證,也沒有得到官方的證實。據原文記錄,谷歌量子計算機在解決隨機線路問題時,以200秒時間處理的問題,在美國全球第一的超級計算機「山頂」上需要10000年的時間,一時間全球鼎沸。後來IBM稱在改善條件的情況下可以將問題的經典計算機處理時間縮短至幾天,阿里巴巴量子計算團隊也充分證明可將問題縮減至20天(參考量子客文章:阿里發文否定谷歌量子霸權10000年優勢,20天即可)。
  • 《AI+化學與製藥》論壇:有AI就不搬磚,化學逆合成也可以借鑑Alpha...
    例如,化學逆合成反應借鑑了AlphaGo的思想,小分子可以編碼為字符串用NLP技術處理,或者編碼為無向連接圖用GNN處理,甚至可以用生成模型生成新的化學分子,以及用深度學習來預測化學物質的性質等等。綜合來看,逆合成反應就是不斷地把現有的不能合成或者不能買到的分子,分解成一系列的前體,使得每一個前體都可以買到或合成。簡化來看的話,比如合成分子A有兩條路可選,我選擇其中一條,合成分子B也有兩條路可選,我選擇其中一條。這其實是相對比較簡單的情況,三步就完成了,每一次最多從二選一,即使要把所有路徑都試一遍,也是比較簡單的。
  • 還是發生了,美國谷歌的量子黑科技實現了最大規模的化學模擬
    通過使用量子設備對分子電子能量進行Hartree-Fock計算,並通過變分量子本徵求解(VQE)來進行糾錯處理完善其性能,來實現對化學過程進行準確的計算預測。Google 團隊已經發布了相關的實驗代碼於github,人們可以從化學量子計算的開源庫 OpenFermion進行獲取。
  • JMC | 藥物化學中的分子表徵學習
    幾十年來在定量構效關係(QSAR)研究和分子相似性分析方面的藥物發現研究表明,準確的預測依賴於分子特徵(也稱為分子描述符)的選擇。在機器學習中,這種手動發現和創建相關特徵的過程被稱為特徵工程。化學信息學的相似性質原理表明,相似的化合物應該具有相似的性質。
  • 「谷歌」一下癌症診斷新利器,AI顯微鏡開掛,AR瞬間識別癌細胞
    不管是研發疾病療法,還是開發檢測工具,谷歌的軟體技術幾乎都以AI為核心支撐。谷歌開發出診斷癌症的人工智慧顯微鏡2019年8月12日,由谷歌設計研發的增強現實顯微鏡系統(ARM)—— Microscope 2.0 登上國際頂級醫學期刊 Nature Medicine(最新 IF=30.6)。
  • 谷歌AlphaGo計算力多強?超IBM深藍3萬倍
    (原標題:谷歌AlphaGo計算力多強?超IBM深藍3萬倍) 人機世紀大戰,谷歌圍棋程序AlphaGo對決韓國李世石的比賽仍在進行當中,面對能跟9段高手李世石「分庭抗禮」的AlphaGo,不禁要問AlphaGo的計算能力到底有多強呢?
  • 百度免費開放AI算法 可將新型冠狀病毒RNA二級結構預測縮短至27秒
    據百度研究院科學家透露,LinearFold 算法可將此次新型冠狀病毒的全基因組二級結構預測從55分鐘縮短至27秒,提速120倍,節省了兩個數量級的等待時間。防控疫情,眾志成城。人工智慧技術正被應用到疫情防控中來。幾天前,百度宣布成立總規模3億元疫情及公共衛生安全攻堅專項基金,用於支持新型冠狀病毒等新疾病的治癒藥物篩選、研發等一系列抗擊疫情工作。