用人工智慧預測有機化學反應——來自翻譯神經網絡的啟發

2020-12-14 中國科學技術館

通過將原子當作字母,分子當作單詞,IBM的人工智慧軟體正在借用機器原先翻譯語言的方法,來預測有機化學反應的產物,這可能會加快新藥開發的速度。

本文圖片均來自附件視頻截圖

過去50年來科學家們一直在嘗試教會電腦化學原理,這樣電腦就能幫助我們預測有機化學反應產物。然而,有機物異常複雜,對它們行為的模擬被證明非常費時且不準確。

IBM的科學家換了一種思路,他們找了通常用於語言翻譯的AI程序應用在有機化學上。不再是把英語翻譯成德語或漢語,我們讓這個人工智慧觀察數十萬、數百萬的化學反應,讓它學習有機化學語言的結構,再讓它試著預測可能的化學反應產物。研究共同作者,蘇黎世IBM研究所的特奧多羅·萊伊諾(Teodoro Laino)說。

我們想幫助化學家設計新的有機化合物合成路徑,萊伊諾說。藥物和其它複雜有機化合物的合成通常是很困難的,可能需要3040步。商業部門花費了很多努力來尋找跳過一些步驟的捷徑,以達到節省時間和提高產率的效果。

新的AI程序是一個人工神經網絡,在這個網絡中,數據被輸入至稱為神經元的組件上,這些組件再通過合作來解決問題,例如翻譯一句話。神經網絡隨後反覆調整神經元之間的連接,觀察新的連接樣式是否能更好地解決問題。隨著時間推移,神經網絡找到了計算解決方案的最佳連接樣式。這個過程模仿了人類大腦的學習過程。它通過類比來推理和學習,這和頂尖的專業有機化學家在現實生活中做的一樣。萊伊諾說。

就像牙牙學語的孩子並不一定知道時態和變格的原理卻仍能逐漸學會母語一樣,這個新的AI程序從來都沒有學過有機化學原理,但仍然可以對化學反應的產物作出預測。如果AI認為一個化學反應可能不止一種結果,它還會根據可能性高低列出多個反應方程式。

它可以達到高達80%的準確率,研究共同作者,蘇黎世IBM研究中心的菲利普·施瓦勒(Phillippe Schwaller)說

目前為止,AI程序處理過的最大分子有150個原子。施瓦勒說。研究共同作者,蘇黎世IBM研究中心的泰奧菲勒·戈丹(Théophile Gaudin)說:如果需要的話,沒有任何理論限制說我們不可以處理更長的分子。

未來,我們計劃通過雲服務將這個程序向公眾開放戈丹說,我們還想要把準確性提高到90%以上。其中一個思路是使用專用於特定有機化學反應的專門模型,而不是一個通用的有機化學模型。

不僅如此,未來研究者還可能讓AI將溫度、溶劑、pH等條件考慮在內。然而,這需要再次檢查額外數據的準確性。

還有,我們還希望招募有機化學專家,開展社會實驗,看看我們的模型如何比拼他們。戈丹說。

因為AI還不完美,有機化學家仍然需要跟進這項研究。我們並不創造這個工具來取代有機化學家,而是來幫助他們。萊伊諾說。

科學家們124日在加州長灘的神經信息處理系統(NIPS 2017)會議上詳細報告了他們的發現。

翻譯:顧金濤

審校:馬曉彤

原文連結:https://spectrum.ieee.org/tech-talk/robotics/artificial-intelligence/artificial-intelligence-learns-chemical-reactions

附件視頻:https://youtu.be/Lj4iPb7Kw_0

IBM博客:https://www.ibm.com/blogs/research/2017/12/neural-networks-organic-chemistry/

私貨:自翻B站搬運:https://www.bilibili.com/video/av17145734

相關焦點

  • IBM公司利用人工智慧預測化學反應結果 從而加速新藥的研發
    通過將原子看作字母、將分子理解為單詞,IBM的人工智慧軟體正在使用與機器翻譯相同的方法來預測有機化學反應的結果,從而加速新藥的研發。 在過去的50年裡,科學家們試圖教會計算機化學反應的原理,以使得計算機能夠幫助預測有機化學反應的結果。然而,有機化學品有可能非常複雜,因而對其反應過程的模擬可能會非常耗時和不準確。 相反地,IBM的研究人員採用了通常用於語言翻譯的人工智慧(AI)程序,將其應用於有機化學。12月4日,在加利福尼亞州長灘舉行的神經信息處理系統會議上,科學家們詳細介紹了他們的發現。
  • 原子為字母分子為單詞,AI 正在用語言翻譯的規律預測化學反應
    近 50 年以來,科學家一直嘗試「教會」計算機化學知識,以便於幫助預測有機化學反應的結果。但是,由於有機化學反應過程非常複雜,所以相關的模擬既耗時又不夠準確。把原子類比為字母,分子類比為詞語,IBM 的研究人員將那種常用於語言翻譯的 AI 軟體,用於有機化學領域。
  • 基於深度神經網絡的脫硫系統預測模型及應用
    關鍵詞:燃煤電廠;脫硫系統;計算機模擬;深度學習;神經網絡;預測;模型應用;智慧環保;當前,國家正加快推進以 5G、人工智慧、工業網際網路、物聯網為代表的新型基礎設施建設(新基建),電力行業的智能化建設也蓬勃發展。國內大型火力發電廠很早就實現了廠級 DCS 數據監控,歷史運行數據豐富,為實現數據驅動的神經網絡建模提供了有利條件。
  • 用神經網絡預測股票市場
    作為一名人工智慧和金融愛好者,這是令人激動的消息,因為它結合了我自己感興趣的兩個領域。本文將介紹如何使用神經網絡預測股票市場,特別是股票的價格。這不需要使用任何平穩性的神經網絡來進行對抗。此外,神經網絡本質上在尋找數據之間的關係和使用它預測(或分類)新數據方面是有效的。典型的完整數據科學項目可以參考以下工作流程:神經網絡的輸入數據是過去十天的股價數據,我們用它來預測第二天的股價數據。
  • 人工智慧想要窮舉化學反應,探索地球生命如何起源
    7月25日消息,據國外媒體報導,格拉斯哥大學化學教授李·克羅寧(Lee Cronin)開發出一個可以運行多個化學實驗的人工智慧機器人,並利用質譜儀,核磁共振儀和紅外光譜儀實時評估反應過程。通過並行運行化學反應,克羅寧希望能夠減少有機化學家的工作,最終找出無機分子如何形成了有機分子。他將自己為化學所做的事情等同於希格斯玻色子在粒子物理學中的影響。
  • . | 用圖神經網絡預測均裂鍵能
    今天為大家介紹一篇圖神經網絡(GNN)預測均裂鍵能的文章:「Predictionof organichomolytic bond
  • David Cox:消除偏見,用「神經符號人工智慧」書寫未來
    近年來,人工智慧迅猛發展,即便是沒有深入了解過人工智慧技術的人,想必也或多或少地聽過兩個術語——符號人工智慧和神經網絡。隨著人工智慧的發展不斷成熟,MIT-IBM 沃森人工智慧實驗室主任 David Cox 認為,如今人們需要重新審視人工智慧,他提出將上述二者結合,開發一種「神經符號人工智慧」(Neuro-Symbolic AI)。
  • 人工智慧黑盒揭秘:深度神經網絡可視化技術
    但深度神經網絡又被稱為「黑盒」模型,多層隱藏結構,數據 / 特徵矢量化,海量決策關鍵元等因素讓模型使用者犯難:模型決策的依據是什麼?應該相信模型麼?特別是對於金融,醫藥,生物等關鍵型任務,深度學習模型的弱解釋性成為人工智慧項目落地的最大障礙。
  • 人工智慧瓶頸之神經網絡的可解釋探討
    特別是在醫學診斷、網絡安全、自動駕駛等對安全性有較高要求的領域,深度神經網絡所隱藏的安全風險限制了其自身在更多領域的應用和推廣,引起了政府、學術界及工業界的關注。基於深度神經網絡的人工智慧系統主要面臨結果不可驗證和過程不可審查兩大安全問題。結果不可驗證指的是基於深度神經網絡的人工智慧系統輸出結果無法被判斷、預測,智能系統行為邊界難以掌握,導致系統不可控,本質上是深度神經網絡結果不可判讀。
  • 網易有道上線神經網絡翻譯
    【IT168 廠商動態】在機器翻譯領域深耕了近十年的網易有道,再次給人們帶來了驚喜。  近日,網易有道在GMIC(全球移動網際網路大會)未來創新峰會上公布:由網易公司自主研發的神經網絡翻譯( Neural Machine Translation,以下簡稱NMT)技術正式上線。
  • 神經網絡之父Geoffrey Hinton傑弗裡·欣頓 跨過人工智慧寒冬談深度學習
    2009年HintonHinton以及他兩個研究生D.Mohamed等,用神經網絡應用於語音的聲學建模,在小詞彙量連續語音識別資料庫TIMIT上,獲得了語音識別競賽勝利,隨後這項基於神經網絡的方法被應用於谷歌安卓手機上。
  • 用神經網絡求解薛丁格方程,DeepMind開啟量子化學新道路
    近日,DeepMind 的科學家開發了一種新的神經網絡架構,可以用於近似計算薛丁格方程。這為深度學習在量子化學領域的發展奠定了基礎。論文地址:https://arxiv.org/abs/1909.02487神經網絡已知最好的應用是在人工智慧領域——視覺、語音和遊戲,但它們在科學和工程領域也有嚴肅的應用。
  • Facebook宣布全面轉為神經網絡人工智慧翻譯
    為了繼續提高翻譯質量,Facebook團隊最近宣布從基於短語的機器翻譯模型切換到基於神經網絡的翻譯模型,來支持所有的後端翻譯系統。每個翻譯系統每天翻譯超過2000個翻譯方向和45億個翻譯。 這些新模型能夠提供更準確和更流暢的翻譯體驗,改善了人們在使用Facebook時,閱讀由非常用語言撰寫的內容時的閱讀體驗。雷鋒網 AI 科技評論根據 Facebook 文章對相關情況編譯介紹如下。
  • 美國「四院士」特倫斯講解神經網絡算法:我們還處於人工智慧早期...
    神經網絡處理系統,我們使用神經網絡處理系統在30年前就提出這樣的理論,就是神經網絡模式。腦神經網絡可以有效處理複雜的數據組,也可以有能力處理上億的圖像數據。我相信在座各位對於阿爾法狗大戰是非常熟悉的,2017年打敗了柯潔世界圍棋冠軍,當時震驚世界。
  • 什麼是人工神經網絡(ANN)?
    每天使用神經網絡的應用程式有很多,例如Google的翻譯服務,Apple的Face ID iPhone鎖和Amazon的Alexa AI驅動的助手。神經網絡也在其他領域的一些重要人工智慧突破背後,例如診斷皮膚和乳腺癌,讓目光投向自動駕駛汽車。人工神經網絡背後的概念和科學已經存在了數十年。
  • 【翻譯】Sklearn 與 TensorFlow 機器學習實用指南 —— 第10章 人工神經網絡介紹(上)
    這是啟發人工神經網絡(ANN)的關鍵思想。然而,儘管飛機受到鳥類的啟發,但它們不必拍動翅膀。同樣的,ANN 逐漸變得與他們的生物表兄弟有很大的不同。一些研究者甚至爭辯說,我們應該完全放棄生物類比(例如,通過說「單位」而不是「神經元」),以免我們把我們的創造力限制在生物學的系統上。人工神經網絡是深度學習的核心。
  • 人工神經網絡
    隨著科技的快速發展,人工智慧這個詞變得越來越熱門了,今天,小創君想給大家分享一個與人工智慧有關的主題——人工神經網絡。那麼,什麼是人工神經網絡呢?看到這個主題,相信很多理工科的學生的腦海裡都會自然而然地想到三個熟悉的詞:人工智慧、機器學習與深度學習。那他們之間到底具有怎樣的一個關係呢?
  • 【神經網絡】神經網絡簡介
    循環神經網絡具有記憶性、參數共享的特性,因此在對序列的非線性特徵進行學習時具有一定優勢。循環神經網絡在自然語言處理(NLP),例如語音識別、語言建模、機器翻譯等領域有應用,也被用於各類時間序列預報。引入了卷積神經網絡(CNN)構築的循環神經網絡可以處理包含序列輸入的計算機視覺問題。[4]輸入:圖結構數據(如:知識圖譜,社交網絡,分子網絡等)
  • 化學界誕生了一個「AlphaGo」,居然來自中國,對製藥業影響深遠
    化學界的「AlphaGo」竟來自上海大學,圖片來自zdnet.com編者按:很多人可能對Mark Waller教授比較陌生,對他任職的單位上海大學也不熟悉,但最近Waller在Nature雜誌上發表了一項人工智慧領域的重要研究,化學界的「AlphaGo」由此誕生,引起國內外製藥領域高度關注。
  • Bioinformatics|用深度神經網絡結合局部和全局特徵預測蛋白質的...
    文章研究了如何利用蛋白質的局部和全局胺基酸序列來預測蛋白質的結合位點,作者用一個49維的向量(其中包括原始胺基酸、胺基酸的PSSM、胺基酸的二級結構狀態)來表示任意一個胺基酸,最後將得到的局部和全局胺基酸序列的向量表示連接起來,輸入到一個深度神經網絡做預測。1、研究背景PPI site背景:1、現存的方法主要使用局部上下文特徵來預測PPI site。