通過將原子當作字母,分子當作單詞,IBM的人工智慧軟體正在借用機器原先翻譯語言的方法,來預測有機化學反應的產物,這可能會加快新藥開發的速度。
本文圖片均來自附件視頻截圖
過去50年來科學家們一直在嘗試教會電腦化學原理,這樣電腦就能幫助我們預測有機化學反應產物。然而,有機物異常複雜,對它們行為的模擬被證明非常費時且不準確。
IBM的科學家換了一種思路,他們找了通常用於語言翻譯的AI程序應用在有機化學上。「不再是把英語翻譯成德語或漢語,我們讓這個人工智慧觀察數十萬、數百萬的化學反應,讓它學習有機化學『語言』的結構,再讓它試著預測可能的化學反應產物。」研究共同作者,蘇黎世IBM研究所的特奧多羅·萊伊諾(Teodoro Laino)說。
「我們想幫助化學家設計新的有機化合物合成路徑,」萊伊諾說。藥物和其它複雜有機化合物的合成通常是很困難的,「可能需要30到40步。商業部門花費了很多努力來尋找跳過一些步驟的捷徑,以達到節省時間和提高產率的效果。」
新的AI程序是一個人工神經網絡,在這個網絡中,數據被輸入至稱為「神經元」的組件上,這些組件再通過合作來解決問題,例如翻譯一句話。神經網絡隨後反覆調整「神經元」之間的連接,觀察新的連接樣式是否能更好地解決問題。隨著時間推移,神經網絡找到了計算解決方案的最佳連接樣式。這個過程模仿了人類大腦的學習過程。「它通過類比來推理和學習,這和頂尖的專業有機化學家在現實生活中做的一樣。」萊伊諾說。
就像牙牙學語的孩子並不一定知道時態和變格的原理卻仍能逐漸學會母語一樣,這個新的AI程序從來都沒有學過有機化學原理,但仍然可以對化學反應的產物作出預測。如果AI認為一個化學反應可能不止一種結果,它還會根據可能性高低列出多個反應方程式。
「它可以達到高達80%的準確率,」研究共同作者,蘇黎世IBM研究中心的菲利普·施瓦勒(Phillippe Schwaller)說
「目前為止,AI程序處理過的最大分子有150個原子。」施瓦勒說。研究共同作者,蘇黎世IBM研究中心的泰奧菲勒·戈丹(Théophile Gaudin)說:「如果需要的話,沒有任何理論限制說我們不可以處理更長的分子。」
未來,「我們計劃通過雲服務將這個程序向公眾開放,」戈丹說,「我們還想要把準確性提高到90%以上。其中一個思路是使用專用於特定有機化學反應的專門模型,而不是一個通用的有機化學模型。」
不僅如此,未來研究者還可能讓AI將溫度、溶劑、pH等條件考慮在內。然而,這需要再次檢查額外數據的準確性。
還有,「我們還希望招募有機化學專家,開展社會實驗,看看我們的模型如何比拼他們。」戈丹說。
因為AI還不完美,有機化學家仍然需要跟進這項研究。「我們並不創造這個工具來取代有機化學家,而是來幫助他們。」萊伊諾說。
科學家們12月4日在加州長灘的神經信息處理系統(NIPS 2017)會議上詳細報告了他們的發現。
翻譯:顧金濤
審校:馬曉彤
原文連結:https://spectrum.ieee.org/tech-talk/robotics/artificial-intelligence/artificial-intelligence-learns-chemical-reactions
附件視頻:https://youtu.be/Lj4iPb7Kw_0
IBM博客:https://www.ibm.com/blogs/research/2017/12/neural-networks-organic-chemistry/
私貨:自翻B站搬運:https://www.bilibili.com/video/av17145734