今年2月,《自然》封面報導了用人工智慧診斷皮膚癌的重磅研究,彰顯了人工智慧在疾病
診斷上的無限潛力。
近期,谷歌(Google)的博客上刊登了一篇文章,介紹了谷歌在人工智慧與機器學習領域取得的最新進展。在這篇文章中,谷歌與DeepMind以及瑞士巴塞爾大學(University of Basel)一同做出了突破——利用機器學習的方法,他們能準確預測分子的性質!這對於藥物發現來說,有著重要的裡程碑意義。
新的化學分子預示著新的無限可能,因此尋找新分子一直是化學研究中令人激動的一環。在歷史上,化學家們往往使用薛丁格方程的數值近似來做計算化學上的研究,其中就包括了一種叫做「密度泛函理論」的量子力學方法。這種方法在化學上有重要價值——它能分析預測分子的性質,因此有著廣泛的應用價值。然而,這一方法對計算能力的要求很高,因此每次進行研究分析的計算量有限,這也在一定程度上限制了它的應用。如果能找到一種全新、準確、而又快速的分子性質預測方法,無疑將為整個領域帶來突破。
來自谷歌的科學家們想到了近年來火熱的人工智慧。先前,他們發現,人工智慧在病理診斷上展現出了遠超人類的能力——在
乳腺癌的診斷中,專業的病理學家花了30個小時做的病理分析,竟不如一款人工智慧準確。此外,人們也發現,人工智慧
診斷皮膚癌的準確度也要高於皮膚科醫生。同理,人工智慧方法也許能大幅提高化學發現的準確度與效率,為該領域帶來改變。
為了驗證這一想法,研究人員首先開發了多款基於機器學習的方法,並從資料庫中提取出了超過10萬種化學分子,供這些方法學習。後續的檢驗表明,經過深度學習後,這些機器學習方法的近似誤差接近「密度泛函理論」,其中神經網絡(neural network)與核嶺回歸(kernel ridge regression)兩類方法的表現尤佳。概念性的驗證無疑給研究人員打了一劑強心針,也讓他們決定繼續進行深入研究。
在後續工作中,研究人員選擇了深度的神經網絡作為突破口。神經網絡在識別圖像相關的數據上,已經展現出了獨有的優勢,這一點對化學分子的性質預測而言格外有利。人們能將分子結構簡化為圖像,用點來代替原子,用線來代替化學鍵。這樣一來,神經網絡就能直接讀取這些分子的結構,並學習它們的性質。先前,不少研究已經催生了一些類似的神經網絡工具,而谷歌的研究人員則進一步將它們進行了調整與整合,將它們合併成一個叫做「信息傳遞神經網絡」(Message Passing Neural Networks,縮寫MPNN)的框架。研究人員們相信,這款神經網絡能有效地預測分子的性質。
他們拿了業內的標準來作為檢測的依據。在主要的13種化學性質中,這款神經網絡能準確地預測其中的11種性質,這足以為化學家們提供有用的信息。更關鍵的是,它比常規的「密度泛函理論」要快上30萬倍!
研究人員相信,能夠對化學分子的性質進行預測,將在化學領域、藥物發現領域的應用中釋放巨大潛力。最終,這些預測結果將助力人們設計並開發出新的藥物,造福人類。(
生物谷Bioon.com)