洛斯阿拉莫斯國家實驗室、北卡羅來納大學教堂山分校和佛羅裡達大學的最新研究表明,人工神經網絡可以被訓練成編碼量子力學定律來描述分子的運動,這可能會在大範圍的領域進行超級模擬。洛斯阿拉莫斯實驗室理論部門的物理學家、大都會研究員賈斯汀·史密斯(Justin Smith)說:這意味著我們現在可以比傳統量子方法更快地對材料和分子動力學進行建模,同時保持同樣的精確度。
了解分子如何運動對於開發藥物、蛋白質模擬和反應化學等潛在價值至關重要,量子力學和實驗(經驗)方法都可以應用到模擬中。這項被稱為ANI-1ccx勢的新技術,有望提高許多領域研究人員的能力,並在未來的金屬合金和爆炸物理研究中提高基於機器學習勢的準確性。量子力學(QM)算法用於經典計算機,能夠準確地描述化合物在其運行環境中的力學運動。但是量子力學在不同分子大小的情況下很難擴展,這嚴重限制了可能的模擬範圍。在模擬中,即使分子大小稍有增加,也會極大地增加計算負擔。
因此,從業人員經常求助於使用經驗信息,這些經驗信息根據經典物理學和牛頓定律描述原子運動,使模擬能夠擴展到數十億個原子或數百萬種化合物。傳統上,經驗勢必須在準確性和可轉讓性之間進行權衡。當對一種化合物的許多電勢參數進行微調時,對其他化合物的準確度就會下降。相反,洛斯阿拉莫斯團隊與北卡羅來納大學教堂山分校和佛羅裡達大學合作。開發了一種名為「轉移學習」(transfer learning)的機器學習方法。
通過從收集到的數百萬其他化合物數據中學習,可以建立經驗潛力。這種具有機器學習經驗潛力的新方法可以在幾毫秒內應用於新分子,從而在更長的時間尺度內研究更多化合物。化學和生物系統原子解析度的計算模型,是化學家工具集中的一個重要工具。計算機模擬的使用需要在成本和精度之間取得平衡:量子力學方法提供了很高的精度,但計算成本高,而且對大型系統的伸縮性較差,而經典力場成本低且可伸縮,但缺乏對新系統的可移植性。
機器學習人工神經網絡可以用來實現這兩種方法的最佳效果。研究人員訓練一個通用的神經網絡電位(ANI-1ccx),它接近CCSD(T)/CBS在反應熱化學、異構化和類藥物分子扭轉的基準上的準確性。這是通過訓練一個網絡到DFT數據,然後使用傳輸學習技術在一個黃金標準QM計算(CCSD(T)/CBS)數據集上進行再訓練來實現,該數據集最優地跨越了化學空間。由此產生的潛力廣泛應用於材料科學、生物學和化學,比CCSD(T)/CBS計算快數十億倍。
博科園|研究/來自:洛斯阿拉莫斯國家實驗室參考期刊《自然通訊》DOI: 10.1038/s41467-019-10827-4博科園|科學、科技、科研、科普