新成果!自學習AI算法發現高性能材料,未來遠程科研或成現實

2020-12-03 學術頭條

每當看到 AI 這個詞,你腦海中是否會浮現出超級智能計算機?或者想到不需要人類輔助即可執行任務的機器人?或許,這些夢想並不遙遠。

近年來,機器學習在化學領域的應用正以驚人的速度增長,在材料性能預測、新材料探索與設計等領域也取得了很大進展。但是,機器學習與實驗過程的直接耦合還存在巨大的挑戰。

近日,一個包括美國國家標準與技術研究所(NIST)在內的多機構研究團隊在 AI 研究領域取得了又一項重要研究成果:他們開發出了一種名為 CAMEO 的 AI 算法,該算法在不需要科學家額外訓練的情況下,自主發現了一種潛在的實用新材料。利用 CAMEO 算法實現的 AI 系統,可以有效地減少科學家在實驗室中花費的「反覆」實驗時間,同時最大限度地提高科研效率。

該研究成果以「 On-the-fly closed-loop materials discovery via Bayesian active learning」為題,於 11 月 24 日在線發表在科學期刊《自然-通訊》(Nature Communications)上。

(來源:Nature Communications)

對此,論文作者之一、NIST 研究員 Aaron Gilad Kusne 表示,在材料科學領域,科學家們一直以來都在不斷尋求可用於特定應用場合的新材料,比如 「一種可用於製造汽車的輕巧堅固金屬,或者可承受噴氣發動機的高應力和高溫環境的材料」。

幫助解決科研痛點

新材料的發現是推動現代科學發展與技術革新的源動力之一,而傳統的材料研發需要進行大量的試驗,效率低且成本高——要想尋找這樣的新材料,不僅需要研究人員進行大量的實驗,還需要耗費大量的時間去做理論調查。

如果一個研究人員想要分析一種材料在不同溫度下的特性,那麼他可能需要在各種不同溫度下進行 N 次試驗。然而,溫度只是材料的一個指標之一,如果在一項實驗中有 5 個指標要分析,每個指標又有 10 個值,那就意味著該研究人員必須進行 10^5 次試驗。

Kusne 表示,對於試驗次數如此多的實驗,研究人員可能會花費幾年甚至幾十年的時間,所以,這樣的實驗,幾乎不可能進行。

CAMEO 算法的「用武之地」正在於此,CAMEO 可以跳過那些會提供冗餘信息的實驗,確保每個實驗都可以最大限度地幫助科學家獲取知識和見解,提升他們的理解能力。通過節省實驗時間,可以有效幫助科學家更快實現其目標,也使實驗室的有限資源能夠得到更有效地利用。

那麼,CAMEO 算法如何實現這一點?

CAMEO 是基於機器學習的一個自學習 AI 算法,為材料研究領域的探索提供了一種全新的範式。CAMEO 通過閉環操作來尋找有用的新材料,首先從資料庫中加載材料數據,然後通過貝葉斯機器學習對數據進行分析,預測未知材料的結構和功能特性,並通過主動學習來確定下一步要研究的最有價值的材料。在進行下一輪實驗之前,CAMEO 還可以要求科學家根據過去所執行的實驗經驗,提供材料的晶體結構等信息。

論文作者之一、馬裡蘭大學材料科學與工程教授 Ichiro Takeuchi 表示:「實驗的關鍵在於,我們能夠在一個由多種材料構成的組合庫中啟動(unleash)CAMEO 算法。」 在通常的組合研究中,陣列中的每一種材料都會被依次測量,以尋找具有最佳性能的化合物。即使使用快速的測量設置,也需要花費很長時間。而有了 CAMEO 算法,僅需很少量的常規測量就可以找到最佳材料。

圖 | CAMEO 在一個閉環操作中尋找新材料的過程(來源:NIST)

該 AI 算法還被設計成包含關鍵原理的知識,包括過去的模擬和實驗室實驗的知識、設備的工作原理以及物理概念。例如,研究人員使 CAMEO 掌握了相位圖知識,相位圖描述了材料中原子的排列如何隨化學成分和溫度的變化而變化。而理解原子在材料中的排列方式對於確定材料的特性至關重要,根據排列方式可以確定材料的硬度、電絕緣性,以及材料的應用場合。

Kusne 說:「CAMEO 算法是無監督的,許多類型的 AI 算法都需要進行訓練或監督,我們不要求它學習物理規律,而是將它們編碼到 AI 中。這樣一來,就不需要人類再去訓練 AI 模型。」

了解材料結構的最佳方法之一是 X 射線衍射法,即使用 X 射線轟擊材料。通過識別 X 射線反射的角度,科學家可以確定原子在材料中的排列方式,從而使他們能夠確定其晶體結構。然而,一次內部 X 射線衍射實驗可能需要一個小時或更長時間。在斯坦福同步輻射光源(SSRL)進行的實驗中,由於快速移動的粒子會發射大量的 X 射線,一臺足球場大小的大型機器以接近光速的速度加速帶電粒子,整個過程可能需要 10 秒鐘。

(來源:Nature Communications)

CAMEO 算法安裝在一臺計算機上,通過數據網絡與 X 射線衍射設備相連接,通過確定 X 射線反射的角度,科學家們可以確定原子在材料中的排列方式,從而弄清楚材料的晶體結構。在每次進行新的迭代時,CAMEO 都會從過去的測量中學習並確定下一個要研究的材料。這使得 AI 可以探索材料的成分如何影響其結構,並確定完成任務的最佳材料。

Kusne 說:「把這個過程想像成製作一份完美的蛋糕,你正在混合各種類型的材料(比如,麵粉、雞蛋或黃油),通過使用各種配方來製作最好的蛋糕。」而藉助人工智慧,則可以搜索製作 「配方」 或實驗流程,來確定材料的最佳成分。如此一來,便節省了大量的實驗時間。

自主發現,性能更優

CAMEO 就是使用這種方法發現了 GST467 材料。

CAMEO 通過給定的 177 種潛在的材料進行研究,這些材料涵蓋了大範圍的組成配方。為了獲得這種材料,CAMEO 耗時 10 小時完成了 19 個不同的實驗,相比之下,一個科學家大約需要 90 個小時才能完成同樣多的實驗。

圖 | GST467 的發現過程(圖片來源:nature communications)

CAMEO 發現的新材料 GST467 由三種不同的元素(鍺、銻、碲,Te-Ge-Sb)組成,是一種相變存儲材料,即當它受熱迅速熔化時,其原子結構會從晶態(原子在指定的、有規律的位置上的固體材料)變為非晶態(原子在隨機位置上的固體材料)。這種相變存儲材料被用於數據存儲等電子存儲應用程式。

圖 | GST467 的納米結構和器件性能(圖片來源:nature communicatiion)

雖然 Ge-Sb-Te 合金系統中可能存在無限種成分變化,但 GST467 是適合相變應用的最佳材料。研究人員希望 CAMEO 算法能找到最佳組合的 Ge-Sb-Te 合金,以滿足在晶態和非晶態之間的 「光學對比度」 差異最大的特性。

例如,在 DVD 或藍光光碟上,光學對比度允許掃描雷射通過區分高反射率或低反射率的區域來讀取光碟。研究人員發現,GST467 的光學對比度是 DVD 常用的材料 GST225 的兩倍,較大的對比優勢也使其表現出了明顯優於傳統材料的特性。

GST467 還可應用於用於控制電路中光的方向的光子開關器件,還可以應用於神經形態計算(旨在開發模擬大腦神經元結構和功能的設備,為新型計算機的出現以及從複雜圖像中提取有用數據等其他應用提供可能)。

遠程科研或成現實

研究人員認為,不只是 GST467,CAMEO 還可以發現許多其他材料。如今,他們已經將 CAMEO 的代碼開源,免費提供給科學家和研究人員使用。

與類似的機器學習方法不同,CAMEO 算法不是對大量數據進行機器學習和預測,而是通過關注晶體材料的成分、結構和性質之間的關係,追蹤材料相應功能的結構來源,引導系統發現有用的新化合物。

CAMEO 的一個好處是最大限度地降低了成本,因為在同步加速器設施中進行實驗是需要花費時間和金錢的。研究人員估計,使用 CAMEO 可以將實驗數量減少十分之一,相應地可以將實驗時間縮短十倍。由於人工智慧正在運行測量數據、收集數據,分析數據的過程,這也大大降低了研究人員進行實驗所需的知識量,他們只需關注正在運行的 AI 系統。

CAMEO 的另一個好處是為科學家提供了遠程工作的能力。SLAC 美國國家加速器實驗室的研究員 Apurva Mehta 說:「這掀起了一波科研熱潮,科學家不需要在實驗室中,就可以繼續工作和生產。」 這可能意味著,如果科學家們可以依靠人工智慧在實驗室進行實驗,更加安全地遠程從事傳染性疾病或病毒的研究

研究人員表示,他們將繼續改進這一 AI 算法,並嘗試使該算法可以解決更複雜的問題。Kusne 說:「CAMEO 擁有機器人科學家的智慧,它的構建,是為了以一種非常高效的方式,來設計、運行和學習實驗。」

參考資料:https://www.nature.com/articles/s41467-020-19597-w

相關焦點

  • AI 已經能自主發現高性能材料了
    近日,一個包括美國國家標準與技術研究所(NIST)在內的多機構研究團隊在 AI 研究領域取得了又一項重要研究成果:他們開發出了一種名為 CAMEO 的 AI 算法,該算法在不需要科學家額外訓練的情況下,自主發現了一種潛在的實用新材料。利用 CAMEO 算法實現的 AI 系統,可以有效地減少科學家在實驗室中花費的「反覆」實驗時間,同時最大限度地提高科研效率。
  • 科研新發現:小龍蝦殼助力製備高性能電極材料
    小龍蝦殼輔助重質生物油製備高性能超級電容器電極材料示意圖。中國科大供圖中新網合肥12月7日電 (記者吳蘭)記者7日從中國科學技術大學獲悉,該校科研團隊採用新方法,將廚餘垃圾中的小龍蝦殼等合成製備成一種高性能電極材料。這一研究成果日前發表在國際知名期刊《碳》(Carbon)上。
  • 科研新發現:小龍蝦殼助力製備高性能電極材料
    中國科大供圖中新網合肥12月7日電 (記者 吳蘭)記者7日從中國科學技術大學獲悉,該校科研團隊採用新方法,將廚餘垃圾中的小龍蝦殼等合成製備成一種高性能電極材料。這一研究成果日前發表在國際知名期刊《碳》(Carbon)上。
  • 一周AI最火論文 | 生成描述性文字的新平臺,用語言加強AI在動態...
    每周更新,做AI科研,每周從這一篇開始就夠啦!  本周關鍵詞:RoboTHOR、ML Bazaar、BabyAI++  本周最火學術研究  一個開放的模擬到現實具身AI平臺  在本文中,研究人員介紹了RoboTHOR,這一框架可以使交互且具身的視覺AI研究更加「民主化」。
  • 瑞希生物運用AI設計新材料 獲海量IP成果
    瑞希生物醫藥有限公司(以下簡稱「瑞希香港」)成立於中國香港,致力在組織修復領域,運用人工智慧從事生物醫學材料的研究設計、產品開發和技術服務,並開發其在醫療衛生領域的具體應用,輸出極具市場競爭力的科研成果、推廣擁有市場前景的商業產品。
  • AI防癌地圖不斷展開 醫學科研發展的速度也越來越快
    醫療人工智慧企業依圖醫療在北京舉行依圖醫療「AI防癌地圖」周年成果匯總報暨多組學智能科研平臺發布會。目前業務線包括了安防、醫療、AI製藥、AI晶片等,其以自然語言、計算機視覺,語音識別,以及其自主研發的算法,構建了具有自主智慧財產權的醫學語義網絡,腫瘤,肺癌等眾多種多病灶的疾病模型。 近年來,「智慧醫院」火遍業界,如今AI+醫療有望建立重塑臨床流程的智能醫院,並與傳統醫療領域玩家有機結合,實現智能醫療產業化,已進入早篩、診斷、隨訪、科研等領域成為臨床醫師的「第二大腦」。
  • 讓機器像人類一樣學習? 伯克利 AI 研究院提出新的元強化學習算法!
    伯克利 AI 研究院給出了一個很好的答案——元強化學習(meta-RL)。但這一次伯克利 AI 研究院不只是使用了元強化學習,還考慮POMDP、異步策略梯度等等知識體系,最終得到了一個高樣本效率、高探索效率的新算法「PEARL」。這一成果不僅為解決 AI 的實際問題提供新的思考角度;同時也是實現在現實系統中規模化應用元強化學習的的第一步。
  • Xilinx、Spline.AI、AWS 推出 X 射線分型深度學習模型和參考設計
    賽靈思公司宣布推出全功能醫療 X 射線分型深度學習模型和參考設計套件,這是賽靈思與 Spline.AI 及亞馬遜網絡服務(AWS)強強攜手共同取得的合作成果。
  • 人工智慧提速新材料發現 YOSIA Webinar AI+材料科學 回顧
    2020年8月30日,未來論壇YOSIA Webinar第五期「AI+材料科學」邀請了材料計算學、材料表徵及材料基因組學的學者,圍繞「人工智慧提速新材料發現」的主題,分享如何利用人工智慧加速對材料結構和性能的了解,並與傳統材料研究的學術界和產業界代表,一同探討AI應用於材料科學研究的價值和效能。
  • 深度學習算法,加快新興科技產業材料發現
    然而,為這些行業尋找具有所需功能的理想材料是極具挑戰性的。南卡羅來納大學計算機科學副教授胡建軍是生成新的假設材料項目的首席研究員。由於化學設計空間廣闊,候選者空間高,實驗試驗和一級計算模擬不能作為篩選工具來解決這個問題。相反,研究人員已經開發出一種基於深度學習的智能算法,該算法使用一種稱為生成對抗網絡(GAN)模型的技術,大幅提高材料搜索效率,高達兩個數量級。
  • 有機熱電材料:未來綠色能源新翹楚
    在化學所為該先導專項組織的國際評估中,參與評估的國際同行專家對項目取得的成績作出極高評價:「這個項目取得了巨大成功,超過了最初的目標,發展了令人興奮的材料和器件研究的完整平臺。」同時,基於專項的科學研究成果,科學家們還發展出具有自主產權的柔性器件製備與集成技術,有力推動我國在這一戰略新興產業上發展,為有機電子工業顛覆未來生活做好了科學與技術的準備。
  • 華為發布2021年奧林帕斯懸紅,加速科研成果產業轉化
    實現存儲產品跨越式發展急需產學研界通力合作,加強理論研究和產業實踐創新,加速科研成果產業化。  在2020全球數據存儲教授論壇上,華為發布2021年奧林帕斯懸紅,旨在獎勵全球數據存儲領域取得突破性貢獻的科研工作者,發揮高校燈塔的作用,照亮數據存儲產業的發展。會上,來自中國工程院、國內外頂尖高校、科研機構以及華為的上百位數據存儲領域專家出席本次論壇,共同探討數據存儲未來發展。
  • 戴瓊海:深度學習遭遇瓶頸,全腦觀測啟發下一代AI算法
    舉個例子,在中程飛彈和遠程飛彈的研發中,光纖牽引頭是一個關鍵點,用於探路與開路,但由於算力不夠,飛彈的飛行速度被制約。如果算力能將飛行識別的速度提高到納秒級、甚至是皮秒級,那麼飛彈的飛行速度就能提高。人工智慧產業的發展對算力需求呈指數增長,如何從硬體與軟體上提高算力,成為國內外科研者的研究熱點。算力顛覆性提升、催生新國防武器和新應用也成為國際競爭的一個體現。
  • 高性能計算之源起——科學計算的應用現狀及發展思考
    該方法不需要開展真實的實驗,極大地節省了成本,縮短了新材料的開發周期,為材料的製備和改性、新材料的開發以及極端環境下材料的性質研究提供了有效的理論指導。然而,由於計算量極大,第一性原理材料模擬領域的科研人員對軟體性能和計算資源的需求越來越大。
  • Atari 遊戲得分提升兩個數量級:Uber AI 的新強化學習算法 Go...
    Go-Explore在沒有領域知識(通過縮小像素表示)的探索階段發現的房間數量魯棒化Uber AI 當前版本的 Go-Explore 利用確定性來更快地找到解決方案(高性能軌跡)。起初 Uber AI 的研究人員們選擇了 Salimans 和 Chen 的「後向算法」,因為它是開源的,並且在提供人工演示時可以解決蒙特祖瑪的問題。他們還發現從單一演示中學習有點不可靠。然而,因為 Go-Explore 可以產生大量的演示,他們為了同時學習多個演示而改進了後向算法(在這種情況下學習 4 個演示,以及後面的領域知識實驗中 10 個)。
  • 又一新技術誕生!不用探頭,實現遠程測量:物體材料內部的溫度
    科學家使用一種稱之為深度熱像儀的新技術,使得遠程確定某些材料表面以下的溫度成為可能。這種方法在傳統溫度探頭不起作用的應用中可能很有用,比如監測半導體性能或下一代核反應堆。許多溫度傳感器測量物體表面發出的熱輻射,其中大部分在紅外光譜中。物體越熱,發出的輻射就越多,這是熱成像相機等小玩意的基礎。
  • 發現晶體微觀結構高性能熱電材料
    原標題:中科院上海矽酸鹽所:發現晶體微觀結構高性能熱電材料   中科院上海矽酸鹽研究所科研人員與美國密西根大學和西北大學研究人員合作,合成了一種既不同於尋常晶粒取向隨機的多晶材料、也不同於無晶界的單晶材料、具有高度取向性的馬賽克晶體熱電材料,從而實現了類似玻璃材料的極低熱導率和晶體材料的優異電輸運性能,其熱電優值遠高於普通多晶材料體系
  • 谷歌AutoML新進展,進化算法加持,僅用數學運算自動找出ML算法
    但自 20 世紀 90 年代後這類研究逐漸冷門,直到現在才重新得到重視。2018 年 3 月,谷歌大腦團隊即進行相關研究,使用進化的 AutoML 來發現神經網絡架構。如今,谷歌將這項研究進一步擴展,證明從零開始進化 ML 算法是有可能的。相關研究被 ICML 2020 接收,這項研究出自谷歌大腦團隊 Quoc V. Le 等學者之手。
  • 中鋼洛耐院挺進高性能碳化物材料開發新領域
    9月15日,省會鄭州,一場省科技廳組織的成果驗收會正在進行。  中鋼集團洛陽耐火材料研究院有限公司(簡稱「中鋼洛耐院」)帶來的「高溫煙塵過濾用梯度多孔碳化矽基復相陶瓷合作研究」項目,解決了用碳化矽基陶瓷替代靜電除塵、袋式除塵等傳統高耗能除塵方式的技術難題,成功通過成果驗收,為我國工業環保設備升級提供了新路徑。
  • Google重磅醫療AI成果:增強現實顯微鏡可實時分析病理切片
    深度學習技術近來在眼科、皮膚科、放射科和病理科等醫學學科領域展現出了極大的應用前景,它可以幫助為世界各地的患者提供更加精準、可用的高質量醫療服務。Google近期也發布了一項研究成果,該成果顯示,卷積神經網絡檢測淋巴結中的乳腺癌轉移的準確率,可以媲美一名訓練有素的病理學家。