材料科學借力人工智慧,打造億萬材料資料庫

2020-11-25 和訊

    本文首發於微信公眾號:人工智慧家。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

  機器學習技術有望能夠實現材料科學的變革。

  這是所有最極客的視頻的強大競爭者:一部屏幕滾動播放著一行行數字與符號的智慧型手機。但是,每當參觀者駐足俯瞰日內瓦湖的辦公室,Nicola Marzari總會迫不及待地向他們展示。「這是我的手機,」他說,「從2010年開始,它實時計算著矽的電子結構!」。

  來自瑞士洛桑的瑞士聯邦理工學院(EPFL)的物理學家Marzari解釋到,他的手機,僅花費40秒就能完成曾經超級電腦耗費數小時才能完成的任務量子力學計算。這一壯舉不僅顯示了過去十年間計算方式的進步;也向我們展示了運算方法改變材料科學研究道路的可能性。

  Marzari拋開以往開發新材料的方法——靠運氣誤打誤撞發現新材料,而後在實驗室裡煞費苦心地測量性能——他與志同道合的同伴一起,利用計算機建模和機器學習技術生成數以萬計的備選材料庫。即使是實驗失敗,實驗數據也能提供有用的信息。

  儘管備選材料中有許多完全基於假設,但工程師已開始進行縮減。通過找尋預期屬性,針對特定的應用來篩選有合成和檢測的價值的材料。例如,它們能否作為導體或絕緣體,能否用作磁鐵以及能夠承受多大的壓力和溫度。

  加州大學伯克利分校的材料科學家,材料科學領域的先驅Ceder表示,他們希望以上做法可以實現材料科學研究的速度與效率的巨大飛躍。「對於現存材料的屬性,我們大概只了解其中的1%,」由此指向了磷酸鐵鋰的例子:這種化合物首次合成於20世紀30年代,但直到1996年才被公認為有望替代未來鋰離子電池的材料。「而在這之前,沒人測量過它的電壓。」Ceder說到。

  迄今,世界上至少有三個主要的材料資料庫,各包含幾萬或幾十萬的化合物。Marzari計劃將在今年晚些時候推出洛桑的材料雲計劃,這受到越來越廣泛的關注。

  在倫敦帝國學院擔任副院長的材料學家Neil Alford,不隸屬於任何一個資料庫,他指出:「現在,實驗者所想與理論所能及真正地融合在一起。」

  儘管已經提出了設想,但是從計算機預測過渡到現實世界的技術,卻還有很長一段路要走。現有資料庫還沒能收納所有已知材料,更別說所有可能性材料。

  以數據驅動的研究對某些材料有效,對另外一些材料卻無用。此外,即使我們在電腦上篩選出某一有趣材料,後續合成工作也要耗時數年。「我們總是擅長設想,卻無法付諸實踐。」Ceder說。

  儘管如此,研究人員堅信有著大量化合物的寶藏等待他們去挖掘,它們能夠開啟電力、能源、機器人、醫療保健和交通運輸領域的創新時代。芝加哥的伊利

諾斯

州大學的計算材料科學家Giulia Galli表示:「我們正在共同拼湊這塊巨大的拼圖,當每個部位都正確歸位後,對材料的預測就會成為現實。」  

基因組啟發

  21世紀初,在劍橋麻省理工學院的Ceder受到當時的人類基因組計劃的啟發,想到了以數據驅動的高通量材料科學研究方法。「就其本身而言,人類基因組不是新的治療方法的秘訣。」他說,「但是它為醫學提供了數量驚人的基礎性定量信息。」

  他猜想,或許材料學家可以借鑑遺傳學家的做法。或許,材料學家可以用DNA鹼基對的生物信息編碼方式,對各種化合物進行編碼,進而確定「材料基因組」?

  他猜想,如果以上設想實現,那麼編碼必須在組成所給材料的原子與電子中,以及它們的晶體結構中。2003年,Ceder和他的團隊首次展示量子力學計算資料庫如何預測金屬合金的可能性晶體結構,這是新材料研發領域邁出的關鍵一步。

  過去,就算對於超級計算機來說,這樣的計算既困難又耗費時間。機器要經歷大量嘗試,歷經數次失敗才能找到「基態」:一種能量最低且受力均衡的電子排布以及晶體結構。

  2003年,Ceder團隊在論文中指出了一條捷徑。研究人員計算了一個小型二元合金庫裡的常見晶體結構的能量,然後設計出一套機器學習算法,從庫中提取模型,預測新型合金的最可能基態。算法十分有效,大大縮減了計算時長。

  Stefano Curtarolo說:「那篇論文介紹了建設材料屬性公用庫,利用數據填補缺失部分的設想。」同年,他離開研究小組,在北卡羅來納州達勒姆市杜克大學創辦了自己的實驗室。隨後,那一設想催生了兩個獨立項目。

  2006年,Ceder在麻省理工啟動了材料基因組計劃,採用算法的改進版本來預估電動汽車電池的鋰基材料。到2010年,該項目已包含了近兩萬種備選化合物。「我們從現有材料入手,修改它們的晶體結構——改動這裡或那裡的元素並計算結果。」Ceder團隊的前成員 Kristin Persson說到。2008年,她搬到加利福利亞洲的

勞倫

斯伯克利國家實驗室後,仍繼續跟進項目。

  與此同時,Curtarolo在杜克大學設立了材料基因組中心,專注研究金屬合金。同來自猶他州普羅沃楊百翰大學、猶他州和以色列內蓋夫的核研究中心的研究人員一起,Curtarolo最終將2003年的算法和庫發展為AFLOW,一套能夠計算已知晶體結構並自動預測新型結構的系統。

  初始研究團隊外的研究者也對高通量計算感興趣。其中一個是化學工程師Jens Nørskov,在丹麥技術學院期間,他用這種計算來研究催化劑,將水分解為氫氣和氧氣。後來,他擔任加利福利亞史丹福大學研究催化劑計算的SUNCAT中心的主任,並拓展了該項研究。另一個是Marzari,他是Quantum Espresso開發團隊中的一員,該項目研究量子機器運算,於2009年啟動。  

材料基因組

  儘管如此,直到2011年7月,白宮宣布了數百萬元的材料基因組計劃(MGI),材料科學才成為主流。「白宮的官員了解Ceder的研究後,非常激動,」來自標準與技術的

美國

全國學院的材料科學家和MGI執行秘書James Warren說到。「人們普遍認識到計算機模擬已發展到了對創新與製造產生實際影響的階段,這是令人稱道的盛況。」

  自2011起,該倡議已投資逾250多萬美元,用於軟體工具、收集和報告實驗數據的標準化方法、主要大學的計算材料科學中心、校際合作以及具體應用研究。至於這項投資對科學起了多大推動作用,我們尚不得知。Ceder表示:「這一舉措獲益頗豐,但也出現了一些偏差,有些團隊開始稱自己的研究為這為那,然而這些與研究並沒有什麼聯繫。」

  不過,可以確定的一點是,MGI旨在幫助Ceder和其他研究者實現材料屬性在線資料庫的願景。2011年底,受白宮要求,Ceder和Persson將他們的材料基因組計劃改為材料計劃,放棄了「基因組」標籤,以避免與國家工作混淆。次年,在杜克大學期間研究的軟體基礎上,Curtarolo推出了自己的資料庫——AFLOWlib。

  2013年,伊利諾州埃文斯頓西北大學的研究人員Chris Wolverton推出了開放量子材料資料庫(OQMD)。他說:「我們借鑑了材料計劃和AFLOWlib的總體思路,但我們的軟體和數據是自產自銷。」

  這三個資料庫共享從無機晶體結構資料庫獲取的近五萬種核心已知材料數據。這些數據都已經至少在實驗室和論文中出現過一次,但其電力和磁力性能從未得到完整測試;它們是新材料得以產生的起點。

  三個資料庫的不同之處在於它們包含的假設材料。材料計劃數據相對較少,約15000個從Ceder和Persson的鋰電池研究中得出的計算結構,「只有確定了計算結果的準確性和研究可行性,我們才會將材料收入庫中。」Persson說。

  另外的13萬左右條結構由明尼蘇達的明尼阿波利斯大學的納米多孔材料基因組中心預測得出。後者關注沸石和金屬有機框架:晶體結構中帶有規律性重複小孔的海綿狀材料,可以捕及氣體分子,儲存甲烷或二氧化碳。

  AFLOWlib是最大的資料庫,擁有超過一百萬的不同材料和一億左右的性能屬性。Curtarolo表示,那時因為它也包含了數以萬記的假設材料,其中許多在現實世界中一轉眼的功夫就消失了。「但是當你嘗試去預測如何製造某一金屬,功夫總不負有心人。」

  例如,他正利用AFLOWlib的數據研究為什麼一些合金可以合成金屬玻璃(一種金屬形式,其無序微觀結構賦予了該金屬特殊的電磁屬性)。研究結果顯示,玻璃形成劑的優劣之分在於不穩定晶體結構的數量和能量,這些晶體結構和「基態」在合金冷卻過程中「完成」。

  Wolverton的QQMD包含大約40萬假想材料,它們由自然普遍發現的一系列晶體結構計算得出。Wolverton的團隊幾乎選用了元素周期表的每一個部分,來「裝飾」這些材料。

  QQMD涵蓋了大量的鈣鈦礦——這種晶體常常展示出引人注目的性能,如超導以及用於太陽能電池開發的微電子。顧名思義,該項目最具開放性:用戶可以在電腦上下載整個資料庫,而不僅僅是個人研究結果。

  以上資料庫都還處於建設階段,管理者仍然要耗費大量時間添進更多的化合物、完善計算;他們承認,目前的計算遠不夠完善。

  資料庫中的代碼善於預估晶體結構的穩定與否,但卻無法很好地預估晶體結構如何吸收光或者導電性能;因此,常常會製造出類似半導體的非金屬。Marzari指出,即使是在計算材料科學發展最好的領域——電池材料,也存在半伏的平均誤差。

  失之毫釐,謬以千裡。Curtarolo表示:「事實上,有些誤差來源於理論本身:我們永遠無法糾正它們。」

  各個團隊都在改進自身的技術,調整計算法並修改系統性誤差。但同時,他們和其他團隊的用戶已經利用數據開始了實驗。材料計劃已經確定了幾個具有前景的陰極材料,可能比用於鋰電池中的現存材料要好;他們還發現了能夠提升太陽能電池捕光和產能效率的金屬氧化物。

  今年早些時候,來自都柏林三一學校的研究人員使用 AFLOWlib裡的數據預估20種哈勒斯合金,一種可用於傳感器和電腦儲存器的磁鐵。他們成功合成了其中的兩種合金,並表示二者的磁性屬性與預估值非常接近。  

延伸至歐洲地區

  材料基因組學已經走向了歐洲地區,儘管它的名稱有所變化。例如,瑞士創造了MARVEL,一個計算材料科學組織,以洛桑聯邦理工學院為首,以Marzari為領導者。

  有了新的計算平臺,Marzari創建了名為材料雲的資料庫。他用該資料庫檢索由單層原子或分子構成的「二維」材料,如石墨。這類材料既可以用於納米電子,又可用於醫學裝置。

  為了找到好的備選材料,Marzari對超過15萬已知材料進行了所謂的「計算剝皮」:計算從一個普通晶體表面分離一層需要多大的能量。今年晚些時候,資料庫將對外公布,Marzari預測到那時初步運算已經涵蓋了1500種可能性「二維」結構,並在後續的實驗中進行檢驗。

  計算化學家Berend Smit建立了另一個洛桑聯邦理工學院中心,聳立在距錫安幾千公裡外的阿爾卑斯山脈上。該中心致力於研發算法,預估數以萬計的納米多孔沸石和金屬有機框架。此外,還有衍生自面部識別技術的算法,用於掃描一定的孔狀形狀,然後尋找最佳備選材料,吸收化石燃料工廠煙囪排放的二氧化碳。

  Smit的工作還揭示了材料基因組的缺點。許多研究者希望納米多孔材料打造空間更小儲甲烷量更大的汽車水箱。然而,在掃描了逾65萬計算材料後,Smit團隊發現大部分優秀材料早已存在。新材料僅僅有些許進步,而美國機構設定的能源目標——實現甲烷儲存的重大技術進步,也就顯得不現實。

  正如以上例子一樣耐人尋味,材料基因組學在實現自身的承諾前,還需要克服許多困難。其中最大的困難就是,計算機建模還無法找出製作有趣新材料的方法,更別說質量問題了。

  「我們一直在提出關於新物質的有趣設想,」Ceder說。「這些設想,有時候兩周就實現了。而有時,就算進行了6個月研究,我們也沒有絲毫頭緒,我們甚至不知道方向是否正確,亦或是可行性有多少。」

  Ceder和Curtarolo都在嘗試改進機器學習算法,從已知製造過程中提取規則,指導化合物的合成。

  另一個限制是,材料基因組一直用於工程師所稱的功能性材料中,即能在任務中發揮作用的化合物,如在太陽能電池中吸收光線。但是該技術並不能很好地用於研究結構性材料,如鋼,如飛機機翼、橋梁或發動機。這是因為諸如彈性和硬度的機器屬性取決於生產過程,而這是量子力學代碼不能描述的。

  即使對於功能性材料,現行的計算機代碼只適用於完美的晶體結構,而這只是材料領域的一小部分。Galli表示:「未來,最有趣的材料可能是由微觀層面的創造性組裝而成。」可能是納米顆粒或是異質材料晶體的組裝。要預估這些材料,Galli補充到:「你需要立即計算出許多屬性,系統如何在及時地在特定溫度在衍生。」方法有許多,「但是將其運用於高通量研究,計算成本仍舊十分高昂。」

  短期而言,實驗中更多的數據交換,可以更好地檢驗計算結果並加以完善。目前,Ceder正與麻省理工的團隊一起研究新型軟體,通過閱讀材料科學實驗論文,自動以標準格式提供晶體結構的相關信息。「我們計劃在未來幾個月,將這些數據加入材料計劃中。」

  長期而言,

摩爾

定律將會起到一定作用:隨著計算能力不斷提高,一些目前計算機無法實現的技術很快將會變得可行。

  Marzari表示:「我們已經走出計算材料科學的手工時代,並進入了產業化階段。現在,我們可以創建模擬裝配鏈,並將它們投入使用,以一種全新的方式探索問題。」目前市場

上海

沒有計算預估材料。Galli說:「但十年後呢?我相信那時就會有很多了。」  

    文章來源:微信公眾號人工智慧家

(責任編輯:李治華 HN026)

相關焦點

  • 人工智慧提速新材料發現 YOSIA Webinar AI+材料科學 回顧
    隨著信息科技的逐漸成熟,人類通過計算系統或人工智慧發現新材料成為可能。人工智慧和材料科學的結合充滿前景,但依然存在挑戰。 2020年8月30日,未來論壇YOSIA Webinar第五期「AI+材料科學」邀請了材料計算學、材料表徵及材料基因組學的學者,圍繞「人工智慧提速新材料發現」的主題,分享如何利用人工智慧加速對材料結構和性能的了解,並與傳統材料研究的學術界和產業界代表,一同探討AI應用於材料科學研究的價值和效能。
  • Nature封面刊文:人工智慧將要重塑材料科學
    最近火到不行不行的人工智慧,引起了全球人類的關注。其中,有人期待人工智慧帶來更大的便利,同時也有人擔憂人工智慧會不會搶走自己的飯碗,甚至於未來《終結者》中的情形將發生。   那麼現在,擔憂自己的飯碗的可能又要加入一部分材料科研工作者了。 5月4日,Nature封面刊登題為《人工智慧將創造更優秀的材料?》
  • 第二屆亞洲材料科學資料庫會議在三亞召開
    3月11-12日,第二屆亞洲材料科學資料庫會議(the Second  Asia Materials Science Database Symposium)在海南三亞召開,會議由北京科技大學
  • 荷蘭研究人員藉助人工智慧設計超材料
    編者按 荷蘭代爾夫特理工大學材料科學與工程學院的米格爾 貝薩教授研究團隊藉助人工智慧,將脆性聚醋酸(PLA)轉變為形狀可恢復、高可壓縮性的超材料。
  • 上萬個無機半導體材料的HSE帶隙資料庫
    先前本公眾號介紹了二維材料資料庫(最新二維材料資料庫介紹)以及功函資料庫(元素晶體功函資料庫),目前全球四大知名材料資料庫比如:Materials Project 、JARVIS 、AFLOW、OQMD (網站連結見下面)等已經包含了很多材料體系的帶隙等信息,但基本都是基於普通的PBE方法。
  • 材料信息學:解碼材料基因圖譜丨科普矽立方
    人工智慧+材料科學在了解材料信息學之前,我們首先需要對材料科學研究四大範式的發展脈絡有整體的認識。四大範式包括,實驗試錯、理論推演、模擬計算和數據科學。新材料的研發最傳統的方式是實驗試錯法,即通過改變材料成分、合成手段、工藝參數等條件製備系列樣品,選出其中性能最合適的材料。
  • 用超算給材料測「基因」
    而「材料基因組技術」就是通過高通量實驗裝置,對組合材料的樣品單元進行高通量表徵,並將獲得的材料性能數據儲存在資料庫中,再通過數據挖掘等技術得到材料「成分—結構—性能」的構效映射關係。通過分析、解構材料「基因組」,科學家可以改變傳統材料研究方法,加速材料研發進程。「在材料基因組計劃中,資料庫及其共享、計算工具開發至關重要。」
  • 美國將開放資料庫促進新材料研發—新聞—科學網
    科技日報北京8月16日電 (記者李文龍)據美國白宮科技政策辦公室網站消息,美國近期將向公眾開放多個材料學資料庫,以此促進新材料的研發與合成。
  • 海南周刊 | 好萊塢效應攪熱海島遊 海南借力打造天然攝影棚
    借力影視劇、綜藝節目提升瓊島美譽  天然攝影棚好戲連臺  《巨齒鯊》中出現的三亞濱海風光。  天涯海角景區設置的宣傳展板。近年來,隨著《非誠勿擾Ⅱ》《私人訂製》《芳華》等一系列影片在瓊取景拍攝的電影熱映,借力影視劇作品及綜藝節目等文化資源,海南積極打造天然攝影棚,瓊島曼妙風光與特色文化聲名遠揚,海南形象逐漸深入人心,有力推動國際旅遊知名度不斷提升。  「三亞灣是什麼地方?」  「沒什麼特別的,無非就是遊客密度在全球數一數二的海灘而已。」
  • 《人工智慧之圖資料庫》報告重磅發布
    【導讀】近日,清華大學人工智慧研究院、清華-中國工程院知識智能聯合研究中心和智譜AI聯合發布了《人工智慧之圖資料庫》報告。報告圍繞圖資料庫的基本概念、技術發展、產業應用、人才概況和熱點趨勢這五大方面進行深入挖掘。
  • 瀋陽材料科學國家研究中心揭牌—新聞—科學網
    據瀋陽材料科學國家研究中心依託單位——中科院金屬研究所所長左良介紹,瀋陽材料科學國家研究中心作為首批啟動的6個國家研究中心之一,也是材料領域以及東北地區的唯一一個國家研究中心,金屬所將為瀋陽材料科學國家研究中心建設提供全面支持和保障。
  • 探索材料科學的奧秘
    :他們的理念和目標是用高壓、微重力、極低溫等手段獲得具有非平衡亞穩結構的新型材料,發現新異的材料性能、物理現象與規律,發展亞穩材料和物理的理論以進一步指導新材料的合成與應用;在開展研究的同時,他們還積極廣泛地開展國際合作,並時刻思考著未來的發展方向,致力於打造一支具有國際水平的人才隊伍。
  • 材料學院周濟課題組在《材料科學進展》發文綜述力學超材料相關...
    材料學院周濟課題組在《材料科學進展》發文綜述力學超材料相關研究進展清華新聞網12月26日電  12月21日,清華大學材料學院周濟教授課題組在材料科學領域的國際權威期刊《材料科學進展》 (Progress in Materials Science)上發表題為《關聯強度
  • 【中國科學報】瀋陽材料科學國家研究中心揭牌
    10月30日,瀋陽材料科學國家研究中心揭牌暨新園區開工儀式在瀋陽舉行。遼寧省委副書記、省長唐一軍,中國科學院副院長李樹深,遼寧省副省長、瀋陽材料科學國家研究中心主任盧柯,瀋陽市市長姜有為出席儀式。唐一軍和李樹深共同為瀋陽材料科學國家研究中心揭牌。
  • 借力「新基建」助推文旅產業高質量發展
    來源:中國文化報2020年3月,中央提出「加快推進國家規劃已明確的重大工程和基礎設施建設,加快5G網絡、數據中心等新型基礎設施建設進度」,「新基建」一時間成為社會各界關注的熱點,各地政府和產業界紛紛制定相應政策,希望借力「新基建」激起發展新勢能。
  • 武漢紡織大學材料科學、化學進入ESI全球前1%!
    2020年11月ESI(Essential Science Indicators基本科學指標資料庫)顯示,我校材料科學和化學進入ESI全球前1%。ESI材料科學涵蓋我校材料科學與工程、紡織科學與工程等相關碩士學位授權一級學科。近年來,我校材料學院、技術研究院、紡織學院在材料科學方面形成了材料學、材料物理與化學、紡織材料與紡織品設計、非織造材料與工程等多個穩定的學科方向。
  • 安必平聯合騰訊啟動宮頸液基細胞學資料庫建設及人工智慧開發
    11月25日,在中華醫學會病理分會細胞學組專家們的見證下,安必平、騰訊AI Lab以及騰訊覓影正式啟動「科技部醫療影像國家人工智慧開放創新平臺——宮頸液基細胞學AI資料庫建設」項目,共同助力宮頸液基細胞學資料庫建設與標準規範的制定。
  • 中國材料科學2035學科發展戰略研討會在西安召開
    他表示,近年來學校聚焦國家重大戰略部署,發揮特色優勢,著力攻克關鍵核心技術,特別是在材料科學領域開展了積極的探索實踐,取得了豐碩的研究成果。相信通過舉辦此次研討會,在黨和國家戰略部署的指引下,在各位院士和專家學者們的支持下,在研究團隊的共同努力下,一定能夠不斷向材料科學的廣度和深度進軍,創造出富有影響力的重大研究成果。
  • 前沿研究丨數據驅動的材料創新基礎設施
    材料基因工程工作模式大致可分為實驗驅動、計算驅動和數據驅動三種。近期,中國工程院院刊《Engineering》刊發的《數據驅動的材料創新基礎設施》一文指出,材料基因工程的數據驅動模式,基於大量數據,使用人工智慧來揭示隱藏在海量數據背後的關聯關係,為現有的常規研究增加了新的維度和視角。
  • 大連工業大學材料科學與工程(高分子材料方向)專業介紹
    材料科學與工程(高分子材料方向)  材料科學與工程(高分子材料方向):培養具備高分子材料科學與工程方面的基礎理論、專業知識,在材料分析與檢測、新產品開發及生產經營管理等方面具備創新意識的高級工程技術人才。