物理所等利用機器學習方法預測材料性能獲進展

2020-12-05 中國科學院

  近二十年來,機器學習方法的發展為我們的生活帶來許多便利。智能網絡搜索、語音識別,乃至無人超市、無人駕駛汽車等,依託於機器學習方法的新事物正迅速地在生活中普及。Alpha Go的橫空出世更讓世界驚嘆於人工智慧的潛在價值。在科研領域,大數據的理念正在改變著科研人員對未知世界的探索方式。美國在2011年提出了材料基因組計劃(Materials Genome Initiative),以期加快材料的研發過程。我國懷柔科學城的發展規劃中,「材料基因組研究平臺」項目已全面開工建設。高通量實驗+高性能計算+深度數據分析的研究方式已經成為時代發展的趨勢。

  在非晶合金研究領域,如何設計並開發出具有良好玻璃形成能力的合金,是一個具有重要產業價值的科學問題。過去非晶合金材料新體系的探索主要依據經驗性判據的指導,由於其準確性與通用性的限制,非晶新材料的研發速度非常緩慢。如何提高材料設計的效率,尋找具有更優性能的材料,是非晶材料領域非常具有挑戰性的問題。

  最近,中國科學院物理研究所/北京凝聚態物理國家實驗室(籌)汪衛華研究組博士研究生孫奕韜在研究員汪衛華、白海洋及中國人民大學物理系教授李茂枝的指導下,使用機器學習的方法,對二元合金的玻璃形成能力進行了系統分析,建立了合金成分與性能之間的關聯,並對可能的新材料進行了預測。研究過程中使用了支持向量機(Support Vector Machine)這種方法(圖1),通過構建多維空間,並在這個多維空間內對數據進行分割,從而建立輸入參量與輸出參量之間的關聯。該研究方法可通過不斷選擇新的參數對模型進行重複訓練,探討了合金的不同性質對其玻璃形成能力的影響(圖2)。研究發現,參量Tliq(表徵合金過冷能力的參量)與合金的玻璃形成能力有最為顯著的關聯,而且使用參量Tliq與Tfic(表徵合金熱穩定性)作為輸入參數,可以得到具有最佳預測效率的模型。通過對最佳模型的分析,發現已知的具有良好玻璃形成能力的二元合金,其分布與模型的預測值具有很好的一致性(圖3)。使用這個模型,可以對未知的合金成分進行預測,這樣由深度數據分析指導設計的實驗,可以極大地縮短非晶合金材料的研發周期(圖4)。該工作作為使用新的工具對經典問題進行分析的一種嘗試,得到了初步成果。這表明,機器學習的方法在非晶材料設計與研發領域具有重要的應用前景。採用更全面、完善的資料庫,運用更深入的人工智慧算法,機器學習方法能夠為非晶等領域科研人員提供更精準的信息,進一步加速材料的研發過程。

  這項研究結果最近發表在J. Phys. Chem. Lett. 8, 3434(2017)上。該項研究工作得到國家自然科學基金項目(51571209,51461165101)、科技部「973」項目(2015CB856800)和中科院前沿科學關鍵研究項目(QYZDY-SSW-JSC017)的支持。

    圖1. 支持向量機方法的基本過程,包括四個主要部分:資料庫的建立,模型的訓練,模型的評估,以及最優模型的預測。

圖2. 不同的輸入參數得到的模型的預測結果。

圖3. 最優模型的預測結果。已發現的優秀材料與模型預測(紅色區域)有很好的一致性。

圖4. 最優模型預測得到最佳玻璃形成能力的合金體系的成分雲圖。

  近二十年來,機器學習方法的發展為我們的生活帶來許多便利。智能網絡搜索、語音識別,乃至無人超市、無人駕駛汽車等,依託於機器學習方法的新事物正迅速地在生活中普及。Alpha Go的橫空出世更讓世界驚嘆於人工智慧的潛在價值。在科研領域,大數據的理念正在改變著科研人員對未知世界的探索方式。美國在2011年提出了材料基因組計劃(Materials Genome Initiative),以期加快材料的研發過程。我國懷柔科學城的發展規劃中,「材料基因組研究平臺」項目已全面開工建設。高通量實驗+高性能計算+深度數據分析的研究方式已經成為時代發展的趨勢。
  在非晶合金研究領域,如何設計並開發出具有良好玻璃形成能力的合金,是一個具有重要產業價值的科學問題。過去非晶合金材料新體系的探索主要依據經驗性判據的指導,由於其準確性與通用性的限制,非晶新材料的研發速度非常緩慢。如何提高材料設計的效率,尋找具有更優性能的材料,是非晶材料領域非常具有挑戰性的問題。
  最近,中國科學院物理研究所/北京凝聚態物理國家實驗室(籌)汪衛華研究組博士研究生孫奕韜在研究員汪衛華、白海洋及中國人民大學物理系教授李茂枝的指導下,使用機器學習的方法,對二元合金的玻璃形成能力進行了系統分析,建立了合金成分與性能之間的關聯,並對可能的新材料進行了預測。研究過程中使用了支持向量機(Support Vector Machine)這種方法(圖1),通過構建多維空間,並在這個多維空間內對數據進行分割,從而建立輸入參量與輸出參量之間的關聯。該研究方法可通過不斷選擇新的參數對模型進行重複訓練,探討了合金的不同性質對其玻璃形成能力的影響(圖2)。研究發現,參量Tliq(表徵合金過冷能力的參量)與合金的玻璃形成能力有最為顯著的關聯,而且使用參量Tliq與Tfic(表徵合金熱穩定性)作為輸入參數,可以得到具有最佳預測效率的模型。通過對最佳模型的分析,發現已知的具有良好玻璃形成能力的二元合金,其分布與模型的預測值具有很好的一致性(圖3)。使用這個模型,可以對未知的合金成分進行預測,這樣由深度數據分析指導設計的實驗,可以極大地縮短非晶合金材料的研發周期(圖4)。該工作作為使用新的工具對經典問題進行分析的一種嘗試,得到了初步成果。這表明,機器學習的方法在非晶材料設計與研發領域具有重要的應用前景。採用更全面、完善的資料庫,運用更深入的人工智慧算法,機器學習方法能夠為非晶等領域科研人員提供更精準的信息,進一步加速材料的研發過程。
  這項研究結果最近發表在J. Phys. Chem. Lett. 8, 3434(2017)上。該項研究工作得到國家自然科學基金項目(51571209,51461165101)、科技部「973」項目(2015CB856800)和中科院前沿科學關鍵研究項目(QYZDY-SSW-JSC017)的支持。

    圖1. 支持向量機方法的基本過程,包括四個主要部分:資料庫的建立,模型的訓練,模型的評估,以及最優模型的預測。

圖2. 不同的輸入參數得到的模型的預測結果。

圖3. 最優模型的預測結果。已發現的優秀材料與模型預測(紅色區域)有很好的一致性。

圖4. 最優模型預測得到最佳玻璃形成能力的合金體系的成分雲圖。

相關焦點

  • 我國科學家研究鈉離子電池材料獲進展
    近日,中科院物理研究所(以下簡稱中科院物理所)科研團隊與荷蘭代爾夫特理工大學、法國波爾多大學等合作,提出了一種簡單的預測鈉離子層狀氧化物構型的方法,並在實驗上證實了該方法的有效性,為低成本、高性能鈉離子電池層狀氧化物正極材料的設計製備提供了理論指導。
  • 低成本、高性能鈉離子電池技術獲進展—新聞—科學網
  • 機器學習促進了分離,吸附和催化的材料
    機器學習正在幫助加速金屬有機框架的高度可調材料的開發,這些材料在化學分離,吸附,催化和傳感中具有重要的應用。 利用有關200多個現有MOF屬性的數據,對機器學習平臺進行了培訓,以通過預測一個經常必要的屬性(水穩定性)來幫助指導新材料的開發。
  • 利用機器學習預測野火
    在讀到最近在美國科羅拉多州和澳大利亞各地發生的野火之後,我們想知道是否有一種方法可以提前預測這些災難,以便採取一些保護措施。我們在Kaggle上找到了這個數據集,它包含了美國188萬場野火,我們使用PyTorch Lightning建立一個模型。閱讀後面的內容,一起來看看如何使用這個數據集建立一個可以預測野火強度的模型吧。
  • 機器學習和密度泛函計算結合高速準確篩選光伏材料
    原創 Cell Press CellPress細胞科學 收錄於話題#Cell Press論文速遞74個物質科學Physical science近日,西北大學馮宏劍課題組提出了結構依賴的光伏材料的快速原子級精度機器學習預測方法
  • 合肥研究院在利用彈性常數高效計算材料熱導率方法方面取得進展
    熱電材料的研究指出,原子間相互作用弱的材料,具有強烈的非簡諧效應,使得其晶格熱導率較低。從力學性能上看,弱的原子間相互作用會導致材料的彈性常數較低。   因此,張永勝提出了一種利用材料彈性常數計算材料熱導率的方法。
  • 謝國彤:疾病預測的機器學習、深度學習和經典回歸方法
    疾病預測的主要方法疾病預測的主要方法可以簡單的分為經典回歸方法、機器學習方法和深度學習方法三大類。下面分別用三篇論文舉例介紹一下。近年來,機器學習領域的特徵選擇和有監督學習建模方法越來越多地用於疾病預測問題。一些機器學習方法可以提高預測模型的可解釋性,例如決策樹方法。另一方面,一些較新的機器學習方法可以帶來更好的預測性能。2010 年發表於 KDD 的文章 [Khosla et al. 2010] 採用了特徵選擇和機器學習方法來預測 5 年內的腦卒中發生率。
  • 「可解釋學習」利用SHAP對分子活性預測機器學習模型進行解釋
    文章利用可解釋學習方法SHAP(SHapley Additive exPlanation)對基於複雜機器學習模型的分子活性預測模型進行解釋,嘗試打開「黑箱」。但是,機器學習模型的難以解釋的特性一直為人們所詬病,尤其是預測精度高的模型往往複雜度更高和規模更大,解釋性(Interpretability)更差。而對於QSAR模型,其中分子結構與活性的關係比起普通的圖像識別任務中標籤和圖片關係更難以理解,這增加了解釋模型的難度。這些複雜的機器學習模型的解釋有著重要的意義,可以提高模型與真實實驗符合程度從而提升模型性能,以及輔助分子作用機理的探索等。
  • 重慶研究院單晶二維材料GeSe大面積單原子層研究獲新進展
    重慶研究院單晶二維材料GeSe大面積單原子層研究獲新進展 2017-12-13 重慶綠色智能技術研究院 IVAVIB單晶二維材料MX(M=Ge,Sn;X=S,Se)因極高穩定性、環境友好性、豐富蘊藏量,以及從材料結構到性能上與黑磷烯的相似性而受到廣泛關注。基於第一性原理方法對MX的能帶結構的計算、對其從間接帶隙到直接帶隙的臨界層厚,以及基於其C2v對稱結構的壓電性能理論預測的研究已多有報導。
  • 機器學習增強先進光源光束性能
    近日,研究人員表示已經找到了升級這些機器的方法,以產生更強、更集中、更一致的光束,從而能夠在更大範圍的樣本類型中進行更複雜、更詳細的新研究。但是一些光束特性仍然表現出性能的波動,這給某些實驗帶來了挑戰。   許多同步加速器設備為數十個同步實驗提供不同類型的光。對這些單獨光束線進行小調整增強光束性能,可以反饋到整個設施的整體光束性能。
  • 反應堆故障診斷方法研究獲新進展
    近日, 中國科學院合肥物質科學研究院核能安全技術研究所在反應堆故障診斷方法研究領域取得進展,以Small-batch-size convolutional neural network based fault diagnosis system for nuclear energy production safety with big-data environment為題發表於能源領域國際期刊
  • 美國航天局利用機器學習人工智慧預測颶風強度 | 章魚通
    不過,在NASA南加州噴氣推進實驗室(Jet Propulsion Laboratory)的科學家領導下,研究人員利用機器學習來開發一種實驗計算機模型,該模型有望大大提高檢測快速強化事件的準確度。然而,機器學習能夠更好地分析這些複雜的內部動態,並確定哪些特性可能促使颶風強度突然上升。研究人員利用IBM Watson Studio的計算算法能力開發了他們的機器學習模型。
  • 青海鹽湖所基於鹽湖資源的硝酸熔鹽儲能材料性能研究獲進展
    青海鹽湖所基於鹽湖資源的硝酸熔鹽儲能材料性能研究獲進展 2018-08-28 青海鹽湖研究所 【字體:大 中 小】
  • 《材料工程》梁秀兵工作:高熵非晶合金耐腐蝕性能研究進展
    高熵非晶合金是近年來發展起來的一種新型材料,中科院物理所汪衛華院士課題組於2011年首次提出了高熵非晶合金的概念,同時製備出具有無序結構並能在室溫下表現出類似於高分子熱塑性變形行為的塊體高熵非晶合金Zn20Ca20Sr20Yb20
  • 大連理工大學科研再獲重大突破,最新研究被國際關注!
    近期,大連理工大學材料科學與工程學院王清教授及團隊成員在模擬計算和機器學習方面取得重要進展。材料的性能與多個尺度的微觀組織結構密切相關,主要包括元素組合和基因單元等。前期工作中,課題組利用獨創的團簇式成分設計方法實現了對合金微觀組織的調控,首次從實驗中獲得了立方形態B2納米粒子在BCC基體上共格析出,展現出優異的力學性能。
  • 機器學習增強先進光源光束性能—新聞—科學網
    近日,研究人員表示已經找到了升級這些機器的方法,以產生更強、更集中、更一致的光束,從而能夠在更大範圍的樣本類型中進行更複雜、更詳細的新研究。但是一些光束特性仍然表現出性能的波動,這給某些實驗帶來了挑戰。   許多同步加速器設備為數十個同步實驗提供不同類型的光。對這些單獨光束線進行小調整增強光束性能,可以反饋到整個設施的整體光束性能。
  • 中科院最新科研進展、科技動態 2020.11.12 星期四
    科研進展1、合肥研究院等給出三種發光現象的統一解釋 2、工程熱物理所壓縮空氣儲能向心渦輪研究獲進展3、合肥研究院二維SnO2材料的理論預測研究獲進展6、青藏高原所等在時空三極環境大數據平臺研究中獲進展7、研究發現丘腦底核在新發帕金森病序列工作記憶中的作用8、天津工生所發表木質素與碳一原料協同利用研究綜述文章
  • 機器學習預測非周期超晶格結構的熱導率
    在之前的研究中,人們大多假設聲子為準粒子,通過調控粒子的散射來降低材料的熱導率,如引入晶界、嵌入納米顆粒、組合納米複合材料等。這些方法雖然能有效降低材料的熱導,但是隨著材料研究的發展,僅通過調控聲子散射來降低材料的熱導是遠遠不夠的。利用聲子的波動性來調控熱導率是另一種有效的途徑。
  • 寧波材料所熱電材料能帶工程和性能優化研究獲系列進展
    熱電材料是一類能夠實現熱電與電能直接相互轉換的功能材料,可用於半導體製冷、高精度溫控和溫差發電。為提升熱電轉換效率,需要在保持較低熱導率的基礎上儘可能提高材料的功率因子S2σ。然而Seebeck係數S和電導率σ之間具有本徵關聯性,通常難以實現功率因子的大幅度提升。利用「能帶工程」能夠在一定程度上實現S和σ的解耦合,以獲得較高的功率因子和轉換效率。
  • 研究提出對二維材料光譜學進行機器學習研究的方案
    近期,中國科學院上海光學精密機械研究所微納光電子功能材料實驗室在利用隨機森林算法實現二維材料層數和缺陷識別研究中取得新進展,揭示了機器學習算法在二維材料光譜學研究領域的應用潛力