材料信息學:解碼材料基因圖譜丨科普矽立方

2020-10-27 中科院之聲

編者按:中科院之聲與中國科學院上海矽酸鹽研究所聯合開設「科普矽立方」專欄,為大家介紹先進無機非金屬材料的前世今生。我們將帶你——認識晶格,挑戰勢壘,尋覓暗物質,今古論陶瓷;彌補缺陷,能級躍遷,嫦娥織外衣,溢彩話琉璃。

被戲稱為諾貝爾「理綜獎」的化學獎今年再度授予給生物學家,以表彰她們對新一代基因編輯技術的貢獻。生物基因是生物體內攜帶遺傳信息的DNA片段,影響甚至決定著生物體的生長發育、衰老病死等所有生理過程。生物基因工程則是在分子水平上對基因進行重組,改變生物原本的遺傳信息,旨在按需設計新品種和產生新產品。那麼,同樣是由微觀粒子(原子、分子、離子等)構成的材料,是否也存在決定材料性能的「基因」呢?人們能否利用材料基因工程技術,按需設計特定性能的材料呢?

材料基因工程

答案是肯定的,而且已經引起各國的重視。早在2011年,美國聯邦政府率先啟動了一項名為「材料基因組計劃」(Materials Genome Initiative, MGI)的研究計劃,通過先進實驗和計算技術和數據共享等方式,加速新材料的發現,縮短材料研發周期,同時降低成本。同年年底,中國科學院和中國工程院召開了香山科學會議研討「材料科學系統工程」,並由徐匡迪院士、顧秉林院士、陳立泉院士和張統一院士等學者提出啟動中國的「材料基因組計劃」。此外,其他國家和地區,例如歐盟、日本和俄羅斯等也相繼啟動類似的材料研究計劃。

圖1 美國材料基因組計劃框架(圖片來自網絡)

雖然「材料基因」一詞經過多年的探討,但是至今依舊沒有明確的科學定義,其複雜性就可見一斑。相比生物基因僅由幾種核苷酸排列而成,材料組成和結構顯得更加複雜,材料基因工程的研究也更具有挑戰性。傳統的科學研究範式可能並不能滿足快速解碼材料基因圖譜的需求,因此材料信息學就應運而生。

人工智慧+材料科學

在了解材料信息學之前,我們首先需要對材料科學研究四大範式的發展脈絡有整體的認識。四大範式包括,實驗試錯、理論推演、模擬計算和數據科學。

新材料的研發最傳統的方式是實驗試錯法,即通過改變材料成分、合成手段、工藝參數等條件製備系列樣品,選出其中性能最合適的材料。很顯然,試錯法存在效率低、成本高、研發周期長等缺點,因此往往被戲稱為「炒菜法」,但是多年以來也為材料科學積累了大量的數據和經驗法則。

理論推演則是在對自然有充分認識、掌握足夠多的規律之後,科學家將自然現象抽象成數量關係,構造數學模型,並在模型預測的指導下研發材料。然而,由於實際問題往往相當複雜,理論模型的建立需要採用近似處理方法,因而不可避免地存在偏差和局限。隨著電子計算機的發展,科學家可以依據更本質的物理定律,對複雜過程進行多空間尺度模擬,從而定向設計材料成分、結構和性能。即便如此,模擬計算需要基於理論框架和依賴參數設置,因此計算結果與實驗結果大相逕庭的情況時有發生。

材料信息學一改以往研究範式對經驗和理論模型的依賴,直接針對可能與目標量相關的數據,分析其中統計關聯性,再從中研究材料成分、結構、工藝和性能之間的物理內涵。這種由數據驅動的方法藉助如今快速發展的大數據和人工智慧方法,從大量、複雜的變量集合中提取決定性因素,構建數據之間的定量關係,指導新規律的發現和新材料的快速研發。

圖2 科學研究四大範式(圖片來自網絡)

說白了,材料信息學可以簡單地認為是「人工智慧+材料科學」。提起「人工智慧」,你可能會想起幾年前的圍棋人機大戰:圍棋世界冠軍柯潔完敗。人類冠軍低頭拭淚,痛苦感嘆「它太完美,我看不到任何勝利的希望」的場景依舊曆歷在目。在柯潔戰敗之前,「AI+」早已引起學術界的重視。2016年1月27日「AI+圍棋」登上頂尖科學期刊《自然》封面,報導了谷歌 Deep Mind 的人工智慧系統阿爾法圍棋(Alpha Go)完勝歐洲圍棋冠軍。同年5月4日,「AI+材料科學」也登上了《自然》封面,報導了材料科學領域的「人機大戰」。這項研究由哈弗福德學院(Haverford College)主導,針對一種有機-無機雜化材料的水熱合成反應,通過機器學習方法從大量成功和失敗的實驗數據中發現規律,並建立判斷反應能否成功的預測模型。機器學習模型成功率高達89%,高於有經驗的化學家的人工判斷78%。這項報導充分展示了人工智慧在材料科學研究中的強大潛力,掀起了「AI+材料科學」的浪潮。

圖3 Nature封面文章:「AI+圍棋」和「AI+材料科學」 (圖片來自網絡)

「數據困境」與破解之法

兩場「人機大戰」之中,戰勝人類棋手的Alpha Go背後主要利用了深度神經網絡,戰勝人類化學家的預測模型背後主要是支持向量機,它們都屬於機器學習方法。機器學習是實現人工智慧的一類方法,其基本過程是採用程序算法利用大量的數據進行建模訓練,從數據中學習規律,最終對未知事物做出決策和預測。機器學習方法研究材料科學一般分為數據集構造、數據預處理、數據降維、模型訓練、模型測試與評價等步驟。其中,數據集構造是首要步驟,數據收集是材料信息學的重點和難點。你或許會疑惑,數據收集不是很簡單嗎?我們只需要在購物app內點擊某件商品,在新聞app內瀏覽某條新聞,在地圖app內搜索某個地點……我們在網際網路上的一切行為,每時每刻都在都轉化為數據被收集。然而,在材料科學領域,獲取一個數據可能意味著幾個小時的模擬計算,幾天的材料製備,幾周的循環測試……因此,材料學的數據很難成為「大數據」,至少現階段只能是「小數據」。正是由於數據量小,數據偏差和噪聲對模型的影響將會十分顯著。機器學習的算法再優化,計算機的算力再提升,我們手裡只有稀疏、高維、有偏差和帶噪音的數據,材料信息學將面臨「巧婦難為無米之炊」的困境。

圖4 機器學習方法研究材料科學的基本流程(圖片來自網絡)

破解「數據困境」需要從兩個方面著手:生產和流通。在數據生產方面,隨著各國有關材料基因工程的項目推進,高通量實驗和計算快速發展,對數據的標準化和高效產出有非常積極的作用。在數據流通方面,國外的Materials Project以及我國的Atomly等資料庫免費開放大量的計算數據,便於數據共享。哈弗福德學院建立了「黑暗反應計劃」(Dark Reaction Project)平臺,鼓勵研究者們在發表「成功的」數據之後,再將不發表的「失敗的」數據上傳到平臺,以供機器學習模型對化學反應進行更加深入的分析。藉助高通量、資料庫、網際網路等新技術加速材料數據生產和流通方興未艾,這個時代留給了材料人大展拳腳的廣闊舞臺。

我們不妨暢想未來的材料實驗室成為「數據工廠」的那天:智能化的實驗機器人,嚴格標準化的樣品製備和測試表徵,完全電子化的實驗記錄,融合物聯網的內部即時數據共享平臺,融合區塊鏈技術的國際數據交易平臺,以及更加先進的處理和分析數據的人工智慧方法。我們材料人將會從「磨金相、守爐子、過柱子」,甚至複雜的數據分析之中解放出來,轉型為「開發者」、「合作者」和「研究者」。「開發者」負責AI算法和智能化實驗機器的開發與維護;「合作者」熟悉編程和材料研究的兩套邏輯和語言,促進「開發者」和「研究者」的溝通交流;「研究者」捕捉行業痛點,提出科學問題,創新研究思路。到那一天,或許我們能夠解碼出材料基因圖譜,每一位材料人都能像鋼鐵俠一樣帥氣地研發材料。

圖5 這將是我們材料人的未來嗎?(圖片來自網絡)

參考文獻:

1. Agrawal A, Choudhary A. Perspective: Materials informatics and big data: Realization of the 「fourth paradigm」 of science in materials science[J]. APL Materials, 2016, 4(5):053208-1-10.

2. Liu Y, Zhao T, Ju W, et al. Materials discovery and design using machine learning[J]. Journal of Materiomics, 2017, 3(3).

3. Dima A, Bhaskarla S , Becker C , et al. Informatics Infrastructure for the Materials Genome Initiative[J]. JOM - Journal of the Minerals, Metals and Materials Society, 2016, 68(8):2053-2064.

4. Anubhav J, Shyue P O, Geoffroy H, et al. Commentary: The Materials Project: A materials genome approach to accelerating materials innovation[J]. APL Materials, 2013, 1:011002-1-11

5. Hanoch S, Alexander T. Materials Informatics. Journal of Chemical Information and Modeling 2018 58 (7), 1313-1314

6. 施思齊,徐積維,崔豔華 等. 多尺度材料計算方法[J]. 科技導報, 2015, 33(10):20-30

來源:中國科學院上海矽酸鹽研究所

相關焦點

  • 未來信息存儲的領航者——多鐵性材料丨科普矽立方
    編者按:中科院之聲與中國科學院上海矽酸鹽研究所聯合開設「科普矽立方」專欄,為大家介紹先進無機非金屬材料的前世今生。我們將帶你——認識晶格,挑戰勢壘,尋覓暗物質,今古論陶瓷;彌補缺陷,能級躍遷,嫦娥織外衣,溢彩話琉璃。在現今高速發展的社會,信息存儲對人類的重要性不言而喻。信息存儲記錄了這個社會的發展,幫助人們更好地了解這個世界並推動它的發展。
  • 陶瓷界的「抗疫多面手」——壓電陶瓷材料丨科普矽立方
    編者按:中科院之聲與中國科學院上海矽酸鹽研究所聯合開設「科普矽立方」專欄,為大家介紹先進無機非金屬材料的前世今生。
  • 「炒菜式」材料學與「計算」材料學丨科普矽立方
    編者按:中科院之聲與中國科學院上海矽酸鹽研究所聯合開設「科普矽立方」專欄,為大家介紹先進無機非金屬材料的前世今生。我們將帶你——認識晶格,挑戰勢壘,尋覓暗物質,今古論陶瓷;彌補缺陷,能級躍遷,嫦娥織外衣,溢彩話琉璃。相信大家對於炒菜一定不陌生,就算自己沒親自炒過,也一定見看過父母、朋友或者是飯店裡的廚師炒過。
  • 大自然的魔法轉換——布滿生活的人工蜘蛛絲丨科普矽立方
    編者按:中科院之聲與中國科學院上海矽酸鹽研究所聯合開設「科普矽立方」專欄,為大家介紹先進無機非金屬材料的前世今生。我們將帶你——認識晶格,挑戰勢壘,尋覓暗物質,今古論陶瓷;彌補缺陷,能級躍遷,嫦娥織外衣,溢彩話琉璃。大自然孕育了各種生物,也賦予了它們許多神奇功能。人類科學文明的進步也離不開大自然的啟發。
  • 這種「金屬氧立方」會成為新的「基因材料」嗎?| NSR
    >) 發表研究論文,報導了具有特殊穩定性的類鈣鈦礦結構中性團簇CO13O8,理論研究表明該團簇具有獨特的立方芳香性這類新型的氧鈍化金屬團簇有望用作基因新材料,研究人員將其命名為「金屬氧立方」(metalloxocubes)。
  • 被諾貝爾化學獎所鍾情的鋰電池丨科普矽立方
    編者按:中科院之聲與中國科學院上海矽酸鹽研究所聯合開設「科普矽立方」專欄,為大家介紹先進無機非金屬材料的前世今生。我們將帶你——認識晶格,挑戰勢壘,尋覓暗物質,今古論陶瓷;彌補缺陷,能級躍遷,嫦娥織外衣,溢彩話琉璃。2019年10月9日瑞典皇家科學院宣布將諾貝爾化學獎授予美國固體物理學家約翰·巴尼斯特·古迪納夫(John B.
  • 「玻璃醫療兵」——用於腫瘤治療及組織再生一體化的生物活性玻璃丨科普矽立方
    編者按:中科院之聲與中國科學院上海矽酸鹽研究所聯合開設「科普矽立方」專欄,為大家介紹先進無機非金屬材料的前世今生。
  • 【健康解碼】修復顱骨要使用哪些材料?
    在顱骨修復手術的過程當中,非常重要的一點就是如何選擇修復顱骨所使用的材料由於修復材料往往要伴隨患者此後多年的生活,因此材料在選擇時首先要求有很高的生物相容性,並且需要同時保證一定的強度和剛度,既提供足夠堅強的保護,也要滿足術中塑形的需要,達到外形修復整容滿意的效果。那麼目前顱骨修復術當中主要使用的材料都有哪些呢?
  • 丨科普矽立方
    編者按:中科院之聲與中國科學院上海矽酸鹽研究所聯合開設「科普矽立方」專欄,為大家介紹先進無機非金屬材料的前世今生。我們將帶你——認識晶格,挑戰勢壘,尋覓暗物質,今古論陶瓷;彌補缺陷,能級躍遷,嫦娥織外衣,溢彩話琉璃。地球——我們圓滾滾、水汪汪的蔚藍色家園,是因其71%表面積由海洋所覆蓋,使地球形成了如今的樣貌。
  • 原神萬國諸海圖譜突破材料是什麼 萬國諸海圖譜突破材料分享
    遊戲原神中,萬國諸海圖譜是原神中一件四星法器,能夠為角色增加元素傷害。那麼突破材料是什麼呢?讓我們一起來看原神萬國諸海圖譜突破材料一覽吧。原神萬國諸海圖譜突破材料  20級突破材料:  漆黑隕鐵的一粒*3  脆弱的骨片*3  史萊姆凝液*2  40級突破材料
  • 科學網—華中農業大學繪出最完整甜橙全基因組序列圖譜
    3月21日,甜橙全基因組序列圖譜在華中農業大學宣告完成。
  • 晶片超級電容器又添新材料
    晶片超級電容器又添新材料 矽基電極性能首次達到碳基水平 2016-06-14 科技日報 常麗君 據德國《光譜》雜誌網站近日報導,芬蘭國家技術研究中心(VTT)研究團隊最近把目光轉向了一種「不可能」的弱電材料——多孔矽,為了把它變成強大的電容器,團隊創新性地在其表面塗了一層幾納米厚的氮化鈦塗層,使其性質得以改變。  該團隊負責人麥卡·普倫尼拉解釋說,因化學反應導致的不穩定性和高電阻導致的低功率,不帶塗層的多孔矽本是一種極差的電容器電極材料。
  • 科普知識:磁光材料
    磁光材料是指在紫外到紅外波段,具有磁光效應的光信息功能材料,稀土磁光材料是一種新型的光信息功能材料。當光透過鐵磁體或被磁體表面反射形成的物理現象,被稱為磁光效應,其所用的材料被稱為磁光材料。石榴石屬於矽酸鹽類礦物,化學式:Y .³ Fe.⒌ O.12/我們在具體的試驗中,曾經使用過的化學式:Ca 0.5 B 1AI 0.6 Si 0.5 Ga 0.5 Ln 0.6 Se 1 Cr 3 / 這些都是屬於石榴石單晶結構,每個晶胞160個原子的體心立方。
  • 科普知識:磁光材料
    作者:賀俊傑磁光材料是目前世界高科技領域最具吸引力的一種新型功能材料,是高新科技必須的一種新材料,各個科技強國都在這一領域展開激烈的競爭。中國在這一領域起步較晚,主要由北京科技大學主導這方面的研究工作。
  • 後矽時代,這種材料被看好
    ,那麼如今石墨烯以外的其他穩定材料將成為「第二把鑽研後矽時代的火」。但單單使用普通的矽工藝以及做不到這一點,因為所涉及的熱量會損壞器件及其下方的互連。因此,這些方案中的許多方案都依賴於可以在相對較低的溫度下製成器件的材料。因此2D材料成為各大研究機構的突破口,二維材料往往比傳統材料要靈活得多,這使其非常適合最新的電子應用,例如柔性顯示器。
  • 高硼矽玻璃杯是什麼材料
    買玻璃杯,想問問如果是高硼矽的材質需要看它達到什麼標準嗎?用哪種材質的喝水比較好?
  • 能裝在晶片上 矽基電極性能首次達到碳基水平
    原標題:晶片超級電容器又添新材料   科技日報北京6月13日電 (記者常麗君)多年來,能裝在晶片上的微小超級電容一直廣受科學家追捧,決定電容器性能的關鍵是其電極材料,有潛力的「選手」包括石墨烯、碳化鈦和多孔碳等。
  • 3D列印材料選擇有機矽的原因是什麼?
    打開APP 3D列印材料選擇有機矽的原因是什麼? 胡薇 發表於 2018-07-11 11:17:07 目前可用於3D列印的材料,常見的有樹脂、合金(如鎳基鉻、鈷、鋁、鈦等)、聚合物、陶瓷、塑料等。
  • 新型材料的革命——新材料生態3D矽棉
    一項歷時10年研發的生態3D新型複合材料,並於2018年3月獲得國家發明專利授權,通過專利技術將納米級矽膠彈性體顆粒均勻附著在3D結構的纖維材料表面形成全新特性的複合材料,次材料命名為—SIFI。(SIFI譯為Silicone Fibers)該材料具備了聚氨酯海綿、乳膠等產品的柔軟、回彈、結構穩定等特徵,又兼有纖維材料輕質、環保、透氣、可曝曬等優勢。
  • 圓明園文化基因圖譜
    該研究院成立之後立即啟動了六個項目,其中一個尤為引人注目,它的名字叫作「圓明園文化基因圖譜研究」。「基因圖譜」本是生命科學領域的專業術語,為何會與圓明園產生關聯?「這個名稱主要是基於項目的系統性,它既有別於『歷史文化研究』,也不能簡單歸之為『品牌視覺識別系統設計』。