金屬滷素鈣鈦礦是近年來被發現的一類新型半導體材料。因為光電性能出眾,在光伏、雷射、光傳感器、熱電等領域被廣泛研究。以金屬滷素鈣鈦礦為活性層的太陽能電池光電轉化效率目前已突破25%。就如同其他材料一樣,這種材料的晶體結構對其性質起到了決定性作用:比如,改變鈣鈦礦材料當中的金屬-滷素之間的化學鍵鍵長、鍵角和連接形式會改變其載流子遷移率和禁帶寬度。在目前的材料領域,最為準確且直接的晶體結構分析方法是「單晶X射線衍射分析」。因此,獲得鈣鈦礦及其衍生物的單晶可以直接確定其材料的結構並且幫助理解其結構-性能關係而最終獲得所需要的性能。而如何快速發現新的鈣鈦礦材料單晶並且加以表徵成為鈣鈦礦領域除材料穩定性研究之外的另一大挑戰。在自動化和人工智慧快速發展的今天,我們可不可以利用讓機器人來代替人工把博士生和博士後從繁瑣的、重複的工作中解放出來?面對複雜的實驗設計,我們可不可以讓人工智慧來代替我們思考而優化實驗並且找尋規律?再進一步來說,在數據化的時代,我們如何使用數據來加速科研進步?
為了回答以上問題,美國勞倫斯國家實驗室的李智博士做了初步的研究並且在鈣鈦礦單晶合成上做了概念性驗證。這項公開研究工作在Emory Chan研究員的指導下完成,受美國國防先進研究計劃署資助(DARPA),合作單位包括Fordham University 的Joshua Schrier 博士、Haverford College 的Alexander Norquist 博士和 Mansoor Ani Najeeb 博士、Purdue University的Matthias Zeller 博士。
下圖描述了實驗的框架,不同於一般科研流程,這項工作以數據為中心、實驗可重複性為目標:每一項操作都有嚴格的標準,所有可被記錄的實驗數據(包括實驗條件及其操作細節、單晶形成與否、反應環境溫溼度等等)都被記錄在了自主研發的軟體ESCALATE上。鈣鈦礦合成主要由NIMBUS自動加液機器人完成。實驗結果(結晶與否、材料是否為鈣鈦礦衍生物)被ESCALATE自動獲取並加以整理和準備,最終進入機器學習模型,進行分析和研究。
圖1. 實驗流程與結構圖
在這項工作中李智和他的合作者們研發了一種基於「反向溫度結晶」的自動化高通量鈣鈦礦單晶合成方法RAPID。作為初期研究,他們篩選了不同實驗條件的8172個反應,實驗對象包括了45種鈣鈦礦有機銨鹽陽離子。整個溶液調配過程和反應過程無需人為監護,總共耗時約400小時,相比之下,如果人工來完成這項實驗(假設每天做10個反應)大致需要超過兩年的時間(假設周末不工作)。由此看來機器人及其配套高通量反應流程大大提高了實驗效率並且把科研人員從繁瑣的操作中解放了出來。
圖2. 被篩選作為金屬滷素鈣鈦礦陽離子的有機銨鹽
在高通量反應條件篩選過程中,他們發現在這45個有機銨鹽裡,有19個銨鹽可以通過反向溫度結晶法與碘化鉛形成金屬滷素鈣鈦礦衍生物單晶。在這項工作之前只有4個機銨鹽被發現可以通過反向溫度法合成鈣鈦礦材料。可合成集合被擴大了五倍。這也體現了高通量合成較人工反覆試驗-失敗-試驗方法的優勢性。而且高通量數據更具有可重複性,能更加全面的得出反應條件和實驗結果之間的關係。雖然在此階段無刻意選取未被報導的有機銨鹽,但是在篩選過程中作者還是以單晶的形式發現了兩種新的鈣鈦礦材料:(C2H7N2Pb)I3 和(C7H16N)2PbI4 。其中前者為一維鈣鈦礦衍生物,後者為二維鈣鈦礦衍生物。而且這兩種材料展示了良好的熱/溼度穩定性和獨特的螢光性質。
圖3. a) (C2H7N2Pb)I3 與b) (C7H16N)2PbI4 的單晶結構
除了以上化學和材料發現外,作者通過統計分析高通量實驗數據確定了實驗可行性空間和結晶空間。並且計算出了不同有機銨鹽合成鈣鈦礦衍生物單晶的成功概率。沒有高通量實驗,這樣的統計數據是無法獲得的。所以自動化高通量實驗又一次體現了較傳統手工實驗的優勢性。在已有實驗數據的基礎上,作者使用了支持向量機器、隨機森林、神經網絡等機器學習算法對實驗條件和結晶結果進行了模擬。模擬結果顯示採用自設內核的支持向量機器模型(PUFK-SVM)對實驗結果預測準確度高達87%。此外他們還發現以單一變量優化為主的控制變量法所得到的預測準確度要遠遠低於基於多維度多變量的機器學習算法。由此看來面對複雜的實驗設計,人工智慧模型較傳統設計方法有著一定的優勢。
圖4. a) PUFK-SVM模型對不同銨鹽體系的學習曲線 b) 不同模型對乙基銨鈣鈦礦合成的學習曲線
圖5. 數據可視化和交互分析界面
最後實驗室團隊提出了「論文3.0」的概念。此項工作大部分的相關數據和Python代碼都被上傳到了GitHub,以供讀者下載調試。此外為了方便不熟悉編程的讀者,團隊還在Mybinder上創建了Python Jupyter notebook,讀者可以通過簡單的點擊和下拉框操作對數據進行可視化分析。之所以稱為學術論文3.0 的雛形是因為相較1.0(紙質)和2.0(電子版PDF),這篇工作提供了完全公開的數據並且提供了交互式分析方法。以開放數據為核心,通過數據加速科學發現正是這篇工作的目的。
這一工作發表在Chemical of Materials 上。
Robot-Accelerated Perovskite Investigation and Discovery
Zhi Li, Mansoor Ani Najeeb, Liana Alves, Alyssa Z. Sherman, Venkateswaran Shekar, Peter Cruz Parrilla, Ian M. Pendleton, Wesley Wang, Philip W. Nega, Matthias Zeller, Joshua Schrier, Alexander J. Norquist, Emory M. Chan
Chem. Mater., 2020, 32, 13, 5650–5663, DOI: 10.1021/acs.chemmater.0c01153
數據和代碼連結:
https://github.com/darkreactions/rapid
數據可視化和交互分析界面連結:
https://mybinder.org/v2/gh/darkreactions/rapid/master?filepath=RAPID.ipynb