在化工領域,對化合物性質的評估(分子診斷)已經進入通量篩選階段,但是化學合成這一步驟仍停留在手工操作階段。研究人員需要投入大量的時間精力,才能分析出正確的化學合成路徑,但是人工合成產率較低、試錯成本過高,導致合成化學技術在藥物、材料領域中的商業應用價值不足。因此,引入AI+化學合成尤為重要,利用人工智慧的逆合成分析、機器學習、神經網絡等技術,預測合成路徑,通量篩選,快速尋找到最有潛力的合成路徑。
作者 | 王柳茜、陸少遊
合成化學技術在合成材料和合成藥物領域中應用較廣,但由於不同化學反應條件下的無窮變化,該領域慢慢成為勞動密集型行業。分析過程中需要大量經驗積累,才有可能打通正確的合成路徑,而合成步驟太多、產率太低或者成本過高,使很多分析結果止步於論文發表,真正能夠實現商業化,成為一種材料、製藥工業方法的則更是鳳毛麟角。
隨著大數據和人工智慧的發展,AI+化學合成剛剛起步,以上痛點正逐漸被解決。目前在整個化學合成應用領域中,上遊市場關注於合成路線的設計,包括輔助研究人員逆向合成預測、路線篩選等;而中遊市場囊括了自動化儀器和機器人平臺的開發;下遊市場集中於醫藥企業及材料平臺的實驗室分析服務、企業集成解決方案等。上遊市場依舊佔主體,但下遊市場的研究與應用才是這個行業商業價值的實際產出。來自於企業的需求,既能豐富中遊產品的產出,同時也能夠為上遊研究的優化提供建議,從而活化整個市場行業。
神經網絡:在蒙特卡洛樹步驟中引入深度神經網絡能夠提高計算精度與效率。該項技術在化學合成領域中既可用於尋找路徑,也可對可能的逆合成路線進行初步篩選,用於訓練神經網絡的測試集包括了所有過往的有機化學反應。
計算機視覺:計算機視覺指機器代替人眼對目標進行識別、跟蹤和測量。該項技術在化學合成領域中主要應用於分子合成中的結構塊形態、反應的起始點和節點的識別。
推薦系統:推薦系統是信息過濾系統的一個子類,它根據系統所設定的條件,藉助自身雲計算的能力所實現。該項技術能夠幫助化學家在多種合成路徑當中篩選出簡潔高效的最優方法。
大數據技術:其基礎技術包括數據採集、數據預處理及資料庫等。該項技術應用在化學合成領域中包括識別關聯的數據集和數據流,創建分子感知的數據結構,並生成、細化和驗證模型,並根據數據化的模型結果來提出建議。
機器人技術:在化學合成行業中,機器人技術主要應用於以機器人執行的自動化合成平臺,機器人輔助執行所有合成操作流程,組裝連續流動路徑,實現自動化合成。包括自動檢測機器人、自動控制機器人、自動合成機器人。
創騰科技(人工智慧與分子模擬平臺):平臺主要分為材料模擬計算平臺和藥物發現與生物大分子計算模擬平臺,用「虛擬實驗」替代耗時費力的「試錯實驗」,把握正確的創新方向,為企業極大降低研發投入和風險。其中的Materials Studio材料模擬軟體以可視化視窗界面為核心,涵蓋多學科模塊;Discovery Studio是基於 Pipeline Pilot構建的分子模擬平臺,它服務於生命科學領域的實驗生物學家、藥物化學家、結構生物學家、計算生物學家和計算化學家,應用於蛋白質結構功能研究,以及藥物發現。
Wiley(Chemplanner):Wiley開發了一款建立在「大數據」和「機器學習」基礎上的化學合成軟體Chemplanner。作為計算機輔助有機合成設計系統,它可以通過雲計算幫助化學家在多種合成路徑中篩選出簡潔高效的最優方法,更重要的是,它能完成從目標產物到可獲取的起始原料間的逆合成分析。此外,Chemplanner還可以根據需要(如成本控制,有無催化劑等)重新設計路線。
美國麻省理工學院(ASKCOS):這一套可用於化學合成反應的開源軟體套件,可以根據訓練數據來確定反應的轉變和條件是否適合構築新的化合物,在系統流程的最後一步中,配方被加載進入機器人平臺,機器人操作臂將模塊式反應器、分離器和其他處理單元等組裝成連續的合成路徑進行反應。新系統能夠處理的反應類型從12種上升為30種,最簡單的合成過程只需兩個小時。
Citrine(智能材料平臺):Citrine通過定製培訓內容,培養企業客戶自主使用Citrine平臺,以便他們可以不斷從該技術中獲得最大的商業價值,尋找範圍適合的第一批項目,識別關聯的數據集並傳輸到Citrine平臺,團隊可共建一個模型,使用模型結果來建議應該合成和測試哪些候選材料。
德國馬克斯-普朗克膠體與界面研究所(自動化徑向合成設備):該設備用於小分子自動化合成,集循環合成和線性合成的優勢於一身,不需要在不同工藝之間進行費時費力的手動調整,該系統確保了反應的可重複性,只要輸入相同質量的物料,給定的合成指令將在另一個相同系統上以完全相同的方式執行。反應數據將返回給設備,以便進行深度學習。
高端人工智慧人才缺口:在AI+化學合成領域中,底層方案的鑑別和篩選可以由初級研究人員完成,但是預測路徑的開發、定向合成的優化等步驟,往往需要更高級的技術人員作為總設計師,目前企業和高校缺乏體系化的材料/藥物+信息學人才培養方案。
缺乏完善的商業機制:目前,人工智慧+化學合成的開發更多停留在實驗室階段,市場並未形成清晰的產業鏈合作方式,數據共享機制不足、設備接口不統一。這造就來自不同化學合成市場層級的商業模式不統一,發展速度較緩。
綠色合成:未來的合成化學將更加強調原子的經濟性,實現綠色合成的目標,這將主要依賴對反應機制的深入研究。通過對反應目標在基元步驟和原子層面的認識,尋找合適的催化劑,通過特定化學鍵的選擇性活化,實現原子水平的精準操控,AI在該領域的深度發展將需要底層學科的助力。
化學合成與生物合成的結合:生物合成利用基因剪接構建遺傳密碼,讓細胞來完成設計人員設想的各種任務,以期利用合成研究人員所需的生物材料、新藥和改進的藥物。合成化學與合成生物學相比較而言,前者的主要優勢在於結構的可變性,而後者的主要優勢在於過程的經濟性。兩個學科融合可綜合兩方優勢,使物質合成具有更高的效率與更多樣的結構。