識別圖像、自動駕駛、智能語音服務、下圍棋,人工智慧已經在諸多方面取得了驚人的成就。但是,距離人們創造出一個能獨立發現新自然法則的 AI 可能還有一段很長的路要走。
為了達到這一目標,最近,史丹福大學張首晟團隊創造了一個能重建化學元素周期表的 AI 程序,邁出了人工智慧獨立發現自然規律的第一步。新 AI 程序僅僅用幾個小時就完成了元素周期表的重建。這一研究成果在 6 月 26 日發表在雜誌《美國科學院院報》(Proceedings of the National Academy of Sciences of the United States of America)上。
張首晟是著名美籍華裔物理學家、美國文理科學院院士、美國國家科學院院士、中科學院外籍院士。現任史丹福大學 J.G. Jackson 和 C.J. Wood 講座教授。
圖 | 著名華人科學家張首晟
元素周期表
化學元素周期表是根據原子序數從小到大排序的化學元素列表。這一列表將化學性質相似的元素放在同一族中,進而可以準確預測各種元素的特性及不同元素之間的關係。元素周期表在化學及其他科學範疇中被廣泛使用,作為分析化學行為時十分有用的框架。
隨著新元素的發現和理論模型的發展,周期表的外觀曾經過改變及擴張,目前,我們使用的化學元素周期表是人類科學家們花了近一個世紀才獲得的。周期表可以說是化學領域最偉大的成就之一。
然而,史丹福大學幾位物理學家們開發的新 AI 程序僅僅用幾個小時就完成了這個過程。
圖 | 通過無模型方法,AI 獲得了主族(左)和副族(右)元素向量(圖源:PNAS)
該 AI 程序名為 Atomi2Vec,是一個無監督的 AI 程序。它首先分析了一個在線資料庫中的化合物名字列表,之後它便能學習分辨出不同的原子,再之後該程序借用了一些自然語言處理領域的概念,通過不同的化學特性將元素分類,其借用的概念具體說來就是:要理解一些語句,可以通過觀察上下文詞語間的邏輯來達到目的。
自然語言處理和化學元素分類
Atom2Vec 的設計基於一個被稱為 Word2Vec 的語言 AI 程序,該程序由谷歌工程師創造,用於解析自然語言。其工作原理是將單詞轉換為數字代碼(或稱為向量),通過分析向量,AI 可以判斷在其他某些詞彙也出現的情況下,一個特定詞彙出現在文中的概率。
例如,「國王」這個詞通常伴隨著「王后」,「男人」伴隨「女人」。因此,「國王」的向量計算可以大致寫為:「國王=王后-女人+男人」。
這項研究的負責人史丹福大學物理教授張首晟說,「對原子,我們可以應用同樣的方法,只是這次我們向 Atom2Vec 輸入的是所有已知的化合物,如氯化鈉(NaCl)、氯化鉀(KCl)和水(H2O)等,而不是用於自然語言處理的詞彙和語句。」
從輸入的稀疏數據中,AI 程序發現了某些規律,例如,鉀(K)和鈉(Na)肯定具有相似的性質,因為這兩種元素都可以與氯(Cl)結合。張教授說:「正如『國王』和『王后』具備相似性一樣,鉀和鈉也是相似的。」
圖 | Atom2Vec 從資料庫進行機器學習的工作流程(圖源:PNAS)
獨立發現自然規律並挑戰圖靈測試
然而,重建元素周期表並不是最終目的。張教授想做的是提出一個新的機器智能準則,看看是否能創造出一個 AI 程序,它能比人類更快更好的發現新的自然準則,但首先,AI 應該要有能力重複那些人類已經完成的偉大發現。
成功重建化學元素周期表證明 Atome2Vec 這個 AI 程序已具備這種重建的能力。
這是一個不錯的開始。張教授說:「我們想知道 AI 是否『聰明』到了可以獨立發現元素周期規律的程度,而研究證明這個問題的答案是肯定的。」
圖靈測試是用來衡量機器智能的黃金準則,一個 AI 程序若要通過圖靈測試,意味著它能用人類的方式來回答書面問題,讓人無法判斷作答的其實是機器。
研究人員一直使用圖靈測試來評估機器仿人思考的能力。雖然圖靈測試在檢驗智能行為方面有著諸多優點,但是,這個針對人工智慧的評判標準已經使用了 60 多年之久。目前,這一測試體系及其支撐理論也受到從哲學家到計算機科學家不同方面的質疑。
張教授認為,圖靈測試的瑕疵在於它過於主觀,他說:「人類是進化的產物,我們的思想中有著各種各樣的非理性。AI 要通過圖靈測試意味著它得重建人類思想中的非理性,這不僅很難做到,也並不是一種有效利用程序的方式。」
未來應用前景
除了元素周期表,張教授還希望 Atom2Vec 能應用到更多的科學研究領域。
他認為,未來科學家們可以利用 Atom2Vec 的知識來發現和設計新材料:「在這個項目中我們使用的是無監督 AI,但我們可以設想使用有監督的方式,給 AI 一個目標,並指導它找到一種能夠將陽光轉化為能量的高效材料。」
張教授的團隊已經開始研究該 AI 程序的 2.0 版,新版程序將專注於解決醫學研究中的難題:設計合適的抗體來攻擊癌細胞中的特有的抗原。目前,治療癌症的最有希望的方法之一是免疫療法,該方法利用抗體來攻擊癌細胞上的抗原。
人體可以產生超過 1000 萬種獨特的抗體,每種抗體都由大約 50 種基因以不同的組合形式構成。張教授說:「如果能將這些基因映射到向量上,我們就可以將所有抗體編寫到類似元素周期表的表格中。如果你發現一種抗體對抗原有效但有毒,你可以在同一家族中尋找另一種同樣有效但毒性較小的抗體。」