了解物理世界的「第三種方法」,AI正在改變科學

2020-11-30 億歐網

當今物理和天文實驗所產生的海量信息,沒有任何一個人或者團隊可以完整的處理。

有些實驗數據每天以千兆字節的規模在增加——而且這個趨勢只會越來越明顯。

想像一下,一臺以平方公裡為單位陣列的射電望遠鏡,預計將於2020年中開始進行科學觀測,每年將產生的信息數量可與整個網際網路相匹敵。

面對如此信息洪流,許多科學家不得不求助於人工智慧。這是一個研究者眼中神奇的工具。

只需少許人工輸入,包括人工神經網絡(計算機模擬人腦神經網絡)在內的人工智慧系統就可以輕鬆處理成千上百萬條信息,並發現其中的異常和人類絕難識別的模式。

利用計算機協助科學研究的歷史可以被追溯到75年前。

早在幾千年前,人類就已經開始從數據中尋找有效信息。科學家認為機器學習和人工智慧所運用的前沿技術,是一種研究科學的全新方法。

這種方法,即生成模型(generative modeling),僅基於數據就可以找到與觀測數據相關的諸多解釋中最為合理的理論。更重要的是,這一過程無需預先編程,對於系統可能產生作用。生成模型的支持者覺得它的創新程度可以被認為是了解宇宙的潛在的「第三種方法」。

通常,我們通過觀察來知曉萬物。約翰尼斯·克卜勒就是通過研究第谷·布拉赫的星象圖來試圖找到天體運動的規律(所有行星都是橢圓軌道上運行的),建模同時也推動著科學進步。天文學家模擬銀河與其鄰近星系仙女座的移動軌跡後,預測兩星系將於幾百萬年之後相撞。觀察和建模都能幫助科學家建立假設,而用進一步的觀察來檢驗假設。相較之下,生成模型區別於以上兩種方法。

「這是第三種方法,介乎於觀察和建模之間。」天文學家Kevin Schawinski介紹說。他此前一直就職於蘇黎世聯邦工業大學(ETH Zurich),同時也是當今生成模型最狂熱的支持者之一。「它提供了一種解決問題的新方法。」

有些科學家將生成模型和其他新技術簡單地歸類為研究傳統科學的工具。但絕大部分人的共識則是人工智慧能夠帶來巨大的影響,而且在科學研究領域的作用也將越發顯著。費米實驗室的天體物理學家Brian Nord以用人工神經網絡研究宇宙而聞名。

他擔心人類科學家所做的一切都可以被自動化,而持有這種觀點不在少數。Nord說,「這種想法讓我感到恐慌」。

神奇的GAN,基於生成的探索

還在讀書的時候,Schawinski已經在數據驅動科學領域已經小有名氣。博士學位期間,他的課題是基於表象對數千個星系進行分類。由於當時還沒有可以用來解決問題的軟體,Schawinski就想到了採用群眾外包的方式——因此大眾科學星系園項目也就應運而生。

自2007年起,天文學家開始用電腦錄入關於星系分類的最佳猜測,在多數決定原則下通常被證明為是正確的分類。之後這一項目取得了成功,但Schawinski卻意識到人工智慧已經可以取而代之。「在今天,一個有天賦、有機器學習背景且懂得雲計算的科學家能夠在一個下午完成所有的工作。」

Schawinski在2016年開始使用生成模型這種新工具。本質上,生成模型在確定條件X的前提下有多少概率能夠得到結果Y。這個方法已被證明極為有效且運用廣泛。例如,你用生成模型處理一組人臉照片,每張照片都標記了主人公的年紀。電腦程式在梳理這些「訓練數據」時,會有意識地將較老的面容和逐漸增加的皺紋數量關聯在一起。

最終,它就有能力「識別」人臉所對應的年紀——原理是它能夠預測任何年齡段人臉所可能產生的變化。

以上的人臉都是生成的。上圖第一行(A)和左邊第一列(B)是由生成對抗網絡(GAN)藉助真人人臉構建模塊構成的。GAN隨後將A中人臉的基本特(如年齡和臉型)與B中細緻特徵(如發色和眼球顏色)相結合,生成了上圖中其他的人臉。

生成模型系統中最有名的就是生成對抗網絡(GAN)。在充分接觸訓練數據後,一個生成對抗網絡能夠修復像素損壞或確實的圖像,或是銳化那些模糊的照片。生成對抗網絡通過對比的方法(即對應著術語「博弈」)來推斷出缺失信息:該網絡的組成部分之一生成器負責生成假數據,而另外的組成部分鑑別器則負責在數據中區分出這些假數據。隨著程序的運行,兩個組成部分的表現也得到了顯著提升。尤其是在由生成對抗網絡最新提供的超現實人臉中,如同上圖標題中所示,有一些讓你感覺「不存在於我們的世界卻又真實地嚇人」。

更寬泛的說法,生成模型吸收數據(通常為圖像,但也不完全是)並拆分成一組基本但抽象的構建模塊——科學家將其成為數據的「隱空間」。該算法操控隱空間的元素來探究其如何影響源數據,而這也能幫助發現系統中正在運行的物理變化。

隱空間的概念很抽象且難以用視覺表現,但假設用一個粗略的比方,想一想當你在判斷人臉對應的性別時你的大腦究竟在如何運轉。你可能會關注到髮型、鼻子形狀等,以及難以用言語表達的其他特徵。電腦程式也在相似地尋找數據中地顯著特徵:雖然它不會知道什麼是鬍子或性別,但如果學習的訓練數據中有標記著「男性」、「女性」或「長著鬍子」的照片時,電腦程式將會很快地推斷出兩者之間的相關性。

12月發表《Astronomy&Astrophysics》期刊的一篇論文中,Schawinski和他在蘇黎世聯邦工業大學的同事Dennis Turp和Ce Zhang使用生成模型來研究星系演化過程中的物理變化。(他們所用的軟體與生成對抗網絡相似,但其在對隱空間處理的技術與生成對抗網絡有所差異,所以從技術角度來說並不屬於生成對抗網絡)他們的模型創建了人工數據集,用於測試物理變化的假設。比如說,他們想知道恆星形成的「淬火」——形成速率中的快速減弱——與星系環境密度的關聯性。

對Schawinski而言,關鍵問題是僅憑數據本身能夠挖掘多少和恆星與星系演變相關的信息。「讓我們忘記所有關於天體物理學的知識。」他說,「僅僅使用數據本身,我們又能在多大程度上重新認識這些知識?」

首先,星系的圖片被壓縮到它們的隱空間。Schawinski隨即微調空間中的某一個元素,使其能對應上該星系的特定環境變化——比如,周邊物質的密度。接著,他就可以重新生成一個星系來觀察不同之處。「所以現在我就擁有了一臺假設生成設備。用它可以使我手上所有原本都是處於低密度環境的星系看上去都像是在高密度環境中一樣。」 

Schawinski他們發現當星系改變所處環境從低密度變成高密度時,星系的顏色變得更紅,星系中的恆星也變得更加向中部集中。Schawinski指出這些觀察結果與現存的星系觀測相吻合,但問題是為什麼會這樣。

Schawinski說後續分析步驟還沒有實現自動化,「我必須以人類的身份參與其中,那麼試想『究竟是怎麼樣的物理原理可以來解釋這種效應?』」對這個問題有兩種解釋:星系在高密度環境中變得更紅可能是因為高密度環境中充斥著很多塵埃,亦或是因為恆星的形成變少了。(換句話說,星系中的恆星變得更老了)現在,有了生成模型就可以檢驗這兩種思路。改變隱空間中與塵埃和恆星形成速率相關的元素來探究它們如何影響星系的顏色。「答案是顯然的。」Schawinski說,「星系變紅是恆星形成變慢,而並不是受塵埃的影響。因此,我們應該採納這種解釋。」

利用生成概率模型,天體物理學家可以研究宇宙星系從低密度區到高密度區過程的變化,以及導致這些變化的物理過程,這是一種與傳統模擬方法相依相異的方法。Schawinski教授指出,假設驅動是模擬的本質,研究中涉及的基本物理定律決定了系統所顯示得結果。在所有物理假設成立的基礎上,我們將一個行星結構和一個暗物質行為導入系統,模擬其過程並運行,結果在一定程度上與現實相反,但事實上,我們並不知道真實情況及需要的假設條件,我們寄希望於數據本身所產生的結果。

模擬的成功並不能取代天文學家和研究學者的地位,但這意味著在天體物理學域,對象和過程的學習程度的發生轉變:我們通過生成概率模型,從龐大的資料庫獲取信息變得唾手可得。Schawinski教授指出,雖然這不是完全自動化的科學,但表明我們有能力在一定程度上構建自動化科學過程的工具。

生成概率模型顯然是強大的,但它是否真正代表了一種新的科學方法呢?

供職於紐約大學及Flatiron研究所(與Quanta一樣都由Simons基金會資助)的宇宙學家David Hogg教授指出,這項技術雖然令人叫絕,但歸根結底來說,只是一種從數據中提取規律的複雜方法。幾個世紀以來,天文學家一直在使用這種先進的方法進行數據觀察和分析。

Hogg教授和Schawinski教授的工作都對AI十分依賴,Hogg教授使用神經網絡方法,根據光譜對恆星進行分類,並使用數據驅動模型推斷恆星的其他物理屬性。他認為他和Schawinski教授的工作都是經過實踐檢驗的科學,並且不認為這是第三種科學方式。他們致力於打造一個成熟運用數據的團體,尤其是在數據比較方面,即使現在Hogg教授的工作仍有待觀察。

任勞任怨的AI助理

無論在概念上是否具有新穎性,很明顯AI和神經網絡已經在當代天文學和物理學研究中扮演了重要角色。

在海德堡理論研究所,物理學家Kai Polsterer教授的天文信息學小組,致力於研發以數據為中心的天體物理學研究方法。最近,他們一直在使用機器學習算法從星係數據集中提取紅移信息,這在以前是一項艱巨的任務。

Polsterer教授將這種基於AI的系統稱作「任勞任怨的助理」,該系統可以連續梳理數據數小時,不厭倦不抱怨,完成所有繁瑣乏味的工作,這讓研究人員有時間和精力做一些他們擅長的有趣的科學研究。

Polsterer教授指出系統並不是完美無缺,算法只能執行訓練過的事項,對於未知輸入無法響應。例如,如果輸入一個已知星系,系統可以估計它的紅移信息和年齡,但如果輸入一張自拍照或腐爛的魚的圖片,系統也會輸出一個極端錯誤的估計年齡。在此案例中人類科學家扮演者重要角色,由此他認為此項技術最終需要研究人員負責監控及解釋。

供職於費米實驗室Nord教授指出重要的一點:神經網絡方法不僅要提供計算結果,而且要提供誤差區間——這是每個大學生統計課上都學過的。在科學領域,如果只計算而不提供相關誤差估計,那麼結果並不值得信任。

和其他AI研究員一樣,Nord教授也擔心神經網絡系統結果的「不易解釋」這一缺陷,通常系統提供的僅是結果,而不顯示具體這些結果是如何得到的。

然而並不是所有人都認為這是一個問題。法國CEA Saclay理論物理研究所的研究員Lenka Zdeborová指出,人類的直覺也是如此「不易解釋」。比如你看一張照片後立即認出是一隻貓,但事實上你不知道這是怎麼回事,從某種意義上說,大腦就是一個黑盒子。

不僅是天體物理學家和宇宙學家向AI推動的數據驅動、數據推動科學遷移,量子物理學家也使用神經網絡來解決一些十分棘手且重要的問題。

供職於周界理論物理研究所和安大略省滑鐵盧大學的Roger Melkoof教授,使用神經網絡技術解決了描述多粒子系統的數學波函數問題。Melkoof教授將必不可少的AI技術稱為「維數的指數詛咒」,波函數形式的可能隨粒子數量呈指數增長。這一模擬過程的難點類似嘗試在象棋或圍棋遊戲中找出最佳走法,即你在試圖走下一步前,會想像你的對手會如何應對,在這些走法中選擇最佳的一個,但每走一步,可能性就會呈指數激增。

當然,AI系統已經掌握了西洋棋和圍棋遊戲的玩法,從十年前徵服西洋棋,到2016年AlphaGo擊敗了人類頂級圍棋棋手。Melkoof教授由此認為,人工智慧在量子物理學中同樣具有適用性。

科學研究的「第三種方法」

無論Schawinski教授認為AI是科學研究的「第三種方法」是否正確,或者如Hogg教授認為,這種方法只是傳統觀察和數據分析的「外掛」,但毫無疑問的是AI正在改變科學發現方法,並起到明顯的促進作用,那麼AI革命將在科學研究上走多遠?

有人對「機器人科學家」的成就誇誇其談。十年前,一位名叫亞當的AI機器人化學家研究了麵包酵母的基因組,並找出了製造特定胺基酸的基因。亞當通過觀察某些基因缺失的酵母株,將結果與具有這些基因菌株的行為進行比較。

最近,格拉斯哥大學的化學家Lee Cronin教授一直在使用機器人隨機混合化學物,看看會形成什麼樣的新化合物。該系統通過質譜儀、核磁共振儀和紅外光譜儀實時監測反應並最終預測哪種組合反應最為強烈。Cronin教授指出,即使這個機器人系統不能帶來進一步的發現,它也能使化學家們的研究速度提高約90%。

蘇黎世聯邦理工學院的另一組科學家去年利用神經網絡,從一組數據中推導出了相關物理定律。他們的系統類似於機器人克卜勒(kepler),通過記錄從地球上看到太陽和火星在天空中的位置,重新發現了太陽系的日心模型,並通過觀察碰撞的球體,得出了動量守恆定律。由於物理定律通常不止一種表達式,研究人員想知道這個系統是否會提供新的方法表達已知物理定律。

以上都是AI啟動科學發現過程的案例,儘管在每種情況下,我們都可以討論這種新方法的革命性。但最有爭議且緊急的問題是,在這個數據堆積如山的時代,我們能從中收集多少信息。

在《The Book of Why》(2018)一書中,計算機科學家Judea Pearl和科學作家Dana Mackenzie指出,數據其實並不是十分智能,數據無法解釋因果關係,使用各個模型分析數據的論文或研究都只給出結果或變換數據,不能做出解釋。Schawinski教授同意Pearl教授的觀點,但是指出這種觀念偷換了概念,他從未聲稱要以這種方式推斷因果關係,而只是使用這種方法可以比常規方法做的更多。

科學需要創造力,但到目前為止,沒有恰當的方法將創造力引入機器編程。Polsterer教授說「提出一個有邏輯的新理論需要創造力。而每當你需要創造力的時候,你就需要人類。」創造力從何而來?Polsterer教授覺得創造力和「無聊」有關,機器是無法感受到無聊的。「想變得有創造性,你必須討厭無聊。我不認為機器會覺得無聊。」但另一方面,我們卻用著「創意」和「靈感」等詞彙來描述深藍(Deep Blue)和AlphaGo等程序。描述機器「思想」內部發生了什麼的困難反映了我們探索自己的思維過程是多麼的困難。

Schawinski教授最近離開學術界進入了私企,運營一家名為Modulos的初創公司,Modulos僱傭了許多ETH的科學家,公司在官網口號是,「在AI和機器學習的發展風暴中心工作」。無論當前的AI技術和成熟技術間存在何種障礙,他和其他專家都認為,機器人已經準備好做越來越多的人類科學家的工作,即使機器在這方面存在一定限制性。

在可預見的未來,我們能否製造出一臺使用生物硬體的機器,能夠解決那些連世界上最聰明的人類也無法獨立完成的物理或數學問題。科學的未來最終是否有可能歸宿於機器驅動,令人期待。

本文經授權發布,版權歸原作者所有;內容為作者獨立觀點,不代表億歐立場。如需轉載請聯繫原作者。

相關焦點

  • 中國高能物理走上世界舞臺,《閃耀的平凡》探訪科學巨擘王貽芳
    2012年,以中科院院士王貽芳為代表的中國團隊,成為全球首個發現中微子第三種振蕩模式的科研團隊,在整個物理界引起了轟動,成為世界中微子研究的一個重要裡程碑。江門中微子實驗即將在2022年完成的探測器建造,是中國前所未有的最複雜高能物理實驗裝置,比目前最好的國際同類裝置大20倍,預計能將中微子振蕩參數的精度,提高一個數量級。
  • 愛因斯坦預測的星系翹曲,成為測量「宇宙膨脹」的第三種方法
    宇宙正在膨脹,這是宇宙學上最大的爭論之一,但宇宙膨脹速度到底有多快?兩種可用的測量產生了不同結果。萊頓物理學家大衛·哈維採用了一種獨立的第三種測量方法,使用了愛因斯坦預測的星系翹曲特性,其研究成果發表在《皇家天文學會月刊》上。自哈勃時代以來,關於宇宙膨脹,我們已經知道了將近一個世紀。天文學家指出,來自遙遠星系光的波長比距離近的星系要短。
  • 愛因斯坦預測的星系翹曲,成為測量「宇宙膨脹」的第三種方法!
    宇宙正在膨脹,這是宇宙學上最大的爭論之一,但宇宙膨脹速度到底有多快?兩種可用的測量產生了不同結果。萊頓物理學家大衛·哈維採用了一種獨立的第三種測量方法,使用了愛因斯坦預測的星系翹曲特性,其研究成果發表在《皇家天文學會月刊》上。自哈勃時代以來,關於宇宙膨脹,我們已經知道了將近一個世紀。
  • 首次發現中微子的第三種振蕩模式
    首次發現中微子的第三種振蕩模式2012年,是大亞灣實驗備受關注的一年。這一年3月,王貽芳領銜的大亞灣實驗團隊宣布,歷時6年的大亞灣實驗取得了重大突破——首次發現了中微子的第三種振蕩模式,並精確測量到其振蕩概率。這項成果在國際高能物理界引起熱烈反響,被譽為「開啟了未來中微子物理發展的大門」。
  • 三種常見的薄膜材料物理氣相沉積方法(PVD)
    常見的沉積薄膜的方法,包括:真空蒸鍍(vacuum evaporation),磁控濺射(magnetron sputtering),電弧離子鍍(arc ion plating/deposition),三種方法均屬於物理氣相沉積(PVD)。什麼是物理氣相沉積(PVD)?
  • 吳恩達deeplearning.ai五項課程完整筆記了解一下?
    機器之心簡要介紹了該項目,並重點描述了第五項課程序列模型。項目地址:https://github.com/mbadry1/DeepLearning.ai-Summary上周吳恩達在推特上展示了一份由 TessFerrandez 完成的深度學習專項課程信息圖,這套信息圖優美地記錄了深度學習課程的知識與亮點。
  • Facebook AI 正在升維突破:教AI像人類一樣理解三維世界
    研究團隊相信,通過加強對三維物體的了解,AI 可以更緊密地連接二維和三維世界,在計算機視覺領域扮演更重要的角色,推動 3D 列印、AR 和 VR 等技術在現實生活中的進步,將這些技術拓展到更廣泛的任務上,最終像人類一樣理解三維世界。
  • 我國發現第三種中微子振蕩 有助揭開宇宙起源和演化之謎
    美國《科學》雜誌16日發表文章,報導了大亞灣實驗發現的第三種中微子振蕩,並稱此重大成果標誌著中國科研正在崛起。據了解,對中微子前兩種振蕩模式的研究曾獲得諾貝爾獎。什麼是中微子振蕩中微子是一種極難被探測到的基本粒子,在微觀的粒子物理和宏觀的宇宙起源及演化中都極為重要。中微子共有三種類型,它可以在飛行中從一種類型轉變成另一種類型,稱為中微子振蕩。
  • 人工智慧正在如何改變世界:BBC 總結 AI 的 A 到 Z
    AI 逐漸走出研究實驗室,進入現實世界,對我們的生活產生深遠影響。毫無疑問,我們正在進入人工智慧時代。它們出現在社交媒體信息流、客戶服務頁面和網站上,提供對話、建議和陪伴,它們正在改變我們與社會組織的互動方式,這些組織包括公用事業公司、成人網站、披薩遞送公司、在線商店、銀行甚至政府等。
  • 【物理世界】改變世界的十個公式
    1971年尼加拉瓜發行了十張一套題為「改變世界面貌的十個數學公式」郵票,由一些著名數學家選出十個以世界發展極有影響的公式來表彰。
  • 「獨家」圖靈獎得主姚期智出任Pony.ai首席顧問,將打造自動駕駛...
    剛剛從加州矽谷飛回北京的Pony.ai的高管團隊剛下飛機便趕來赴約,拜訪最頂級的學者和科學領袖、華人唯一的圖靈獎得主、中科院院士姚期智先生。對於Pony.ai的CEO彭軍來說,雖然多次見姚先生,但是每次來到他的辦公室前都有一種莫名的激動,感覺像來朝聖。CTO樓天城顯得更加激動,博士四年朝夕相處的導師的辦公室就在眼前。
  • 【物理公式】這4個物理公式改變未來,重新定義世界.
    便在電腦前繼續碼字,跟你分享我所理解的物理。如同喜歡數學公式那般的簡潔,對於物理,超模君也喜歡物理的公式。物理公式就像是魔法一樣,我們通過他,了解了世界的過去:宇宙的誕生,地球的年齡;也是通過他,我們也知道了未來:地球破滅的時刻,地外文明是否存在;通過他,看到了宇宙的終極命運。
  • 三個重要因素:物理思想的開放、物理方法改變和先進的實驗儀器
    在1609年出版的《新天文學》中,克卜勒公布了兩大行星運動定律,又經過近10年的觀測,分析研究,發現了行星運動的周期規律,在1619年出版的《世界的和諧》一書中公布了另外一大行星運動定律。
  • 揭開神秘科學:一套開發內心潛能,改變心性的科學方法
    佛家方面,我參加了很多次禪修之後,逐漸確認,禪修不是宗教,而是一套開發內心潛能,改變心性的科學方法。 之後,又發現我自己禪修的體驗和覺受,西方學府都開始有了科學的解釋。
  • 正在上初二,現在聽不懂物理了,怎麼辦?
    在說學習方法之前,我們先來了解一下這位家長的孩子到底屬於哪一類型的,據我觀察,現在的中學生分為很多學習類型:1.徹底放棄學習物理,上課從來不聽課的。如果屬於第二種和第三種情況,那麼,這樣的學生就是非常有希望的學生,也正是我今天要重點說的。這兩類學生,都曾經努力過或者正在努力,所以他們曾經有或者依然有一顆上進的心,還能通過學習方法、學習態度、學習習慣等方面來糾偏,從而逆襲成物理學霸!
  • 我國發現第三種中微子振蕩模式:「搶」出來的物理學成果
    別了,大亞灣中微子實驗【我國發現第三種中微子振蕩模式:「搶」出來的物理學成果】 中國科學院高能物理研究所的科研人員2003年提出設想,利用我國大亞灣核反應堆群產生的大量中微子,來尋找中微子的第三種振蕩模式,並精確測量該振蕩的機率。
  • 「第三種」振蕩或將揭開宇宙起源和演化之謎
    「第三種」振蕩或將揭開宇宙起源和演化之謎 新華社 發  2012年12月20日,美國《科學》雜誌公布了2012年全球科學領域獲得的十大突破,其中大亞灣中微子實驗室發現「第三種振蕩」榜上有名。《科學》指出,中微子實驗國際合作組發現中微子的「第三種振蕩」並測量到了振蕩機率,這是全世界高能物理學家十幾年來的夢想。
  • 初中物理科學探究的方法
    物理是一門自然科學,由於它聯繫實際緊密,生活中的應用廣泛,因此學生比較感興趣。我們在教學過程中除讓學生掌握基礎知識和基本技能外,重要的是讓學生掌握一些研究問題的方法,使學生在進行科學探究、學習物理知識的過程中,逐漸拓寬視野,初步領悟到科學研究方法的真諦。
  • 物理學習乾貨:10分鐘了解中學物理常用方法
    >方法2:(理想)模型法方法介紹:為了更形象,更直觀地表示某一種物理現象或物理規律,利用科學抽象的方法,抽象出簡單直觀的物理模型,利用物理模型研究物理問題。,再進行合理推理得出正確結論,理想實驗法也叫做實驗推理法,就是在物理實驗的基礎上加上合理的科學的推理得出結論的方法就叫做理想實驗法。
  • AI 正在改變化學界,開源資料庫成重要驅動力
    但因為人工智慧,這一切都可能發生改變。人工智慧正在徹底改變化學研究的面貌。近日,刊登在《Nature》的一篇評論中,來自英國和美國的國際科學家團隊回顧了機器學習在化學領域的快速進展,並探究了機械學習在化學設計方面日益增長的潛力。