今年夏天上傳到arXiv的挑釁性預印本中,明尼蘇達州德盧斯大學的物理學教授Vitaly Vanchurin試圖以一種特別大開眼界的方式重構現實-暗示我們生活在一個龐大的神經網絡中,該網絡控制著周圍的一切我們。換句話說,他在論文中寫道,這是「整個宇宙在其最基本的層面上都是神經網絡的可能性。」
多年來,物理學家一直試圖調和量子力學和廣義相對論。前者認為時間是普遍的和絕對的,而後者則認為時間是相對的,與時空的結構有關。
Vanchurin在他的論文中認為,人工神經網絡可以「展示兩種通用理論的近似行為」。他寫道,由於量子力學「是在各種尺度上建模物理現象的非常成功的範例,因此人們普遍認為,在最基本的層面上,整個宇宙都受量子力學規則的支配,甚至引力也應受其約束。不知何故出現了。」
「我們不僅在說人工神經網絡對於分析物理系統或發現物理定律有用,我們還說這是我們周圍世界的實際運作方式,」該論文的討論讀到。「就這一點而言,它可以被視為一切理論的建議,因此應該很容易證明它是錯誤的。」
這個概念如此大膽,以至於我們接觸到的大多數物理學家和機器學習專家都拒絕對此記錄發表評論,理由是對該論文的結論持懷疑態度。面對記者的問答,Vanchurin向我們詳細介紹了他的想法。
論文認為宇宙從根本上來說可能是一個神經網絡。您將如何向對神經網絡或物理學不太了解的人解釋這個推理?
有兩種方法。
第一種方法是從神經網絡的精確模型開始,然後在大量神經元的限制下研究網絡的行為。我所展示的是,量子力學方程很好地描述了系統接近平衡的行為,而經典力學方程很好地描述了系統如何遠離平衡。巧合?可能是,但是據我們所知,量子力學和經典力學正是物理世界的工作方式。
第二種方法是從物理學開始。我們知道,量子力學在小規模上工作得很好,而廣義相對論在大尺度上工作得很好,但是到目前為止,我們還無法在統一的框架中調和這兩種理論。這被稱為量子引力問題。顯然,我們缺少一些重要的東西,但更糟糕的是,我們甚至不知道如何處理觀察者。這在量子力學方面稱為測量問題,在宇宙學方面稱為測量問題。
然後可能有人爭辯說,有兩種現象需要統一,而不是兩種:量子力學,廣義相對論和觀察者。99%的物理學家會告訴您,量子力學是最主要的,其他一切都應該以某種方式出現,但是沒人知道到底該怎麼做。在本文中,我考慮了微觀神經網絡是基本結構以及由此產生的其他所有可能性的可能性,即量子力學,廣義相對論和宏觀觀察者。到目前為止,事情看起來很有希望。
靈感來自哪裡?
首先,我只是想更好地了解深度學習的工作原理,因此寫了一篇題為《邁向機器學習的理論》的論文。最初的想法是應用統計力學的方法來研究神經網絡的行為,但事實證明,在某些限制下,神經網絡的學習(或訓練)動力學與我們在物理學中看到的量子動力學非常相似。那時,我(現在仍然)放假休假,並決定探討一下物理世界實際上是神經網絡的想法。這個想法絕對是瘋狂的,但是如果它足夠瘋狂以至於無法實現呢?這還有待觀察。
論文中,為了證明該理論是錯誤的,「所需要做的就是找到無法用神經網絡描述的物理現象。」 是什麼意思?為什麼這樣的事情「說起來容易做起來難?」
好吧,有許多「萬物理論」,其中大多數肯定是錯誤的。按照我的理論,您所看到的一切都是神經網絡,因此要證明這一點是錯誤的,所需要做的就是找到無法用神經網絡建模的現象。但是如果您考慮一下,這是一項非常艱巨的任務,因為我們對神經網絡的行為以及機器學習的實際工作了解甚少。這就是為什麼我首先嘗試發展機器學習理論的原因
。
這個想法絕對是瘋狂的,但是如果它足夠瘋狂,那麼它會成為現實嗎?這還有待觀察。
該研究與量子力學有何關係,並解決了觀察者效應?
埃弗裡特(或多世界)的量子力學解釋和鮑姆(或隱藏變量)的解釋有兩種主要思路。關於多世界的解釋,我沒有什麼新鮮的話要說,但是我認為我可以為隱藏變量理論做出一些貢獻。在我考慮的新興量子力學中,隱藏變量是單個神經元的狀態,可訓練變量(例如偏差矢量和權重矩陣)是量子變量。請注意,隱藏變量可能是非常局部的,因此違反了Bell的不等式。預計會出現近似的時空局部性,但是嚴格來說,每個神經元都可以與其他每個神經元相連,因此系統不必是局部的。
微觀神經網絡的結構(或子網絡)更穩定,而其他結構的穩定性更差。越穩定的結構將在進化中倖存下來,而越不穩定的結構將被消滅。在最小尺度上,我希望自然選擇會產生一些非常低複雜度的結構,例如神經元鏈,但在更大尺度上,結構會更複雜。我認為沒有理由將這個過程限制在特定的長度範圍內,因此我們聲稱我們周圍看到的一切(例如粒子,原子,細胞,觀察者等)都是自然選擇的結果。