點上方藍字計算機視覺聯盟獲取更多乾貨
在右上方 ··· 設為星標 ★,與你不見不散
編輯:SophiaAI博士筆記系列推薦:
深度學習革新了很多應用,但是背後的理論作用機制一直沒有得到統一的解釋。最近來自谷歌大腦和斯坦福的學者共同在Annual Review of Condensed Matter Physics 發布了深度學習統計力學的綜述論文《Statistical Mechanics of Deep Learning》,共30頁pdf,從物理學視角闡述了深度學習與各種物理和數學主題之間的聯繫。
地址
https://www.annualreviews.org/doi/abs/10.1146/annurev-conmatphys-031119-050745
最近,深度神經網絡在機器學習領域取得了驚人的成功,這對它們成功背後的理論原理提出了深刻的疑問。例如,這樣的深度網絡可以計算什麼?我們如何訓練它們?信息是如何通過它們傳播的?為什麼它們可以泛化?我們如何教它們想像?我們回顧了最近的工作,其中物理分析方法植根於統計力學已經開始提供這些問題的概念上的見解。這些見解產生了深度學習與各種物理和數學主題之間的聯繫,包括隨機景觀、旋轉玻璃、幹擾、動態相變、混沌、黎曼幾何、隨機矩陣理論、自由概率和非平衡統計力學。事實上,統計力學和機器學習領域長期以來一直享有強耦合交叉作用的豐富歷史,而統計力學和深度學習交叉領域的最新進展表明,這些交叉作用只會進一步深化。
概述
具有多層隱含層(1)的深度神經網絡在許多領域都取得了顯著的成功,包括機器視覺(2)、語音識別(3)、自然語言處理(4)、強化學習(5),甚至在神經科學(6、7)、心理學(8、9)和教育(10)中對動物和人類自身的建模。然而,用於獲得成功的深度神經網絡的方法仍然是一門高度熟練的藝術,充滿了許多啟發,而不是一門精確的科學。這為理論科學提出了令人興奮的挑戰和機會,以創建一個成熟的深度神經網絡理論,該理論強大到足以指導在深度學習中廣泛的工程設計選擇。雖然我們目前離這樣成熟的理論還有很長的距離,但是最近在統計力學和深度學習交叉領域出現的一批研究已經開始為深度網絡的學習和計算提供理論上的見解,有時還會提出新的和改進的方法來推動這些理論的深入學習。
在這裡,我們回顧了建立在統計力學和機器學習相互作用的悠久而豐富的歷史基礎上的這一工作體系(11-15)。有趣的是,正如我們下面所討論的,這些工作在統計力學和深度學習之間建立了許多新的橋梁。在本介紹的其餘部分中,我們將為機器學習的兩個主要分支提供框架。第一個是監督學習,它涉及到從例子中學習輸入-輸出映射的過程。第二種是無監督學習,它涉及到學習和挖掘數據中隱藏的結構模式的過程。有了這兩個框架,我們將在1.3節中介紹本綜述中討論的幾個深度學習的基本理論問題,以及它們與與統計力學相關的各種主題的聯繫。
總結
我們希望這篇綜述能夠傳達出一種對深度學習在理論層面上的成功的理解。不可避免的是,我們目前的理論理解只是未來幾年將出現的更加統一的圖景的冰山一角。然而,令人興奮的是,即使是這一可見的小領域,也揭示了深度學習這一新領域與統計力學和凝聚態物理這一相對古老的領域之間的豐富聯繫。實際上,這些領域的基本主題,如隨機景觀、相變、混沌、自旋眼鏡、幹擾、隨機矩陣、相互作用粒子系統、非平衡統計力學,以及更多的數學主題,如自由概率和黎曼幾何,都開始揭示深度學習中有趣的現象。
我們有很多機會,可以明智地將深度網絡上的受控科學實驗與更現實的訓練數據和神經網絡的玩具模型相結合,以加深我們現有的理解。這種實驗與理論的結合一直是推動物理學概念進步的動力,我們相信,深度學習將為物理學家提供更多這樣的研究機會。更有趣的是,這一研究領域可能為物理學家提供一個與計算機科學家和神經科學家聯繫的機會,同時也為非線性分布的神經迴路(無論是人工的還是生物的)如何計算、交流、學習和想像提供一個統一的理論(190)。
聲明:本文來源於網絡
如有侵權,聯繫刪除
聯盟學術交流群
掃碼添加聯盟小編,可與相關學者研究人員共同交流學習:目前開設有人工智慧、機器學習、計算機視覺、自動駕駛(含SLAM)、Python、求職面經、綜合交流群掃描添加CV聯盟微信拉你進群,備註:CV聯盟