AI求解薛丁格方程;陶大程等深度學習理論進展綜述

2021-01-08 澎湃新聞

機器之心 & ArXiv Weekly Radiostation

參與:杜偉、楚航、羅若天

本周的重要論文包括人工智慧計算薛丁格方程的基態解以及雪梨大學陶大程等的深度學習理論進展綜述。

目錄:

Theoretical Issues in Deep Networks

Deep-Neural-Network Solution of the Electronic Schrödinger Equation

Graph Neural Networks: Taxonomy, Advances and Trends

Transferable Graph Optimizers for ML Compilers

Fourier Optical Preprocessing in Lieu of Deep Learning

Research on Deep Sequence Model for Text Generation

Recent Advances in Deep Learning Theory

ArXiv Weekly Radiostation:NLP、CV、ML 更多精選論文(附音頻)

論文 1:Theoretical Issues in Deep Networks

作者:Tomaso Poggioa、Andrzej Banburskia、Qianli Liaoa

論文連結:https://cbmm.mit.edu/sites/default/files/publications/PNASlast.pdf

摘要:人工智慧(AI)的復甦很大程度上歸功於深度學習在模式識別方面的快速發展。深度神經網絡架構的構建一定程度上受到了生物大腦和神經科學的啟發。就像生物大腦的內部運行機制一樣,深度網絡在很大程度上無法得到解釋,沒有一個統一的理論。對此,來自麻省理工學院(MIT)的研究者提出了深度學習網絡如何運行的新見解,有助於人們揭開人工智慧機器學習的黑匣子。

研究者重點探究了深度網絡對某些類型的多元函數的近似,這些函數避免了維數災難現象,即維數準確率與參數量成指數關係。在應用機器學習中,數據往往是高維的。高維數據的示例包括面部識別、客戶購買歷史、病人健康檔案以及金融市場分析等。深度網絡的深度是指計算的層數——計算層數越多,網絡越深。為了闡明自己的理論,三位研究者檢驗了深度學習的近似能力、動態優化以及樣本外性能。

網絡中的每個節點對應於要近似的函數的圖中的節點。

左圖顯示了在數據集(CIFAR-10)相同、初始化不同的網絡上,測試與訓練交叉熵損失的對比,結果顯示在訓練集上產生的分類誤差為零,但測試誤差不同;右圖顯示了在相同的數據、相同的網絡上測試與訓練損失的對比。

推薦:研究者探討了關於深度學習中非常基礎的問題,包括網絡的近似能力、優化的動態規律和強泛化能力等。

論文 2:Deep-Neural-Network Solution of the Electronic Schrödinger Equation

作者:Jan Hermann、Zeno Schätzle、Frank Noé

論文連結:https://www.nature.com/articles/s41557-020-0544-y

摘要:求解薛丁格方程可以為化學反應提供線索。化學反應的結果基本上與電子以及它們環繞原子和分子的方式有關。而控制事物反應的能量以及電子在分子中的軌道的差異決定了化學物質的形狀,也由此決定了其性質。計算這一能量的方式就是求解薛丁格方程。換句話說,求解出薛丁格方程,就可以知道化學反應的結果。然而,這並非易事。此前,我們可以精確求解的原子只有氫原子——僅具備一個質子和一個電子。最近,來自柏林自由大學的科學家提出利用人工智慧計算薛丁格方程的基態解。

受到「泡利不相容原理」(Pauli exclusion principle)的啟發,研究者將他們的方法命名為「PauliNet」。它是一種深度學習波函數擬設,可以獲得電子薛丁格方程的近乎精確解。PauliNet 具有一個作為基線的內置多參考哈特裡-福克(Hartree–Fock)解,集成有效波函數的物理特性,並使用變分量子蒙特卡羅方法(variational quantum Monte Carlo, VMC)進行訓練。

PauliNet 擬設架構的信息流。

使用這四種不同方法時,H_2、LiH、Be、B 和 H_10 五種系統的基態能量對比。

推薦:相關研究發表在 Nature Chemistry 上。

論文 3:Graph Neural Networks: Taxonomy, Advances and Trends

作者:Yu Zhou、Haixia Zheng、Xin Huang

論文連結:https://arxiv.org/pdf/2012.08752.pdf

摘要:基於特定任務,圖神經網絡為真實圖向低維空間的嵌入提供了一個強大的工具包。截止目前,針對這一主題的調研也出現了一些。但是,這些調研側重於不同的角度,如此讀者無法窺見圖神經網絡的發展全貌。所以,太原理工大學三位研究者的這篇論文克服了這一局限,對圖神經網絡進行了全面的綜述。

研究者首先提出了一種全新的圖神經網絡分類方法,然後參考了四百篇相關文獻以展示圖神經網絡的發展全景。此外,他們總結了未來圖神經網絡四種不同的發展方向,以克服面臨的挑戰。研究者希望更多的學者可以理解和探索圖神經網絡並將它們應用到自己的研究領域。

譜 GCNN(Graph Convolutional Neural Network)的計算框架。

兩種形式的圖注意力機制。

圖 LSTM 的計算框架。

推薦:圖神經網絡的分類、進展和趨勢綜述。

論文 4:Transferable Graph Optimizers for ML Compilers

作者:Yanqi Zhou、Sudip Roy、Amirali Abdolrashidi、Daniel Wong 等

論文連結:https://papers.nips.cc/paper/2020/file/9f29450d2eb58feb555078bdefe28aa5-Paper.pdf

摘要:本文中,來自谷歌、加州大學河濱分校等機構的研究者根據歸納圖神經網絡的可擴展序列注意力機制,提出了一種用於計算圖優化(graph optimization, GO)的端到端可遷移深度強化學習方法。就效果而言,GO 在整個圖上而非每個單獨的節點上生成決策,搜索速度相比以往方法大大加快。此外,研究者還提出使用循環注意力層來共同優化依賴圖優化任務並且與 TensorFlow 默認優化相比,在三個圖優化任務上實現了 33%-60% 的速度提升。

GO 架構圖。

GO 與其他模型對比。

運行時對比。

推薦:用於機器學習編譯器的可遷移圖優化器。

論文 5:Fourier Optical Preprocessing in Lieu of Deep Learning

作者:Baurzhan Muminov、Luat T. Vuong

論文連結:https://www.osapublishing.org/optica/fulltext.cfm?uri=optica-7-9-1079&id=437484

摘要:今年 8 月份,在一篇發表於 Optica 的論文中,加州大學河濱分校機械工程系助理教授 Luat Vuong 和博士生 Baurzhan Muminov 通過應用光學漩渦(具有深色中心點的旋繞光波),證明了混合計算機視覺系統的可行性。光學漩渦可以比喻為光繞著邊緣和角落傳播時產生的流體動力漩渦。

研究表明,光學預處理可以降低圖像計算的功耗,而電子設備中的數位訊號識別相關性,提供優化並快速計算可靠的決策閾值。藉助混合計算機視覺,光學器件具有速度和低功耗計算的優勢,並且比 CNN 的時間成本降低了 2 個數量級。通過圖像壓縮,則有可能從存儲和計算複雜性兩方面大幅減少電子後端硬體。Luat Vuong 表示:「本研究中的漩渦編碼器表明,光學預處理可以消除對 CNN 的需求,比 CNN 更具魯棒性,並且能夠泛化逆問題的解決方法。例如當混合神經網絡學習手寫數字的形狀時,它可以重建以前從未見過的阿拉伯或日語字符。」

該研究的成像方案。

推薦:該論文還表明,將圖像縮小為更少的高強度像素能夠實現極弱光線條件下的圖像處理。該研究為光子學在構建通用的小腦混合神經網絡和開發用於大數據分析的實時硬體方面的作用提供了新見解。

論文 6:Research on Deep Sequence Model for Text Generation

作者:張儒清

論文連結:https://www.ccf.org.cn/Focus/2020-12-03/717578.shtml

摘要:文本到文本的生成可以看做是將承載原始信息的文本轉變成符合用戶真實信息需求的文本。本文根據信息變換方式的不同,將文本到文本的生成劃分成三類任務:壓縮式生成、對等式生成和多樣化生成。其中壓縮式生成將文本或文本集合壓縮成簡明扼要的內容;對等式生成中輸入文本和輸出文本在語義上具有一一對應性;多樣化生成中輸入文本和輸出文本在語義上存在著多種對應關係。近年來,隨著深度學習的崛起,利用深度序列模型,實現序列到序列的學習已然成為文本到文本生成研究領域的主流。基於深度序列建模的文本到文本生成主要包含三個環節:輸入文本的語義理解,輸入信息到輸出信息的映射,以及輸出文本的建模。

基於此,本文研究了面向文本生成的深度序列建模過程中三個關鍵性的挑戰問題:1)輸入文本的語義繁雜性;2)輸入文本和輸出文本間的映射多 樣性;3)輸出文本的結構複雜性。

面向文本到文本生成的深度序列建模過程。

循環神經網絡 RNN 示意圖。左邊是 RNN 結構圖,右邊是輸入序列的層級展開圖。

編碼器 - 解碼器的基本框架。

推薦:本文作者為中科院計算所工學博士,主要研究計算機系統結構。

論文 7:Recent Advances in Deep Learning Theor

作者:Fengxiang He、Dacheng Tao

論文連結:https://arxiv.org/pdf/2012.10931.pdf

摘要:深度學習常常被描述成一個實驗驅動的領域,並被不斷地詬病缺乏理論基礎。得益於大量的研究文獻,這個問題已經得到了部分解決,但是這些文獻卻至今沒有很好地整合起來。在本文中,包括陶大程在內來自雪梨大學的兩位學者對深度學習理論的最新進展進行了回顧和整理,並分為以下六大部分內容:一是基於複雜性和能力的分析深度學習泛化性的方法;二是用於建模隨機梯度下降及其變體的隨機微分函數以及動態系統;三是驅動動態系統軌跡的損失場景的幾何結構;四是深度神經網絡過參數化的積極和消極作用;五是網絡架構中一些特殊結構的理論基礎;六是對倫理和安全及兩者與泛化性關聯的日益關注。

測試準確率與批大小和學習率的曲線變化圖。

MNIST 和 CIFAR-10 數據集上訓練和測試黑塞矩陣(Hessian matrices)頻譜圖。

深度學習主要泛化邊界的比較。

推薦:深度學習理論的最新進展匯總。

ArXiv Weekly Radiostation

機器之心聯合由楚航、羅若天發起的ArXiv Weekly Radiostation,在 7 Papers 的基礎上,精選本周更多重要論文,包括NLP、CV、ML領域各10篇精選,並提供音頻形式的論文摘要簡介,詳情如下:

本周 10 篇 NLP 精選論文是:

1. I like fish, especially dolphins: Addressing Contradictions in Dialogue Modelling. (from Jason Weston)

2. Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic Parsing. (from Richard Socher)

3. A Hierarchical Reasoning Graph Neural Network for The Automatic Scoring of Answer Transcriptions in Video Job Interviews. (from Kai Chen)

4. AdvExpander: Generating Natural Language Adversarial Examples by Expanding Text. (from Minlie Huang)

5. SubICap: Towards Subword-informed Image Captioning. (from Mohammed Bennamoun, Wei Liu)

6. Simple-QE: Better Automatic Quality Estimation for Text Simplification. (from Chris Callison-Burch)

7. ActionBert: Leveraging User Actions for Semantic Understanding of User Interfaces. (from Ying Xu)

8. Sentence-Based Model Agnostic NLP Interpretability. (from Pascal Frossard)

9. QUACKIE: A NLP Classification Task With Ground Truth Explanations. (from Pascal Frossard)

10. Learning Contextual Representations for Semantic Parsing with Generation-Augmented Pre-Training. (from Jun Wang)

本周 10 篇 CV 精選論文是:

1. A Deep Reinforcement Learning Approach for Ramp Metering Based on Traffic Video Data. (from Bing Liu)

2. Deep Learning-Based Human Pose Estimation: A Survey. (from Mubarak Shah)

3. Task-Adaptive Negative Class Envision for Few-Shot Open-Set Recognition. (from Shih-Fu Chang)

4. Boosting Monocular Depth Estimation with Lightweight 3D Point Fusion. (from Jiri Matas, Janne Heikkila)

5. A Survey on Visual Transformer. (from Dacheng Tao)

6. Progressive One-shot Human Parsing. (from Dacheng Tao)

7. A Holistically-Guided Decoder for Deep Representation Learning with Applications to Semantic Segmentation and Object Detection. (from Xiaogang Wang)

8. Labels Are Not Perfect: Inferring Spatial Uncertainty in Object Detection. (from Masayoshi Tomizuka)

9. 3D Object Classification on Partial Point Clouds: A Practical Perspective. (from Tong Zhang, C. L. Philip Chen)

10. CodeVIO: Visual-Inertial Odometry with Learned Optimizable Dense Depth. (from Marc Pollefeys)

本周 10 篇 ML 精選論文是:

1. Upper and Lower Bounds on the Performance of Kernel PCA. (from John Shawe-Taylor)

2. Towards Robust Explanations for Deep Neural Networks. (from Klaus-Robert Müller)

3. Augmenting Policy Learning with Routines Discovered from a Demonstration. (from Joshua Tenenbaum)

4. Unsupervised in-distribution anomaly detection of new physics through conditional density estimation. (from Uros Seljak)

5. Noisy Labels Can Induce Good Representations. (from Jimmy Ba)

6. Multi-fidelity Bayesian Neural Networks: Algorithms and Applications. (from George Em Karniadakis)

7. On Batch Normalisation for Approximate Bayesian Inference. (from Philip H.S. Torr)

8. Regret Bound Balancing and Elimination for Model Selection in Bandits and RL. (from Peter Bartlett)

9. Decentralized Federated Learning via Mutual Knowledge Transfer. (from Pramod K. Varshney)

10. Information-Preserving Contrastive Learning for Self-Supervised Representations. (from Dina Katabi)

原標題:《7 Papers & Radios | AI求解薛丁格方程;陶大程等深度學習理論進展綜述》

閱讀原文

相關焦點

  • AI求解薛丁格方程,兼具準確度和計算效率,登上《自然-化學》
    去年,DeepMind 科學家開發一種新的神經網絡來近似計算薛丁格方程,為深度學習在量子化學領域的發展奠定了基礎。今年九月份,柏林自由大學的幾位科學家提出了一種新的深度學習波函數擬設方法,它可以獲得電子薛丁格方程的近乎精確解。相關研究發表在 Nature Chemistry 上。
  • 用深度神經網絡求解『薛丁格方程』,AI開啟量子化學新未來|Nature...
    由此,人們也形成了一種既定印象,所有難以理解的問題都可以通過求解量子力學方程來解決。但事實上能夠精確求解方程的體系少之又少。薛丁格方程是量子力學的基本方程,即便已經提出70多年,它的氫原子求解還是很困難,超過2個電子的氫原子便很難保證精確度。不過,多年來科學家們一直在努力攻克這一難題。
  • 用深度神經網絡求解「薛丁格方程」,AI開啟量子化學新未來|Nature...
    由此,人們也形成了一種既定印象,所有難以理解的問題都可以通過求解量子力學方程來解決。但事實上能夠精確求解方程的體系少之又少。薛丁格方程是量子力學的基本方程,即便已經提出70多年,它的氫原子求解還是很困難,超過2個電子的氫原子便很難保證精確度。不過,多年來科學家們一直在努力攻克這一難題。
  • 用深度神經網絡求解「薛丁格方程」,AI開啟量子化學新未來|Nature子刊
    由此,人們也形成了一種既定印象,所有難以理解的問題都可以通過求解量子力學基本方程來解決。但事實上能夠精確求解方程的體系少之又少。薛丁格方程是量子力學的基本方程,即便已經提出70多年,它的氫原子求解還是很困難,超過2個電子的氫原子便很難保證精確度。
  • 用神經網絡求解薛丁格方程,DeepMind開啟量子化學新道路
    近日,DeepMind 的科學家開發了一種新的神經網絡架構,可以用於近似計算薛丁格方程。這為深度學習在量子化學領域的發展奠定了基礎。論文地址:https://arxiv.org/abs/1909.02487神經網絡已知最好的應用是在人工智慧領域——視覺、語音和遊戲,但它們在科學和工程領域也有嚴肅的應用。
  • Nat Chem | 用深度學習方法求解薛丁格方程
    引言理論上,通過求解給定原子體系電子的不含時薛丁格方程可以獲得任意化學性質近日,來自德國柏林自由大學的研究者們報導了一種新的深度學習QMC方法——PauliNet,它用功能更強大的深度神經網絡(DNN)表示替代了目前在標準Jastrow factor和backflow transformation中使用的函數形式。除了在表示能力上的增強,該網絡架構是專門為編碼有效波函數而設計的並使用多參考HF方法作為基線。
  • Nat Chem|用深度學習方法求解薛丁格方程
    引言理論上,通過求解給定原子體系電子的不含時薛丁格方程可以獲得任意化學性質。儘管目前只能精確計算出簡單孤立氫原子體系的解析解,但固態物理和量子化學領域都已經發展出了許多成功的數值近似方法。近日,來自德國柏林自由大學的研究者們報導了一種新的深度學習QMC方法——PauliNet,它用功能更強大的深度神經網絡(DNN)表示替代了目前在標準Jastrow factor和backflow transformation中使用的函數形式。除了在表示能力上的增強,該網絡架構是專門為編碼有效波函數而設計的並使用多參考HF方法作為基線。
  • AI學會解薛丁格方程了!精度和速度不遜色最流行的數學工具
    德國柏林自由大學物理系和計算機系的科學家們近日聯合開發了一種人工智慧(AI)方法,用於求解量子化學領域薛丁格方程的基態,突破傳統方法在精確度和計算效率上兩難全的困境。 相關論文於12月21日發表在《自然-化學》(Nature Chemistry)上,領導該工作的弗蘭克·諾埃(Frank Noé)相信,這個方法可能會對量子化學的未來產生重大影響。
  • DeepMind-深度學習:AI革命及其前沿進展(54頁ppt報告)
    新智元 AI World 2018 世界人工智慧峰會全程回顧新智元於9月20日在北京國家會議中心舉辦AI WORLD 2018世界人工智慧峰會,邀請機器學習教父、CMU教授 Tom Mitchell,邁克思·泰格馬克,周志華,陶大程
  • 學習一種更出色的偏微分方程求解模擬方法
    On-the-role-and-challenges-of-CFD-in-the-aerospace-Spalart-Venkatakrishnan/1f91149a0062ff9e886d5a25b34a92e1ba56a400模擬核聚變反應堆 連結https://www.exascaleproject.org/predictive-simulations-may-point-to-the-best-design-for-fusion-reactors/我們需要更快地模擬以求解這些方程
  • 《應用複變函數理論求解多元高次不定方程整數解》,創新方程求解
    內容簡介本書首次倡導應用複變函數理論,來探討多元高次不定方程整數解的求解問題。其中,第一分冊推導出了幾個必要的基本公式。而第二分冊則是應用這些基本公式,從另一個角度,用另一個方法,證明了費爾瑪大定理,並進行了更複雜不定方程整數解的求解工作。
  • 薛丁格方程學了這麼久只會求解氫原子?沒有Ta,知道薛丁格方程也白搭!
    量子力學求解的困難上世紀初出現的量子力學為我們研究微觀世界的運行機理提供了強有力的工具,似乎所有的問題都可以通過求解一個薛丁格方程來解決。但在實際應用過程中卻發現能夠精確求解的體系實在是少之又少,即便是最簡單的氫原子求解起來也並不容易,對於更加複雜的凝聚態體系更是無從下手。
  • 薛丁格方程及薛丁格的貓
    大家好,歡迎收看我的百家號萌萌說說說,今天小編要給大家介紹的是薛丁格方程及薛丁格的貓。薛丁格方程埃爾溫·薛丁格為量子力學作出了最寶貴的貢獻。他在意識到粒子表現出波動性後,提出了一個波動方程來描述亞原子粒子的運動。
  • 【仿真百科】薛丁格方程
    單電子的波函數(位置的概率函數)稱為軌道,其中的量子數 n、l 和 m 具有確定值。波函數的線性組合(疊加)也是氫原子薛丁格方程的解。著名的薛丁格的貓便是對此概念的一個抽象描述。盒子處於關閉狀態時,貓既死又活;當我們打開盒子,就能確定貓非死即活。薛丁格方程在化學和物理學領域有著廣泛的應用,不僅如此,還在半導體和電子工業中用於分析各種器件和過程中的量子效應。薛丁格-泊松方程廣泛用於描述量子點顯示器和基於量子點的半導體器件。
  • 為什麼我們常說薛丁格不懂「薛丁格方程」?
    上一期文章我詳細講解了薛丁格方程的內涵,其實薛丁格方程的作用就是預測微觀粒子所處位置的概率,因為量子力學和我們的宏觀運動力學不同,宏觀運動力學只要我們知道了運動的「初始狀態」信息,就可以根據牛頓力學計算出將來發生的一切,並且計算的結果是肯定的,不存在的概率一說。
  • 薛丁格方程
    薛丁格方程所屬的波動力學可以數學變換為維爾納·海森堡的矩陣力學,或理察·費曼的路徑積分表述。薛丁格方程是個非相對論性方程,不適用於相對論性理論;對於相對論性微觀系統,必須改使用狄拉克方程或克萊因-戈爾登方程等。
  • 神經網絡還能求解高級數學方程?
    通過開發一種將複雜數學表達式表示為一種語言的新方法,然後將解決方案視為序列到序列的神經網絡的翻譯問題,我們構建了一個在解決積分問題以及一階和二階微分方程方面都優於傳統計算系統的系統。以前,這類問題被認為是深度學習模型所無法企及的,因為求解複雜方程需要精度而不是近似值。
  • DeepMind開源薛丁格方程求解程序:從量子力學原理出發,TensorFlow...
    曉查 發自 凹非寺量子位 報導 | 公眾號 QbitAI只要解出薛丁格方程,你就能預測分子的化學性質。但現實很骨感,迄今為止,科學家只能精確求解一個電子的氫原子,即使是只有兩個電子的氦原子都無能為力。
  • 五分鐘徹底搞懂「薛丁格方程」
    但是誠如愛因斯坦提出狹義相對論時一個道理,也是一個非常反常識的理論,最後被證明居然是正確的,這也是人類第一次通過理性戰勝直覺的巨大進步。那就是薛丁格方程。可以這麼說,牛頓定律在宏觀世界裡幾乎是無所不能,那麼「薛丁格方程」就是微觀世界的「牛頓力學」,只不過微觀世界一般人不會直接觀看到,所以對薛丁格這個人感覺沒有牛頓名氣大,下面我正式給出薛丁格方程的形式。
  • 科學家成功利用人工智慧解薛丁格方程
    德國柏林自由大學(Freie Universitt Berlin)的科學家發明了一套方法,使用人工智慧計算量子化學領域薛丁格方程,幫助設計化工和藥物分子。研究人員發現從理論上說,這個過程可以利用薛丁格方程解決,但是實際操作上非常困難。在這份研究之前,科學家無法通過計算找到藥物分子設計的精確方案。這份近期發表在《自然·化學》(Nature Chemistry)期刊上的研究稱,開發了一套深度學習系統實現了精確度和計算有效性的結合,達到前所未有的效果。