7 Papers & Radios | ACL 2020獲獎論文;貝葉斯深度學習綜述

2020-12-06 澎湃新聞

機器之心 & ArXiv Weekly Radiostation

參與:杜偉、楚航、羅若天

本周的重要論文包括 ACL 2020 公布的最佳論文、最佳主題論文、最佳 Demo 論文以及其他獎項論文,此外還有 MIT 和香港科技大學學者的貝葉斯深度學習綜述論文。

目錄:

Beyond Accuracy: Behavioral Testing of NLP Models with CheckList

Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data

GAIA: A Fine-grained Multimedia Knowledge Extraction System

A Survey on Bayesian Deep Learning

Deep Isometric Learning for Visual Recognition

Data Science: A Comprehensive Overview

Adaptive Graph Encoder for Attributed Graph Embedding

ArXiv Weekly Radiostation:NLP、CV、ML 更多精選論文(附音頻)

論文 1:Beyond Accuracy: Behavioral Testing of NLP Models with CheckList

作者:Marco Tulio Ribeiro、Tongshuang Wu、Carlos Guestrin、Sameer Singh

論文連結:https://www.aclweb.org/anthology/2020.acl-main.442.pdf

摘要:儘管衡量留出(held-out)準確率是評估模型泛化性能的主要方法,但它通常會高估 NLP 模型的性能,而其他評估模型的替代性方法要麼專注於單項任務,要麼只看特定行為。

受軟體工程中行為測試原則的啟發,這項研究提出了一種與任務無關的 NLP 模型測試方法——CheckList。CheckList 不僅包含一些通用語言能力和測試類型以促進全面的測試,還包括一個軟體工具,能夠快速生成大量不同測試案例。研究人員在三項任務中測試了 CheckList 的效果,在商業化模型和 SOTA 模型中都發現了嚴重的問題。

一項用戶調查顯示,負責商業化情感分析模型的團隊在一個經過大量測試的模型中發現了新的 bug。而在另一項用戶調查中,使用 CheckList 的 NLP 從業者創建的測試數量是未使用 CheckList 的兩倍,發現的 bug 數量是後者的三倍 。

商業情感分析模型的 Checklist。

情感分析測試。

用戶研究結果。

推薦:本文斬獲 ACL 2020 最佳論文獎。

論文 2:Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data

作者:Emily M. Bender、Alexander Koller

論文連結:https://www.aclweb.org/anthology/2020.acl-main.463/

摘要:大型神經語言模型在許多 NLP 任務上獲得成功。但是,在本文中,來自華盛頓大學和薩爾大學的兩位研究者發現這些成功有時會被過度誇大。這些模型經常被描述成「理解」語言或者捕獲語言的「意義」。

該研究認為,僅接受形式訓練的系統不具備學習語言意義的能力。在 ACL 2020 的主題「Taking Stock of Where We』ve Been and Where We’re Going」下,該研究認為,清晰地理解「形式」與「意義」的區別有助於引導該領域在自然語言理解層面有更科學的發展。

研究者使用的示例。

推薦:本文斬獲 ACL 2020 最佳主題論文獎。

論文 3:GAIA: A Fine-grained Multimedia Knowledge Extraction System

作者:Manling Li、Alireza Zareian、Ying Lin 等

論文連結:https://blender.cs.illinois.edu/paper/aidaacl2020demo.pdf

項目地址:https://github.com/GAIA-AIDA

摘要:在本文中,來自 UIUC、哥大等機構的研究者提出了首個綜合開源的多媒體知識提取系統,該系統可基於不同的內容源和語言提取大量非結構化異構多媒體數據,並遵循豐富細粒度本體,創建出連貫且結構化的知識庫、索引實體、關係和事件。

該研究提出的系統 GAIA 可實現複雜圖 query 的無縫搜索,並檢索出文本、圖像和視頻等多媒體證據。GAIA 在近期的 NIST TAC SM-KBP2019 評估中實現了頂級性能。

GAIA 多媒體知識提取的架構。

與以往研究中的粗粒度知識提取系統相比,GAIA 支持細粒度實體、關係和事件提取。

基於人臉識別、地標識別和國旗識別的視覺實體連結示例。

推薦:本文斬獲 ACL 2020 最佳 Demo 論文獎。

論文 4:A Survey on Bayesian Deep Learning

作者:Hao Wang、Dit-Yan Yeung

論文連結:https://arxiv.org/pdf/1604.01662.pdf

摘要:一個全面的人工智慧系統不僅需要通過視覺和聽覺等不同的「感官」來感知環境,還需要對條件甚至因果關係以及相應的不確定性進行推理。在過去十年裡,感知任務已經陸續取得重大進展,比如視覺目標識別以及使用深度學習模型的語音識別。但是,對於更高層次的推理,具有貝葉斯屬性的概率圖模型(Probabilistic Graphical Model, PGM)仍然更加強大和靈活。

近年來,作為一種統一的概率框架,貝葉斯深度學習(Bayesian Deep Learning, BDL)已經緊密結合了深度學習與貝葉斯模型。並且在這個通用框架中,藉助深度學習感知文本或圖像可以提升更高層次推理的性能。

在本文中,來自麻省理工學院和香港科技大學的兩位研究者對貝葉斯深度學習進行了全面的介紹,綜述了貝葉斯深度學習在推薦系統、主題模型和控制等方面的最新應用。此外,研究者還探討了貝葉斯深度學習與神經網絡貝葉斯處理等其他相關主題之間的關係和區別。

貝葉斯深度學習示例的概率圖模型結構。

左為協同深度學習(Collaborative Deep Learning, CDL)的圖模型,右為退化協同深度學習的圖模型。

推薦:本文一作王灝(Hao Wang)為 MIT CSAIL 博士後研究員,論文已被 ACM Computing Surveys 接收。

論文 5:Deep Isometric Learning for Visual Recognition

作者:Haozhi Qi、Chong You、Xiaolong Wang、Yi Ma、 Jitendra Malik

論文連結:https://arxiv.org/pdf/2006.16992.pdf

摘要:初始化、歸一化和殘差連接(skip connection)被認為是訓練深度卷積神經網絡(ConvNet)並獲得最優性能的三大必備技術。

最近,來自加州大學伯克利分校和聖地牙哥分校的研究者發布一項研究,提出不使用歸一化和殘差連接的深度 ConvNet 在標準圖像識別基準上也能實現優異的性能。其實現方式是:在初始化和訓練期間,令卷積核具備近似保距性(near isometric);使用 ReLU 激活函數的變體,實現保距性。

研究人員進行了大量實驗,結果表明此類近似保距網絡與殘差連接結合後,在 ImageNet 數據集上的性能與 ResNet 相當,在 COCO 數據集上的性能甚至超過 ResNet。

ISONet 的基礎構造塊圖示。

ISONet 的 Top-1 準確率接近 ResNet。

不同層數(18、34、50 和 101)時 ISONet 在 ImageNet 上的 top-1 準確率。

推薦:靠暴力土豪 trial and error 的方式尋找網絡結構的風氣,應該會很快過去。

論文 6:Data Science: A Comprehensive Overview

作者:Longbing Cao

論文連結:https://arxiv.org/pdf/2007.03606.pdf

摘要:在本文中,來自雪梨科技大學的研究者對數據科學的基礎知識進行了全面的綜述,涵蓋數據分析到數據科學的演變、數據科學的概念、數據科學時代的願景、數據創新的主要挑戰和發展方向、數據分析的本質、數據經濟中的新型工業化和服務機遇、數據教育專業和能力、以及數據科學的未來。

數據科學領域的一些關鍵術語。

谷歌在線搜索數據科學關鍵詞的逐年變化曲線。

數據科學概念圖。

推薦:這篇論文首次勾勒出了數據科學領域的全面視圖,還提供了關於數據科學和分析的豐富觀察、教訓和思考。

論文 7:Adaptive Graph Encoder for Attributed Graph Embedding

作者:Ganqu Cui、Jie Zhou、Cheng Yang、Zhiyuan Liu

論文連結:https://arxiv.org/pdf/2007.01594.pdf

摘要:在本文中,來自清華大學等機構的研究者提出了一種新穎的屬性圖嵌入框架自適應圖編碼器(Adaptive Graph Encoder, AGE)。該框架由兩個模塊組成,其一,為了更好地減輕節點特徵中的高頻噪聲,AGE 首次應用了精心設計的拉普拉斯算子平滑濾波器;其二,AGE 採用的自適應編碼器能夠取得濾波後特徵的迭代增強,以實現更好的節點嵌入。

在實驗部分,研究者使用四個公共基準數據集進行實驗,以驗證 AGE 在節點聚類和鏈路預測任務上的效果。

AGE 框架圖。

自適應圖編碼器算法。

AGE 與其他方法在節點聚類任務上的實驗結果比較。

推薦:實驗結果表明,AGE 在節點聚類和鏈路預測任務上始終優於當前 SOTA 圖形嵌入方法。

ArXiv Weekly Radiostation

機器之心聯合由楚航、羅若天發起的ArXiv Weekly Radiostation,在 7 Papers 的基礎上,精選本周更多重要論文,包括NLP、CV、ML領域各10篇精選,並提供音頻形式的論文摘要簡介,詳情如下:

本周 10 篇 NLP 精選論文是:

1. Improving Event Detection using Contextual Word and Sentence Embeddings. (from Evangelos Milios)

2. TICO-19: the Translation Initiative for Covid-19. (from Philipp Koehn)

3. On-The-Fly Information Retrieval Augmentation for Language Models. (from David McAllester)

4. Principal Word Vectors. (from Joakim Nivre)

5. Greedy Transition-Based Dependency Parsing with Discrete and Continuous Supertag Features. (from Joakim Nivre)

6. Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion. (from Kun Zhou, Ji-Rong Wen)

7. Interpreting Hierarchical Linguistic Interactions in DNNs. (from Xiaoyi Bao)

8. What Gives the Answer Away? Question Answering Bias Analysis on Video QA Datasets. (from Louis-Philippe Morency)

9. Learning Neural Textual Representations for Citation Recommendation. (from Massimo Piccardi)

10. KQA Pro: A Large Diagnostic Dataset for Complex Question Answering over Knowledge Base. (from Juanzi Li)

本周 10 篇 CV 精選論文是:

1. Long-term Human Motion Prediction with Scene Context. (from Jitendra Malik)

2. 3D Shape Reconstruction from Vision and Touch. (from Jitendra Malik)

3. LabelEnc: A New Intermediate Supervision Method for Object Detection. (from Xiangyu Zhang, Jian Sun)

4. AutoAssign: Differentiable Label Assignment for Dense Object Detection. (from Jian Sun)

5. End-to-end Interpretable Learning of Non-blind Image Deblurring. (from Jian Sun, Jean Ponce)

6. Video Prediction via Example Guidance. (from Xiaokang Yang, Trevor Darrell)

7. Human Trajectory Forecasting in Crowds: A Deep Learning Perspective. (from Sven Kreiss)

8. Explainable Deep One-Class Classification. (from Klaus-Robert Müller)

9. Dynamic Group Convolution for Accelerating Convolutional Neural Networks. (from Matti Pietikäinen, Li Liu)

10. ThreeDWorld: A Platform for Interactive Multi-Modal Physical Simulation. (from Joshua B. Tenenbaum)

本周 10 篇 ML 精選論文是:

1. 3D Topology Transformation with Generative Adversarial Networks. (from Albert-László Barabási)

2. Network Embedding with Completely-imbalanced Labels. (from Zheng Wang, Philip S. Yu)

3. Personalized Federated Learning: An Attentive Collaboration Approach. (from Jiangchuan Liu, Jian Pei)

4. Learning while Respecting Privacy and Robustness to Distributional Uncertainties and Adversarial Data. (from Gang Wang, Georgios B. Giannakis)

5. Strong Generalization and Efficiency in Neural Programs. (from Pushmeet Kohli, Oriol Vinyals)

6. Estimating Generalization under Distribution Shifts via Domain-Invariant Representations. (from Antonio Torralba)

7. Deep Partial Updating. (from Lothar Thiele)

8. PinnerSage: Multi-Modal User Embedding Framework for Recommendations at Pinterest. (from Jure Leskovec)

9. Neural Subgraph Matching. (from Jure Leskovec)

10. Semi-Supervised Learning with Meta-Gradient. (from Ming-Ming Cheng, Ming-Hsuan Yang)

原標題:《7 Papers & Radios | ACL 2020獲獎論文;貝葉斯深度學習綜述》

閱讀原文

相關焦點

  • 7 Papers & Radios | EMNLP 2020最佳論文;新型優化器AdaBelief
    學習和影響潛在意圖(LILI)算法。air hockey 實驗的學習結果。推薦:CoRL 2020 最佳論文。聯合學習技能嵌入和技能先驗的深度潛變量模型。算法 1。本研究方法與其他方法的下遊任務學習曲線。推薦:CoRL 2020 最佳 Presentation 論文。
  • 網絡表示學習領域(NRL/NE)必讀論文匯總
    這份清單共包含 5 篇綜述論文和 64 篇會議期刊論文。同時兩位研究者在 GitHub 上發布了 NE / NERL 的開源工具包 OpenNE。該庫提供了標準的 NE / NRL(網絡表示學習)培訓和測試框架,目前在 OpenNE 中實現的模型包括 DeepWalk,LINE,node2vec,GraRep,TADW 和 GCN。
  • 7 Papers|谷歌等用神經網絡給照片打光,沈向洋等神經語言處理綜述
    機器之心 & ArXiv Weekly Radiostation參與:杜偉、楚航、羅若天本周的重要論文有谷歌等研究機構用神經光傳輸為照片二次打光的探索,以及沈向洋等從建模、學習和推理三方面展開的神經 NLP 綜述。
  • 一窺ACL 2018 最佳論文
    雷鋒網 AI 科技評論按:隨著定於 7 月 15 日的開會日期逐漸臨近,自然語言處理頂會 ACL 2018 繼公開了接收論文名單之後,今天也公布了包含 3 篇長論文 與 2 篇短論文的最佳論文獲獎名單。
  • AI求解薛丁格方程;陶大程等深度學習理論進展綜述
    機器之心 & ArXiv Weekly Radiostation參與:杜偉、楚航、羅若天本周的重要論文包括人工智慧計算薛丁格方程的基態解以及雪梨大學陶大程等的深度學習理論進展綜述。
  • 7 papers|NeurIPS 2019獲獎論文揭曉;OpenAI刀塔2論文公布
    論文 7:Point-Voxel CNN for Efficient 3D Deep Learning作者:Zhijian Liu、Zhijian Liu、Zhijian Liu、Zhijian Liu論文連結:https://arxiv.org/pdf/1907.03739.pdf摘要:我們發現之前的工作竟需要花 80% 以上的時間進行對數據的不規則訪問以作為卷積運算的準備工作
  • 入門| 獻給新手的深度學習綜述
    Naher 參與:翁俊堅、劉曉坤 這篇綜述論文列舉出了近年來深度學習的重要研究成果,從方法、架構,以及正則化、優化技術方面進行概述。機器之心認為,這篇綜述對於剛入門的深度學習新手是一份不錯的參考資料,在形成基本學術界圖景、指導文獻查找等方面都能提供幫助。
  • 清華大學朱軍:貝葉斯學習回顧與最新進展| YEF 2020
    這個方向下有兩個主題,一個是用貝葉斯做深度學習(Bayesian Deep Learning),另一個是用深度學習做貝葉斯(Deep BayesianLearning)。  貝葉斯方法和深度學習方法的「聯姻」可以追溯到上世紀90年代的甚至更早,當時大家主要研究的是如何用貝葉斯方法進行神經網絡的計算,或者進行神經網絡結構的選擇。
  • 清華大學朱軍:貝葉斯學習回顧與最新進展|YEF 2020
    這個方向下有兩個主題,一個是用貝葉斯做深度學習(Bayesian Deep Learning),另一個是用深度學習做貝葉斯(Deep BayesianLearning)。貝葉斯方法和深度學習方法的「聯姻」可以追溯到上世紀90年代的甚至更早,當時大家主要研究的是如何用貝葉斯方法進行神經網絡的計算,或者進行神經網絡結構的選擇。
  • ACL 2019 27 篇論文實現代碼(持續更新中)
    ACL 2019 將於今年ACL 2019 共接收了 765 篇論文,目前官網已經全部公布了,官方連結:http://www.acl2019.org/EN/program/papers.xhtml但是官網沒有公布連結,部分論文也沒有展示出來。所以AI研習社給大家整理了343篇論文,供大家學習!
  • 深度圖高斯過程 | NeurIPS 2020論文分享第一期
    高斯過程是概率機器學習中的核心方法,憑藉其良好的解析性質和出色的不確定性建模能力,被廣泛應用於各類機器學習問題。採用深度學習層次化建模範式的「深度高斯過程」則進一步增強了其建模能力,拓寬了其應用範圍。然而,絕大多數現有方法不能很好的擴展到圖結構數據。
  • 126篇殿堂級深度學習論文分類整理 從入門到應用 | 乾貨
    而作為新人,你的第一個問題或許是:「論文那麼多,從哪一篇讀起?」本文將試圖解決這個問題——文章標題本來是:「從入門到絕望,無止境的深度學習論文」。請諸位備好道具,開啟頭懸梁錐刺股的學霸姿勢。開個玩笑。但對非科班出身的開發者而言,讀論文的確可以成為一件很痛苦的事。
  • 深度學習貝葉斯,這是一份密集的6天速成課程(視頻與PPT)
    選自GitHubBayesian Methods Research Group機器之心整理在 Deep|Bayes 夏季課程中,授課人將討論貝葉斯方法如何結合深度學習,並在機器學習應用中實現更好的結果。近期研究表明貝葉斯方法的利用可以帶來許多好處。學生將學到對理解當前機器學習研究非常重要的方法和技術。
  • 首屆AAAI/ACM SIGAI博士論文獎公布,姚班學霸吳佳俊獲獎
    今年7月,一年一度的 ACM 博士論文獎發布,畢業於特拉維夫大學的 Dor Minzer 獲得該獎項。吳佳俊和瑞士洛桑聯邦理工學院(EPFL)博士 Jakub Tarnawski 獲得榮譽提名獎。
  • ACCV 2020最佳論文等三項大獎出爐!華為諾亞獲最佳學生論文獎
    論文連結:https://openaccess.thecvf.com/content/ACCV2020/papers/Stoiber_A_Sparse_Gaussian_Approach_to_Region-Based_6DoF_Object_Tracking_ACCV_2020_paper.pdf開原始碼:https://github.com/DLR-RM
  • 一文概述 2018 年深度學習 NLP 十大創新思路
    代表性論文:《深度的語境化詞語表示》(NAACL-HLT 2018)這篇論文介紹了 ELMo,頗受好評。除了實證結果讓人印象深刻,這篇論文的詳細的分析部分也非常顯眼,該部分梳理了各類因素的影響,並且分析了在表示中所捕獲的信息。
  • 北理工研二一作獲傑出論文,大陸論文量前三,ICML 2020各獎項出爐
    該方法的核心部分是開發一個用於自動搜索參數的策略網絡,該網絡能夠通過混合無模型和基於模型的深度強化學習來高效地學習參數。研究人員通過數值和視覺實驗表明,該方法學到的策略能夠為不同的狀態定製不同的參數,並且比現有的手動調參更加高效。
  • 被ACL 2020收錄11篇NLP論文?百度:小意思,見慣了
    近日,國際自然語言處理領域頂級學術會議「國際計算語言學協會年會」(ACL 2020)公布了今年大會的論文錄用結果。根據此前官方公布的數據,本屆大會共收到 3429 篇投稿論文,投稿數量創下新高。其中,百度共有11篇論文被大會收錄,再次展現出在自然語言處理領域的超高水準。
  • 機器學習和深度學習引用量最高的20篇論文(2014-2017)
    機器學習,尤其是其子領域深度學習,在近些年來取得了許多驚人的進展。重要的研究論文可能帶來使全球數十億人受益的技術突破。這一領域的研究目前發展非常快,為了幫助你了解進展狀況,我們列出了自 2014 年以來最重要的 20 篇科學論文。
  • 專欄| 貝葉斯學習與未來人工智慧
    貝葉斯定理的相關論文在貝葉斯去世後才發表,此後法國大數學家拉普拉斯對這一理論進行了深入的研究,使之成為我們今天使用的形式,如下圖所示。貝葉斯定理說明在評判現象背後的原因時,不僅要看這個原因的可能性有多大(先驗概率),也要看這一原因產生現象的概率(似然概率)。