【ICLR 2018】Google 研究盤點,76篇論文搶先看

2021-02-16 專知

本周,素有深度學習屆頂會「無冕之王」之稱的ICLR 2018第6屆在加拿大溫哥華舉辦,會議的重點是如何學習有意義的有用的機器學習數據表示。 ICLR包括會議和workshop,以及關於深度學習,度量學習,核學習,組合模型,非線性結構預測以及有關非凸優化的一些最新研究的演講和海報展示。谷歌、DeepMind等大廠這幾天陸續公布了今年的論文,全是乾貨。

作為神經網絡和深度學習頂尖技術創新的領先者,Google專注於理論和應用。作為ICLR 2018的白金贊助商,Google將有超過130名研究人員參加會議,分享論文,參與workshop。


ICLR 2018為期4天,5月3日結束。與往年一樣,本次大會每天分上午下午兩場。每場形式基本一樣,先是邀請演講(invited talk),然後是討論,也就是被選為能夠進行口頭(Oral)的論文、茶歇、海報展示(poster)。


如果您正在參加ICLR 2018,我們希望您能夠通過我們的展位停下來,與我們的研究人員聊聊Google為數十億人解決問題的項目和機會。您還可以在下面的列表中了解更多關於我們在ICLR 2018上展示的研究成果(Google員工加粗顯示

資深程序主席包括:

Tara Sainath

核心委員包括:

Hugo Larochelle

Google ICLR 2018論文集


口頭報告(Oral Contributions)

Wasserstein Auto-Encoders
Ilya Tolstikhin, Olivier Bousquet, Sylvain Gelly, Bernhard Scholkopf

On the Convergence of Adam and Beyond (Best Paper Award)
Sashank J. Reddi, Satyen Kale, Sanjiv Kumar

Ask the Right Questions: Active Question Reformulation with Reinforcement Learning
Christian Buck, Jannis Bulian, Massimiliano Ciaramita, Wojciech Gajewski, Andrea Gesmundo, Neil Houlsby, Wei Wang

Beyond Word Importance: Contextual Decompositions to Extract Interactions from LSTMs
W. James Murdoch, Peter J. Liu, Bin Yu

會議海報(Conference Posters)
Boosting the Actor with Dual Critic
Bo Dai, Albert Shaw, Niao He, Lihong Li, Le Song

MaskGAN: Better Text Generation via Filling in the _______
William Fedus, Ian Goodfellow, Andrew M. Dai

Scalable Private Learning with PATE
Nicolas Papernot, Shuang Song, Ilya Mironov, Ananth Raghunathan, Kunal Talwar, Ulfar Erlingsson

Deep Gradient Compression: Reducing the Communication Bandwidth for Distributed Training
Yujun Lin, Song Han, Huizi Mao, Yu Wang, William J. Dally

Flipout: Efficient Pseudo-Independent Weight Perturbations on Mini-Batches
Yeming Wen, Paul Vicol, Jimmy Ba, Dustin Tran, Roger Grosse

Latent Constraints: Learning to Generate Conditionally from Unconditional Generative Models
Adam Roberts, Jesse Engel, Matt Hoffman

Multi-Mention Learning for Reading Comprehension with Neural Cascades
Swabha Swayamdipta, Ankur P. Parikh, Tom Kwiatkowski

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension
Adams Wei Yu, David Dohan, Thang Luong, Rui Zhao, Kai Chen, Mohammad Norouzi, Quoc V. Le

Sensitivity and Generalization in Neural Networks: An Empirical Study
Roman Novak, Yasaman Bahri, Daniel A. Abolafia, Jeffrey Pennington, Jascha Sohl-Dickstein

Action-dependent Control Variates for Policy Optimization via Stein Identity
Hao Liu, Yihao Feng, Yi Mao, Dengyong Zhou, Jian Peng, Qiang Liu

An Efficient Framework for Learning Sentence Representations
Lajanugen Logeswaran, Honglak Lee 

Fidelity-Weighted Learning
Mostafa Dehghani, Arash Mehrjou, Stephan Gouws, Jaap Kamps, Bernhard Schölkopf 

Generating Wikipedia by Summarizing Long Sequences 
Peter J. Liu, Mohammad Saleh, Etienne Pot, Ben Goodrich, Ryan Sepassi, Lukasz Kaiser, Noam Shazeer

Matrix Capsules with EM Routing 
Geoffrey Hinton, Sara Sabour, Nicholas Frosst 

Temporal Difference Models: Model-Free Deep RL for Model-Based Control
Sergey Levine, Shixiang Gu, Murtaza Dalal, Vitchyr Pong 

Deep Neural Networks as Gaussian Processes 
Jaehoon Lee, Yasaman Bahri, Roman Novak, Samuel L. Schoenholz, Jeffrey Pennington, Jascha Sohl-Dickstein

Many Paths to Equilibrium: GANs Do Not Need to Decrease a Divergence at Every Step
William Fedus, Mihaela Rosca, Balaji Lakshminarayanan, Andrew M. Dai, Shakir Mohamed, Ian Goodfellow 

Initialization Matters: Orthogonal Predictive State Recurrent Neural Networks 
Krzysztof Choromanski, Carlton Downey, Byron Boots

Learning Differentially Private Recurrent Language Models 
H. Brendan McMahan, Daniel Ramage, Kunal Talwar, Li Zhang

Learning Latent Permutations with Gumbel-Sinkhorn Networks 
Gonzalo Mena, David Belanger, Scott Linderman, Jasper Snoek 

Leave no Trace: Learning to Reset for Safe and Autonomous Reinforcement Learning 
Benjamin Eysenbach, Shixiang Gu, Julian Ibarz, Sergey Levine

Meta-Learning for Semi-Supervised Few-Shot Classification
Mengye Ren, Eleni Triantafillou, Sachin Ravi, Jake Snell, Kevin Swersky, Josh Tenenbaum, Hugo Larochelle, Richard Zemel

Thermometer Encoding: One Hot Way to Resist Adversarial Examples
Jacob Buckman, Aurko Roy, Colin Raffel, Ian Goodfellow

A Hierarchical Model for Device Placement 
Azalia Mirhoseini, Anna Goldie, Hieu Pham, Benoit Steiner, Quoc V. Le, Jeff Dean 

Monotonic Chunkwise Attention
Chung-Cheng Chiu, Colin Raffel

Training Confidence-calibrated Classifiers for Detecting Out-of-Distribution Samples
Kimin Lee, Honglak Lee, Kibok Lee, Jinwoo Shin

Trust-PCL: An Off-Policy Trust Region Method for Continuous Control
Ofir Nachum, Mohammad Norouzi, Kelvin Xu, Dale Schuurmans

Ensemble Adversarial Training: Attacks and Defenses 
Florian Tramèr, Alexey Kurakin, Nicolas Papernot, Ian Goodfellow, Dan Boneh, Patrick McDaniel 

Stochastic Variational Video Prediction
Mohammad Babaeizadeh, Chelsea Finn, Dumitru Erhan, Roy Campbell, Sergey Levine

Depthwise Separable Convolutions for Neural Machine Translation
Lukasz Kaiser, Aidan N. Gomez, Francois Chollet

Don’t Decay the Learning Rate, Increase the Batch Size 
Samuel L. Smith, Pieter-Jan Kindermans, Chris Ying, Quoc V. Le

Generative Models of Visually Grounded Imagination
Ramakrishna Vedantam, Ian Fischer, Jonathan Huang, Kevin Murphy

Large Scale Distributed Neural Network Training through Online Distillation 
Rohan Anil, Gabriel Pereyra, Alexandre Passos, Robert Ormandi, George E. Dahl, Geoffrey E. Hinton

Learning a Neural Response Metric for Retinal Prosthesis
Nishal P. Shah, Sasidhar Madugula, Alan Litke, Alexander Sher, EJ Chichilnisky, Yoram Singer,Jonathon Shlens

Neumann Optimizer: A Practical Optimization Algorithm for Deep Neural Networks
Shankar Krishnan, Ying Xiao, Rif A. Saurous

A Neural Representation of Sketch Drawings
David Ha, Douglas Eck

Deep Bayesian Bandits Showdown: An Empirical Comparison of Bayesian Deep Networks for Thompson Sampling 
Carlos Riquelme, George Tucker, Jasper Snoek

Generalizing Hamiltonian Monte Carlo with Neural Networks
Daniel Levy, Matthew D. Hoffman, Jascha Sohl-Dickstein

Leveraging Grammar and Reinforcement Learning for Neural Program Synthesis
Rudy Bunel, Matthew Hausknecht, Jacob Devlin, Rishabh Singh, Pushmeet Kohli

On the Discrimination-Generalization Tradeoff in GANs
Pengchuan Zhang, Qiang Liu, Dengyong Zhou, Tao Xu, Xiaodong He

A Bayesian Perspective on Generalization and Stochastic Gradient Descent
Samuel L. Smith, Quoc V. Le 

Learning how to Explain Neural Networks: PatternNet and PatternAttribution
Pieter-Jan Kindermans, Kristof T. Schütt, Maximilian Alber, Klaus-Robert Müller, Dumitru Erhan, Been Kim, Sven Dähne

Skip RNN: Learning to Skip State Updates in Recurrent Neural Networks
Víctor Campos, Brendan Jou, Xavier Giró-i-Nieto, Jordi Torres, Shih-Fu Chang

Towards Neural Phrase-based Machine Translation
Po-Sen Huang, Chong Wang, Sitao Huang, Dengyong Zhou, Li Deng

Unsupervised Cipher Cracking Using Discrete GANs
Aidan N. Gomez, Sicong Huang, Ivan Zhang, Bryan M. Li, Muhammad Osama, Lukasz Kaiser 

Variational Image Compression With A Scale Hyperprior
Johannes Ballé, David Minnen, Saurabh Singh, Sung Jin Hwang, Nick Johnston

Workshop Posters
Local Explanation Methods for Deep Neural Networks Lack Sensitivity to Parameter Values
Julius Adebayo, Justin Gilmer, Ian Goodfellow, Been Kim

Stoachastic Gradient Langevin Dynamics that Exploit Neural Network Structure
Zachary Nado, Jasper Snoek, Bowen Xu, Roger Grosse, David Duvenaud, James Martens

Towards Mixed-initiative generation of multi-channel sequential structure
Anna Huang, Sherol Chen, Mark J. Nelson, Douglas Eck

Can Deep Reinforcement Learning Solve Erdos-Selfridge-Spencer Games?
Maithra Raghu, Alex Irpan, Jacob Andreas, Robert Kleinberg, Quoc V. Le, Jon Kleinberg

GILBO: One Metric to Measure Them All
Alexander Alemi, Ian Fischer

HoME: a Household Multimodal Environment
Simon Brodeur, Ethan Perez, Ankesh Anand, Florian Golemo, Luca Celotti, Florian Strub, Jean Rouat,Hugo Larochelle, Aaron Courville

Learning to Learn without Labels
Luke Metz, Niru Maheswaranathan, Brian Cheung, Jascha Sohl-Dickstein

Learning via Social Awareness: Improving Sketch Representations with Facial Feedback 
Natasha Jaques, Jesse Engel, David Ha, Fred Bertsch, Rosalind Picard, Douglas Eck

Negative Eigenvalues of the Hessian in Deep Neural Networks 
Guillaume Alain, Nicolas Le Roux, Pierre-Antoine Manzagol

Realistic Evaluation of Semi-Supervised Learning Algorithms
Avital Oliver, Augustus Odena, Colin Raffel, Ekin Cubuk, lan Goodfellow

Winner's Curse? On Pace, Progress, and Empirical Rigor 
D. Sculley, Jasper Snoek, Alex Wiltschko, Ali Rahimi

Meta-Learning for Batch Mode Active Learning
Sachin Ravi, Hugo Larochelle 

To Prune, or Not to Prune: Exploring the Efficacy of Pruning for Model Compression 
Michael Zhu, Suyog Gupta 

Adversarial Spheres
Justin Gilmer, Luke Metz, Fartash Faghri, Sam Schoenholz, Maithra Raghu,,Martin Wattenberg, Ian Goodfellow

Clustering Meets Implicit Generative Models
Francesco Locatello, Damien Vincent, Ilya Tolstikhin, Gunnar Ratsch, Sylvain Gelly, Bernhard Scholkopf

Decoding Decoders: Finding Optimal Representation Spaces for Unsupervised Similarity Tasks
Vitalii Zhelezniak, Dan Busbridge, April Shen, Samuel L. Smith, Nils Y. Hammerla

Learning Longer-term Dependencies in RNNs with Auxiliary Losses 
Trieu Trinh, Quoc Le, Andrew Dai, Thang Luong

Graph Partition Neural Networks for Semi-Supervised Classification
Alexander Gaunt, Danny Tarlow, Marc Brockschmidt, Raquel Urtasun, Renjie Liao, Richard Zemel

Searching for Activation Functions
Prajit Ramachandran, Barret Zoph, Quoc Le

Time-Dependent Representation for Neural Event Sequence Prediction
Yang Li, Nan Du, Samy Bengio

Faster Discovery of Neural Architectures by Searching for Paths in a Large Model 
Hieu Pham, Melody Guan, Barret Zoph, Quoc V. Le, Jeff Dean

Intriguing Properties of Adversarial Examples
Ekin Dogus Cubuk, Barret Zoph, Sam Schoenholz, Quoc Le 

PPP-Net: Platform-aware Progressive Search for Pareto-optimal Neural Architectures
Jin-Dong Dong, An-Chieh Cheng, Da-Cheng Juan, Wei Wei, Min Sun

The Mirage of Action-Dependent Baselines in Reinforcement Learning
George Tucker, Surya Bhupatiraju, Shixiang Gu, Richard E. Turner, Zoubin Ghahramani, Sergey Levine

Learning to Organize Knowledge with N-Gram Machines
Fan Yang, Jiazhong Nie, William W. Cohen, Ni Lao

Online variance-reducing optimization
Nicolas Le Roux, Reza Babanezhad, Pierre-Antoine Manzagol

參考連結:

https://research.googleblog.com/2018/04/google-at-iclr-2018.html

https://iclr.cc/Conferences/2018/ScheduleOverview

人工智慧領域主題知識資料查看與加入專知人工智慧服務群

【專知AI服務計劃】專知AI知識技術服務會員群加入與人工智慧領域26個主題知識資料全集獲取

點擊上面圖片加入會員

請PC登錄www.zhuanzhi.ai或者點擊閱讀原文,註冊登錄專知,獲取更多AI知識資料

請掃一掃如下二維碼關注我們的公眾號,獲取人工智慧的專業知識!

點擊「閱讀原文」,使用專知

相關焦點

  • ICLR2018 | 深度學習頂會見聞,乾貨資源都在這裡(附源碼、論文連結)
    第六屆ICLR於2018.4.30~2018.5.03在溫哥華會展中心召開,筆者署名的一篇文章有幸被workshop接收且受邀參會,下面聊一聊個人在ICLR2018上的見聞。ICLR2018會議大觀ICLR 2018共計收到1003篇論文投稿,最終2.3%的Oral論文、31.4%的Poster論文、9%被接收為Workshop track,51%的論文被拒收、6.2%的撤回率。
  • 【一文打盡 ICLR 2018】9大演講,DeepMind、谷歌最新乾貨搶鮮看
    主要介紹了ICLR2018相關亮點。歡迎大家點擊上方藍字關注我們的公眾號:磐創AI。ICLR 2018即將開幕,谷歌、DeepMind等大廠這幾天陸續公布了今年的論文,全是乾貨。連同3篇最佳論文和9個邀請演講一起,接下來將帶來本屆ICLR亮點的最全整理。
  • ICLR 2017即將開幕,機器之心帶你概覽論文全貌(附最佳論文與直播地址)
    在這篇文章中,機器之心梳理了 ICLR 2017 提交論文的特點、本屆會議的最佳論文以及機器之心過去一段時間報導過的有關 ICLR 2017 的文章。此外,去不了大會現場的讀者也不必感到遺憾,因為有以下大會 Oral Session 的直播。
  • ICLR 2017匿名評審惹爭議,盤點10篇被拒卻值得一讀的好論文(附大會第一天亮點)
    另外,ICLR 的官方 Facebook 主頁有視頻直播,現在也已能看到部分錄製的視頻:https://www.facebook.com/iclr.cc十篇被拒的好論文研究者與開發者、Intuition Machine 聯合創始人 Carlos E. Perez 在 Medium 上發布了一篇文章,介紹了那些 ICLR 2017 卻不幸被拒,但仍有價值的十篇論文。
  • 2018 Google Scholar Metric 新出爐,期刊、會議影響力排名一覽
    Ilya Sutskever 是一位研究負責人,研究方向包括定點數、玻爾茲曼機、貝式網路、概率模型、長期依賴等,擁有 60 篇論文,引用量達 69008 次,個人 h-index 為 35。數據來源:https://scholar.google.com/citations?
  • ECCV 2020 論文大盤點-光流篇
    本文盤點 ECCV 2020 所有光流(Optical Flow)相關論文,總計 7 篇,值得一提的是來自普林斯頓大學的論文『RAFT:
  • ECCV 2020 Spotlight 谷歌論文大盤點
    ECCV 2020 總計錄取1361篇論文,其中Oral 102篇,Spotlight 161 篇。
  • 【NIPS 2017】英偉達、谷歌研究盤點,谷歌45篇論文、28個Workshop搶先看(論文下載)
    NIPS 2017概括和亮點,重點匯總了DeepMind和Facebook在NIPS 2017的參與,包括邀請演講、接收論文等。本文將介紹谷歌和英偉達在NIPS 2017的表現,包括接收論文、邀請演講、海報、研討會、比賽和教程等。本周,NIPS 2017 在加利福尼亞州長灘市舉行,這是一個機器學習和計算神經科學的大會,包含有關最新的機器學習研究的邀請報告、展示和演講。谷歌有450多名員工參與NIPS 2017,通過技術講座、海報、研討會、比賽和教程等方式向更廣泛的學術研究社區貢獻和學習。
  • Google編程之夏2018盤點
    本文旨在通過GSoC博客的相關文章盤點下2018年這個活動的火爆程度。2018年GSoC主辦方總共接收到了來自62個國家的1,264名學生的申請,共組織參與了206個開源項目,其中的一些統計數字如下:88.2% 學生是首次參與GSoC項目;74.4% 學生是第一次申請該項目;76.18% 學生都是本科生,17.5% 為研究生, 6.3% 為博士生;73% 專業為計算機科學, 4.2% 專業為數學,
  • ICLR2020最佳論文:ADAM作者-雙層神經網絡的泛化性能漸進分析
    本次會議在最終提交的 2594 篇論文中,有 687 篇被接收,接收率為 26.5%;23% 的接收論文將進行口頭講述報告,其中 108 篇論文為 spotlight,演講時間 4 分鐘,48 篇論文將進行 10 分鐘以上的 talk。
  • ICML 2018 | 騰訊張潼中8篇論文,清華排名國內居首:大會論文接收情況一覽
    ICML 2018 於 7 月 10 日在瑞典斯德哥爾摩舉行,今日該會議公布了接收論文列表,本次會議共收到 2473 篇論文,621 篇被接收,
  • ICLR 2018入選論文公布:23篇Oral,508篇被拒
    將於4月底召開的第六屆ICLR總共收到了900多篇論文,同比增加一倍。這個大會採用公開評審制度,所有論文會匿名公開在open review網站上,接受同行們的匿名評分和提問。最新公布的數據顯示,ICLR 2018共有23篇論文入圍Oral Papers,另有314篇論文獲評Poster Papers。
  • WACV 2021 論文大盤點-人體動作檢測與識別篇
    篇。作者 | Guillaume Vaudaux-Ruth, Adrien Chan-Hon-Tong, Catherine Achard論文 | https://arxiv.org/abs/2011.06958PDAN: Pyramid Dilated Attention Network for Action Detection本次研究解決了密集標註視頻流中複雜時間關係的建模問題。
  • ICLR 引用量最高的10篇論文!Adam霸榜!引用量破5萬
    ,詳見:接下來,Amusi 將繼續整理其他頂會,像NeurIPS、ICLR、ICML上也有很多優質的CV論文,而且有更多深度學習、機器學習基礎性研究工作。這個排名是依據過去五年發表研究的數據(覆蓋2015-2019年發表的文章),並包括截止2020年6月在谷歌學術中被索引的所有文章的引用量。本文就來盤點ICLR 2015-2019年引用量最高的10篇論文。
  • ICLR 2020關鍵亮點與發展趨勢總結(附python實戰分析PyTorch vs Tensorflow使用情況)|文末送書
    會議總共接受了650多篇研究論文,每一篇論文都包括一個5分鐘的視頻演示和作者對論文本身的現場問答(在時間表中用綠色標記)。這段演示視頻可以說是論文的亮點,作者在其中介紹了他們的方法和主要發現。會議很容易訪問,網站也很容易使用,我們可以不費吹灰之力地搜索和研究這些論文,而且還有許多其他的特性可以充分利用本文的研究成果。我特別喜歡會議網頁上所有論文/海報的單一可視化功能——基於主題相似性的散點圖易於理解,並使搜索研究論文更加容易:
  • ICLR 2017 | 專訪ICLR 2017主席 Hervé Glotin:蓬勃發展的表徵學習
    有1100多名參會者、收到490篇論文投稿的 ICLR 2017 是舉辦以來最大的一屆,與 ICLR 2016 相比規模上又有大幅提升,去年的參會者只有 400人左右。不好之處是,企業的研究人員有可能在思維開闊程度上比學術界的研究人員差一點,不過也有來自OpenAI等一些基礎研究團隊的研究人員。所以其實他們不是僅僅來自企業而已,他們也和學術界的研究人員一樣做出了學術貢獻。您是否擔心來自Facebook和谷歌的論文太多,它們佔據了很多位置,以至於學術界的論文相對比例變少了嗎?
  • 【年終盤點】2018年29篇必讀機器學習論文總結,BERT, SeqGAN等上榜
    Cody每年都會找一個月時間集中精讀當年的重要和經典的機器學習論文,每天一篇並寫上500-1000詞的總結,比如論文主要是思路,重要的創新點以及可能的應用方向等,這對於每個研究者來說都是一份重要的論文閱讀指導,可以作為初學者如何看論文,讀論文一個非常好的借鑑範例。
  • Google Brain ICLR Talk:元學習的前沿與挑戰
    作者:Chelsea Finnslides連結:https://people.eecs.berkeley.edu/~cbfinn/_files/lld_iclr19.pdf【作者簡介】Chelsea Finn,是Google Brain的研究科學家,斯坦福計算機學院助理教授,UC Berkely 人工智慧實驗室博士後
  • CVPR 2020 論文大盤點-超解析度篇
    本文盤點CVPR 2020 所有超解析度(Super-Resolution,SR)技術相關論文,總計21篇,超解析度是CV領域傳統方向
  • ECCV 2020 論文大盤點-視頻理解與分類篇
    繼上文盤點的動作檢測與識別篇論文,今日繼續盤點與之息息相關的論文:視頻分類(Video Classification)與視頻理解(