DeepMind 16篇NIPS 2017論文,全部信息都在這裡了 | NIPS 2017

2020-12-07 雷鋒網

雷鋒網按:作為人工智慧領域的「領頭羊」,DeepMind的最新研究總是能引起大家的關注。那麼在即將在加州長灘召開的機器學習領域頂級會議NIPS 2017上,DeepMind又會給我們帶來什麼樣的先知卓見呢?雷鋒網為你整理了DeepMind在NIPS 2017上的論文,便於大家按自己感興趣的內容按圖索驥。一起來看一下:

第1天 12月4日 2Poster

論文1:《Robust imitation of diverse behaviours》

作者:Ziyu Wang,Josh Merel,Greg Wayne,Nando de Freitas,Scott Reed,Nicolas Heess

摘要:我們提出了一個建立在最先進的生成模型上的神經網絡架構,該架構能夠學習不同行為之間的關係,並模仿它所顯示的具體行為。訓練結束後,我們的系統可以編碼一個單一的觀察動作,並根據這個演示創建一個新的小動作。它也可以在不同類型的行為(如步行的不同風格)之間切換,儘管之前並沒有看到過這種切換。

(上面的小人切換步行風格像不像在跳舞?)

展示時間/地點:Pacific Ballroom #143,Poster環節,6:30-22:30


論文2:《Sobolev training for neural networks》

作者:Wojtek Czarnecki,Simon Osindero,Max Jaderberg,GrzegorzŚwirszcz,Razvan Pascanu

摘要:本文給出了一種將目標函數導數的知識納入深度神經網絡訓練的簡單方法。我們證明最近的基於ReLU的體系結構非常適合這樣的任務,並評估它們在三個問題即低維回歸,政策蒸餾和合成梯度訓練上的有效性。我們觀察到訓練的效率尤其是在低數據情況下顯著提高,並且以接近最新的準確度訓練了第一個基於梯度的合成的ImageNet模型。

展示時間/地點:Pacific Ballroom #139,Poster環節,6:30-22:30


第2天 12月5日 4Poster

論文3:《Filtering variational objectives》

作者:Chris J. Maddison,Dieterich Lawson,George Tucker,Nicolas Heess,Mohammad Norouzi,Andriy Mnih,Arnaud Doucet,Yee Whye Teh

摘要:我們考慮將變分的下界擴展到基於粒子濾波的邊界似然估計器(雷鋒網(公眾號:雷鋒網)註:主要特指估算概率分布)定義的下界族群。這些過濾目標可以利用模型的順序結構在深生成模型中形成更緊密的界限和更好的模型學習目標。在我們的實驗中,我們發現用濾波目標進行訓練比使用變分下限訓練相同的模型體系結構有了實質性的改進。

展示時間/地點:Pacific Ballroom #114,Poster環節,6:30-22:30


論文4:《Visual interaction networks: Learning a physics simulator from video》

作者:Nicholas Watters,Andrea Tacchetti,Theophane Weber,Razvan Pascanu,Peter Battaglia,Daniel Zoran

摘要:在這項研究中我們提出了一種基於神經網絡的模型」視覺交互網絡「(VIN),在沒有先驗知識的情況下學習物理動力學。 VIN能夠從幾幀視頻中推斷出多個物理對象的狀態,然後用這些來預測對象位置。它還能夠推斷隱形物體的位置,並學習依賴於物體屬性(如質量)的動力原理。

由VIN(右)預測的動力學與真實模擬(左)相比較

展示時間/地點:Pacific Ballroom #123,Poster環節,6:30-22:30


論文5:《Neural discrete representation learning》

作者:Aäronvan den Oord,Oriol Vinyals,Koray Kavukcuoglu

摘要:在沒有監督的情況下學習有用的陳述仍然是機器學習中的關鍵挑戰。這項研究中,我們提出了一個簡單而強大的生成模型,該模型被稱為矢量量化變分自動換能器(VQ-VAE)以學習這種離散表徵。當這些表徵與先前的自回歸配對時,該模型能夠生成高質量的圖像,視頻和語音以及進行高質量的揚聲器轉換。

展示時間/地點:Pacific Ballroom #116,Poster環節,6:30-22:30


論文6:《Variational memory addressing in generative models》

作者:JörgBornschein,Andriy Mnih,Daniel Zoran,Danilo Jimenez Rezende

摘要:基於注意力的記憶可用於增強神經網絡,並被用於Few-shot learning、快速適應性、更普遍地支持非參數擴展等領域。不同於目前流行的可區分的軟注意機制,我們使用隨機的硬注意力來生成模型中的記憶內容,這使得我們可以將變分推理應用於內存尋址,使用目標信息獲得更精確的內存查找,尤其是在內存緩衝區大且內存條目混雜的模型中。

展示時間/地點:Pacific Ballroom #117,Poster環節,6:30-22:30


第3天 12月6日 2 Oral/4 Spotlight/4Poster

論文7:《REBAR: Low-variance, unbiased gradient estimates for discrete latent variable models》

作者:George Tucker, Andriy Mnih, Chris J Maddison, Dieterich Lawson, Jascha Sohl-Dickstein

摘要:由於具有高方差梯度估計量,對具有離散潛變量的模型進行學習具有挑戰性。 之前的方法要麼產生高方差/無偏梯度,或低方差/有偏差的梯度。 REBAR使用控制變量和重新參數化技巧來獲得兩者中最好的結果:低方差/無偏差的梯度,使得收斂更快,效果更好。

展示時間/地點:Hall A,10:35-10:50,Oral講解;

Pacific Ballroom #178,Poster環節,6:30-22:30


論文8:《Imagination-augmented agents for deep reinforcement learning》

作者:Sébastien Racanière, Théophane Weber, David P. Reichert, Lars Buesing, Arthur Guez, Danilo Rezende, Adria Puigdomènech Badia, Oriol Vinyals, Nicolas Heess, Yujia Li, Razvan Pascanu, Peter Battaglia, Demis Hassabis, David Silver, Daan Wierstra.

摘要:我們描述了一個基於想像力的規劃方法的新族類,並介紹了為智能體學習和構建計劃,從而最大化任務效率提供新方法的架構。 這些架構對於複雜和不完善的模型是有效的,穩健的,並且可以採取靈活的策略來擴展他們的想像力。 我們介紹的智能體受益於一個「想像編碼器」,這是一個神經網絡,它學習提取任何對未來決策有用的信息,但忽略那些不相關的信息。

圖為智能體進行飛船任務遊戲。該遊戲必須激活一定次數的推進器以穩定飛行器。紅色表示執行的軌跡,藍色和綠色表示想像的軌跡。

展示時間/地點:Hall A,15:05-15:20,Oral講解;

Pacific Ballroom #139,Poster環節,6:30-22:30


論文9:《A simple neural network module for relational reasoning》

作者:Adam Santoro, David Raposo, David Barrett, Mateusz Malinowski, Razvan Pascanu, Peter Battaglia, Timothy Lillicrap

摘要:我們演示了使用簡單的即插即用神經網絡模塊來解決需要複雜關係推理的任務。 這個稱為「關係網絡」的模塊可以接收非結構化的輸入,比如圖像或故事,並隱含地推理其中包含的關係。

展示時間/地點:Hall A,15:25-15:30,Spotlight講解;

Pacific Ballroom #139,Poster環節,6:30-22:30


論文10:《Simple and scalable predictive uncertainty estimation using deep ensembles》

作者:Balaji Lakshminarayanan, Alexander Pritzel, Charles Blundell

摘要:量化神經網絡(NN)中的預測不確定性是一個具有挑戰性但尚未解決的問題。 大部分工作集中在貝葉斯解決方案上,但這些方案都是計算密集型的,需要對訓練管道進行重大修改。我們提出了一種貝葉斯神經網絡的替代方案,該方案易於實現和並行,只需要很少的超參數調整,並產生高質量的預測不確定性估計。 通過一系列關於分類和回歸基準的實驗,我們證明了我們的方法可產生良好校準的不確定性估計,其與近似貝葉斯神經網絡一樣好或更好。

展示時間/地點:Hall A,15:45-15:50,Spotlight講解;

Pacific Ballroom #133,Poster環節,6:30-22:30


論文11:《Natural value approximators: learning when to trust past estimates》

作者:Zhongwen Xu, Joseph Modayil, Hado van Hasselt, Andre Barreto, David Silver, Tom Schaul

摘要:基於隨輸入而平滑變化觀察的典型近似值,我們重新回顧了RL的價值逼近器的結構,但是當到達獎勵值時真值會突然發生變化。 我們提出的方法使用插值與預測值估計,用於適應這種不對稱的不連續性。

展示時間/地點:Hall A,17:25-17:30,Spotlight講解;

Pacific Ballroom #6,Poster環節,6:30-22:30


論文12: 《Successor features for transfer in reinforcement learning》

作者:Andre Barreto, Will Dabney, Remi Munos, Jonathan Hunt, Tom Schaul, David Silver, Hado van Hasselt

摘要:我們提出了一個強化學習的轉移框架。 我們的方法取決於兩個關鍵的觀點:1)「繼承者特徵」,這是一種價值函數表示,將環境的動態與回報分離開來;2)「廣義的政策改進」,一種考慮了一整套策略的一般化的動態規劃策略改進步驟。 綜合起來,這兩個想法導致了一種無縫集成在強化學習框架內的方法,並允許在任務之間不受任何限制地進行轉移。

展示時間/地點:Hall A,17:40-17:45,Spotlight講解;

Pacific Ballroom #9,Poster環節,6:30-22:30


論文13:《Deep reinforcement learning from human preferences》

作者:Paul Christiano (Open AI), Jan Leike, Tom B. Brown, Miljan Martic, Shane Legg, Dario Amodei (Open AI)

摘要:人工智慧安全的一個核心問題是如何告訴一個算法我們希望它做什麼。 OpenAI展示了一個全新的系統,允許沒有技術經驗的人員教AI如何執行一個複雜的任務,如操縱模擬機器人手臂。

通過900個人的反饋教會了這個算法後空翻。

展示時間/地點:Pacific Ballroom #1,Poster環節,6:30-22:30


論文14:《A multi-agent reinforcement learning model of common-pool resource appropriation》

作者:Julien Perolat, Joel Z Leibo, Vinicius Zambaldi, Charles Beattie, Karl Tuyls, Thore Graepel

摘要:本文考察了共同資源佔用問題的複雜性。 如漁業,放牧牧場或淡水的系統,許多人或行為者可以獲得相同的資源。 社會科學的傳統模式往往表明,獲得資源的各方以自利的方式行事,最終導致不可持續的資源枯竭。 但我們在人類社會的實際經驗知道可能會產生很多中可能的結果。 像漁業這樣的資源,有時候會被過度開發,有時可以可持續地收穫。 在這項研究中,我們提出了可用於研究的新建模技術,旨在解釋我們在現實世界中觀察到的與傳統模型預測的差距。

展示時間/地點:Pacific Ballroom #86,Poster環節,6:30-22:30


論文15:《DisTraL: Robust multitask reinforcement learning》

作者:Yee Whye Teh, Victor Bapst, Wojciech Czarnecki, John Quan, James Kirkpatrick, Raia Hadsell, Nicholas Heess, Razvan Pascanu

摘要:我們開發了一個強化多任務學習的方法。 我們的假設是,任務是彼此相關的(例如處於相同的環境或具有相同的物理特性),好的動作序列傾向於在任務中重複出現。 我們的方法通過將特定於任務的策略同時提煉為一個通用的默認策略,並通過將所有特定於任務的策略規則化為違約策略來跨這些任務轉移這些常識。 我們的研究表明,這會導致更快、更強大的學習。

展示時間/地點:Pacific Ballroom #138,Poster環節,6:30-22:30


論文16:《A unified game-theoretic approach to multiagent reinforcement learning》

作者:Marc Lanctot, Vinicius Zambaldi, Audrunas Gruslys, Angeliki Lazaridou, Karl Tuyls, Julien Perolat, David Silver, Thore Graepel

摘要:在這項研究中,我們首先觀察到獨立強化學習者產生可以共同關聯但在執行過程中未能與其他主體進行良好的概括的策略。 我們通過提出一個稱為聯合策略關聯的新度量來量化這種影響,然後我們提出了一個由博弈論基礎所推動的算法,該算法概括了虛擬遊戲,迭代最佳響應,獨立RL和雙重預言等幾種方法。 我們的研究表明,我們的算法可以在第一人稱協調遊戲中顯著降低聯合策略的相關性,並在普通的撲克基準遊戲中找到穩健的反策略。

展示時間/地點:Pacific Ballroom #203,Poster環節,6:30-22:30

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • AI研究實力最強的25所高校,據NIPS2017論文數統計
    NIPS 2017在加州長灘舉辦,吸引了8000名參會者,從3240篇提交的論文中接收了679篇,接收率為21%。根據這679篇論文,統計得到以下結果。根據論文統計,全球TOP25的大學:1.Inria,法國國家信息與自動化研究所7. ETH Zurich,蘇黎世聯邦理工學院8. Duke U,杜克大學9.
  • 一文告訴你,NIPS 2017有多火爆 | 附PPT、視頻、代碼大總結
    論文:https://arxiv.org/abs/1611.04496代碼: https://github.com/opheadacheh/Multi-view-neural-acoustic-words-embeddings
  • 【NIPS2017最新Tutorial】幾何深度學習(Geometric Deep Learning )講解(附slide下載)
    【導讀】美國時間 12 月 4 日,第 31 屆神經信息處理系統大會(Neural Information Processing Systems,NIPS)在美國加州長灘的會展中心正式開幕!NIPS是人工智慧和機器學習領域的頂會,來自世界範圍內優秀的科學家、研究人員和從業者都將匯聚一堂,相互切磋工作,將在未來的五天裡共同討論和分享人工智慧的前沿想法和未來發展。
  • NIPS 2017錄用結果全公布,清華北大10篇,BAT 4篇(附詳細名單)
    雷鋒網AI科技評論按:NIPS 2017 將於 12 月份在美國長灘舉行,本屆NIPS共收到 3240 篇論文投稿,錄用 678 篇,錄用率為 20.9%;其中包括 40 篇口頭報告論文和 112 篇 spotlight 論文
  • NIPS 2016精華大盤點丨吳恩達、LeCun等大師的論文、PPT都在這兒...
    前幾天 NIPS官網開放了部分錄用文章的 Spotlight Videos(連結:https://nips.cc/Conferences/2016/SpotlightVideos),為學術達人魏秀參童鞋把所有論文都捋了一遍,特地將一些有趣、有料的內容整理出來分享給大家。文章連結均為 Youtube 視頻。
  • NIPS 2017即將開幕,哪些熱點值得關注?
    NIPS 2017的Tutorial將安排在4號,共有9個Tutorial;Oral:大會收錄的較為重要的一批論文的口頭宣講。NIPS 2017共有40篇論文進入Oral,口頭宣講時間為15分鐘;Spotlight:次重要的一批論文的摘要性口頭宣講。
  • 大會 | 親歷NIPS 2017:收穫與思考
    在今年提交的3240篇論文中,679篇被接受,接受比例只有21%,入選論文中有527篇posters,112篇spotlights和40篇orals。這篇文章解決了不完美信息博弈的問題,基於這項技術的Libratus項目,打敗了德州撲克的幾位人類頂級玩家。Hongseok Namkoong, John Duchi. Variance-based Regularization with Convex Objectives.
  • NIPS 2017現場:8000人參會,最佳論文公布,算法壓倒深度學習 | NIPS...
    火人節?不,這裡是NIPS雖然對會議的火爆程度早有估計,但當雷鋒網(公眾號:雷鋒網)編輯一早來到會場時,仍然被Convention Center門口的長龍嚇了一跳。最佳論文公布,3篇論文獲獎在當地時間4日中午,大會官網更新了本次大會的最佳論文及 Test of Time Award 獲獎論文。相應,大會也在官網調整了議程,將開幕演講及頒布最佳論文的時間調整到了4日下午5點,在隨後的會場上,主持人也宣布了這一調整。本次大會最佳論文共有三篇。
  • 【NIPS2017】你也可以成為遊戲高手,Facebook FAIR實驗室田淵棟研究員PPT詳解(附下載)
    【導讀】FacebookAI研究院田淵棟在NIPS2017發表oral Talk,介紹在之前已經開源的遊戲平臺ELF。
  • 沒能去參加NIPS 2017?這裡有一份最詳細的現場筆記(附PDF)
    2017年12月3-9日,第31屆神經信息處理系統大會在美國加州長灘市舉行。今年的NIPS可謂火爆異常,有超過8000人註冊參會,投遞論文數量3240篇,收錄678篇,錄用率20.9%。而今年NIPS的門票也在開放註冊一小時內售罄,有許多希望感受大會氣氛的同學也因此未能前往現場。在上個星期的大會期間,雷鋒網為大家進行了大會現場的報導,關於大會的更多乾貨內容,我們也將陸續進行後續整理放出。
  • NIPS 2017錄用論文先睹為快!GAIR大講堂NIPS清華專場精彩回顧
    從大會官方公布的一些數據就可以看出:NIPS 2017共收到3240篇論文投稿,有678篇論文被選中作為大會論文,比例20.9%,其中有40篇被選中進行口頭報告(oral),112篇選為spotlight進行展示。毫不意外這些數字又創了大會歷史新高。就在論文收錄結果公布僅僅10天之後,官方數據顯示註冊名額已滿!
  • 清華大學團隊包攬三項冠軍,NIPS 2017對抗樣本攻防競賽總結
    其中清華大學博士生董胤蓬、廖方舟、龐天宇及指導老師朱軍、胡曉林、李建民、蘇航組成的團隊在競賽中的全部三個項目中得到冠軍。雷鋒網 AI 科技評論把這篇比賽總結的主要內容編譯如下。在這篇文章中,我們介紹了NIPS 2017 對抗樣本攻防比賽的情況,包括對抗樣本攻擊研究的一些關鍵問題(第二部分),比賽組織結構(第三部分),以及一些頂尖參賽者所使用的一些方法(第四部分)。對抗樣本對抗樣本是指那些經過特定優化,使得對模型的輸入進行了錯誤分類。
  • NIPS 2017今天開啟議程,谷歌科學家竟然組團去了450人,還都不是去...
    據說,別人去NIPS 2017是這樣的:谷歌去NIPS 2017是這樣的:雷鋒網AI科技評論按:今天,人工智慧領域本年度最後一個學術盛會、機器學習領域頂級會議、第31屆神經信息處理系統大會(NIPS 2017)就要在加州長灘市開啟了。(雷鋒網AI科技評論記者也將親臨現場進行全程報導!)
  • NIPS 2017在美國長灘舉行 機器學習論文哪家強?
    近日,於美國西海岸時間12月4日開始舉辦的機器學習領域頂級會議、第31屆NIPS大會拉開序幕,今年美國計算機四大名校(CMU、MIT、UC伯克利、斯坦福)僅以第一作者所屬機構統計的錄用論文就有92篇,非常強勢。
  • NIPS 2017 騰訊AI Lab 八篇論文入選,含1篇Oral
    插播一下,騰訊 AI Lab 今年還在其他幾大頂級會議上斬獲頗豐,包括機器學習領域另一頂會 ICML(四篇入選)、計算機視覺領域頂會 CVPR(六篇入選)、自然語言處理領域頂會 ACL(三篇入選)等。(加連結)本屆 NIPS 共收到 3240 篇論文投稿,創歷年新高,其中 678 篇被選為大會論文,錄用比例 20.9%。
  • 126篇殿堂級深度學習論文分類整理 從入門到應用 | 乾貨
    [pdf] (第一篇 Sequence-to-Sequence 的論文) ★★★★地址:http://arxiv.org/pdf/1406.1078█[36] Sutskever, Ilya, Oriol Vinyals, and Quoc V. Le.
  • 清華朱軍團隊包攬三項冠軍 | NIPS 2017對抗樣本攻防競賽總結(附學習資料)
    其中清華大學博士生董胤蓬、廖方舟、龐天宇及指導老師朱軍、胡曉林、李建民、蘇航組成的團隊在競賽中的全部三個項目中得到冠軍。我們把這篇比賽總結的主要內容編譯如下。在這篇文章中,我們介紹了NIPS 2017 對抗樣本攻防比賽的情況,包括對抗樣本攻擊研究的一些關鍵問題(第二部分),比賽組織結構(第三部分),以及一些頂尖參賽者所使用的一些方法(第四部分)。對抗樣本是指那些經過特定優化,使得對模型的輸入進行了錯誤分類。
  • 17篇論文,詳解圖的機器學習趨勢 | NeurIPS 2019
    雙曲圖神經網絡論文地址:https://papers.nips.cc/paper/9033-hyperbolic-graph-neural-networks.pdf開源:https://github.com/facebookresearch/hgnn論文 1 和論文 2 兩者的思想是相似的,都希望把雙曲空間的好處和圖神經網絡的表達能力結合起來
  • 剛剛,NIPS 2017 結果出爐,默默看各路大神公布喜訊
    雷鋒網AI科技評論:NIPS,中文名稱為神經信息處理系統大會Facebook AI實驗室研究員田淵棟博士錄用一篇 oral paper:連結:https://arxiv.org/abs/1707.01067宋佳銘,斯坦福博士一年級,現在在OpenAI實習,錄用兩篇NIPS論文:連結:https://arxiv.org/abs/1703.08840
  • 騰訊AI Lab 20 篇論文入選 NIPS2018,含 2 篇 Spotlight
    騰訊 AI Lab 第三次參加 NIPS,共有 20 篇論文入選,其中 2 篇被選為亮點論文(Spotlight),涵蓋遷移學習、模仿學習、半監督學習等多個研究主題,而去年他們入選論文8篇,含1篇口頭報告(Oral)。