7 papers|NeurIPS 2019獲獎論文揭曉;OpenAI刀塔2論文公布

2021-01-09 機器之心Pro

機器之心整理

參與:杜偉

本周既有 NeurIPS 2019 公布的傑出論文獎和經典論文獎論文,也有 MIT 聯合 IBM 推出的使圖像識別 SOTA 模型性能下降 40 多個點的 ObjectNet 數據集以及 OpenAI 擊敗 OG 戰隊的 Dota 2 智能體論文。

目錄:

Distribution-Independent PAC Learning of Halfspaces with Massart NoiseDual Averaging Methods for Regularized Stochastic Learning and Online OptimizationReinforcement Learning Upside Down: Don't Predict Rewards -- Just Map Them to ActionsObjectNet: A large-scale bias-controlled dataset for pushing the limits of object recognition modelsDynamic Convolution: Attention over Convolution Kernels Dota 2 with Large Scale Deep Reinforcement Learning Point-Voxel CNN for Efficient 3D Deep Learning

論文 1:Distribution-Independent PAC Learning of Halfspaces with Massart Noise

作者:Ilias Diakonikolas、Themis Gouleakis、Christos Tzamos論文連結:https://papers.nips.cc/paper/8722-distribution-independent-pac-learning-of-halfspaces-with-massart-noise

摘要:本文作者研究了分布獨立的半空間(half-space)下的 PAC 學習問題(在 Massart 噪聲下)。具體而言,給定一組帶標籤樣本(x, y),採樣於 R^d+1 維的分布 D,如此以來,未帶標籤點 x 上的邊緣分布是任意的,並且標籤 y 通過一個未知半空間生成,而這個未知半空間被 Massart 噪聲破壞,其中噪聲率η<1/2。現在我們的目的是找出假設 h,它能夠最小化誤分類誤差(misclassification error)

。對於這個問題,作者提出了誤分類誤差為η+ε的 poly (d, 1/ε) 時間算法。此外,他們還提供了證據證明其算法的誤差保證(error guarantee)在計算上可能很難實現。作者表示,在他們的研究之前,即使是針對析取類(class of disjunction)而言,在這個模型中也沒有出現高效的弱(獨立分布)學習器。這種針對半空間(或甚至於析取而言)的算法在各項研究中一直是懸而未決的問題,從 Solan(1988)、Cohen(1997)到最近的 Avrim Blum 的 FOCS 2003 教程都強調了這一問題。

主要算法 1(with margin)。

主要算法 2(general case)。

推薦:這篇論文榮獲了NeurIPS 2019傑出論文獎,研究了線性閾方程(linear threshold function)在二分類的,有著未知的、有邊界標籤噪聲訓練數據的情況。它解決了一個非常基礎且長期開放的問題,並提出了一個高效的算法用於學習。這是機器學習核心領域的長期開放的問題,而這篇論文做出了巨大的貢獻。其貢獻在於:在 Massart 噪聲下高效地學習半空間(half-space)。

論文 2:Dual Averaging Methods for Regularized Stochastic Learning and Online Optimization

作者:Lin Xiao論文連結:https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/xiao10JMLR.pdf

摘要:經典論文獎的授予原則為「重要貢獻、持久影響和廣泛吸引力」,本屆大會從 2009 年 NIPS 的 18 篇引用最多的論文中選出了持續影響力最高、對研究領域具有傑出貢獻的研究。最終,今年的這一獎項授予 NIPS 2009 論文《Dual Averaging Method for Regularized Stochastic Learning and Online Optimization》及其作者,微軟首席研究員 Lin Xiao。

推薦:Lin Xiao 曾就讀於北京航空航天大學和史丹福大學,自 2006 年起就職於微軟研究院。

論文 3:Reinforcement Learning Upside Down: Don't Predict Rewards -- Just Map Them to Actions

作者:Juergen Schmidhuber論文連結:https://arxiv.org/abs/1912.02875

摘要:在本文中,通過將傳統 RL 顛倒過來,稱之為 Upside Down RL(UDRL),作者將強化學習(RL)轉換成了一種監督式學習(supervised learning,SL)。標準 RL 預測獎勵(reward),而 UDRL 將獎勵作為任務定義輸入(task-defining input)、時間範圍表示以及歷史和預期未來數據的其他可計算函數。UDRL 學習將這些輸入觀察作為命令進行解讀,並通過過去經驗上的 SL 將它們映射到行動(或行動概率)上。通過「get lots of reward within at most so much time!」等命令,UDRL 可以泛化以實現高獎勵或其他目標。此外,作者還提出了一種簡單但通用的方法來教機器人模擬人類動作。首先錄下模擬機器人當前行為的人類,然後讓機器人通過 SL 學習將視頻(作為輸入命令)映射到這些行為中,最後令機器人泛化和模擬人類執行先前位置行為的視頻。這種模擬-模擬器(Imitate-Imitator)概念或許可以真正地解釋為什麼生物進化導致了父母模擬子女的咿呀語(babbling)行為。

算法 A1。

算法 A2。

算法框架:模擬-模擬器(Imitate-Imitator)。

推薦:Juergen 新作表示強化學習不需要設置獎勵。

論文 4:ObjectNet: A large-scale bias-controlled dataset for pushing the limits of object recognition models

作者:Andrei Barbu、David Mayo、Julian Alverio、Julian Alverio 等論文連結:https://objectnet.dev/objectnet-a-large-scale-bias-controlled-dataset-for-pushing-the-limits-of-object-recognition-models.pdf項目地址:https://objectnet.dev/

摘要:圖像識別是計算機視覺中最為成熟的領域了。從 ImageNet 開始,歷年都會出現各種各樣的新模型,如 AlexNet、YOLO 家族、到後面的 EfficientNet 等。這些模型都在刷新著各種圖像識別領域的榜單,創造更令人驚訝的表現。而近日,MIT 和 IBM 的研究者發現,在他們建立的一個名為 ObjectNet 的數據集上,即使是現在的 SOTA 模型都會「吃癟」。這一新的數據集能夠讓模型的性能下降了 40 多個點。最終,研究者們公開了這個數據集,並鼓勵人們開發更好的模型來解決問題。這一數據集相關的論文已經被 NeurlPS 2019 大會接收為 Poster 論文,讀者們可以參考這個有趣的研究,看看自己的圖像識別模型性能如何。

ImageNet 圖像(左側)和 ObjectNet 圖像的對比。可以看出 ObjectNet 圖像中的目標有各種奇怪的語義。

在 ImageNet 上訓練,並在 ImageNet 測試集或 ObjectNet 做驗證的結果,很明顯,不同的網絡的性能都會大幅降低。

ResNet-152 在 ImageNet 上做預訓練,並在 ObjectNet – 113 做測試的結果。

推薦:近日,MIT 聯合 IBM 研究團隊提出了一個數據集,在它上面測試的圖像識別 SOTA 模型的性能下降了 40 多個點。

論文 5:Dynamic Convolution: Attention over Convolution Kernels

作者:Yinpeng Chen、Xiyang Dai、Mengchen Liu、Dongdong Chen、Lu Yuan、Zicheng Liu論文連結:https://arxiv.org/pdf/1912.03458.pdf

摘要:輕量級卷積神經網絡(light-weight convolutional neural network)因其較低的計算預算而限制了 CNN 的深度(卷積層數)和寬度(通道數)而導致性能下降,表示能力也會受到限制。為了解決這個問題,在本文中,微軟的研究者們提出了動態卷積,這種新的設計可以在不增加網絡深度或寬度的情況下增加模型複雜度(model complexity)。動態卷積沒有在每層上使用單個卷積核,而是根據注意力動態地聚合多個並行卷積核,這些卷積核依賴於輸入。得益於小的內核尺寸,集合多個內核不僅在計算上很高效,而且由於這些內核通過注意力以非線性方式進行聚合,因此具有更強的表示能力。通過在 SOTA 架構 MobilenetV3-Small 上簡單地使用動態卷積,ImageNet 分類的 top-1 準確度提高了 2.3%,而 FLOP 僅增加了 4%,在 COCO 關鍵點檢測上實現了 2.9 的 AP 增益。

動態卷積層架構。

DY-CNN(動態卷積神經網絡)和 CNN 在 ImageNet 分類上的結果對比。

推薦:與傳統靜態卷積(每層單個卷積核)相比,本文提出的動態卷積顯著提升了表示能力,額外的計算成本也很小,因而對高效的 CNN 更加友好。這種動態卷積還可以容易地整合入現有 CNN 架構中。

論文 6:Dota 2 with Large Scale Deep Reinforcement Learning

作者:Christopher Berner、Greg Brockman、Brooke Chan、Brooke Chan 等論文連結:https://cdn.openai.com/dota-2.pdf

摘要:要為這樣複雜的環境創造合適的智能體,關鍵是要將現有的強化學習系統擴展至前所未有的規模,這需要在數以千計的 GPU 上執行幾個月的訓練。為了實現這一目標,OpenAI 構建了一個分布式的訓練系統,訓練出了名為 OpenAI Five 的 Dota 2 遊戲智能體。2019 年 4 月,OpenAI Five 擊敗了一支 Dota 2 世界冠軍戰隊(OG 戰隊),這是首個擊敗電子競技遊戲世界冠軍的 AI 系統。OpenAI 也將該系統開放給了 Dota 2 社區進行對戰試玩;在超過 7000 局遊戲中,OpenAI Five 的勝率為 99.4%。OpenAI 表示,訓練過程還面臨著另外一個難題:遊戲環境和代碼一直在不斷升級和變化。為了避免在每次變化之後再從頭開始訓練,他們開發出了一套工具,能以最低的性能損失繼續完成訓練——OpenAI 將其稱之為「手術(surgery)」。在超過 10 個月的訓練過程中,OpenAI 大約每兩周執行一次手術。這套工具讓 OpenAI 可以經常性地改進他們的智能體,這只需要很短的時間——比典型的從頭開始訓練方法要短得多。隨著 AI 系統解決的問題越來越大,越來越難,進一步研究不斷變化的環境和迭代開發就顯得至關重要了。

簡化版的 OpenAI Five 模型架構。

系統概況:該訓練系統由 4 種主要類型的機器構成。

推薦:擊敗 OG 戰隊的 Dota 2 智能體究竟是怎樣構建的?OpenAI 公開研究論文。

論文 7:Point-Voxel CNN for Efficient 3D Deep Learning

作者:Zhijian Liu、Zhijian Liu、Zhijian Liu、Zhijian Liu論文連結:https://arxiv.org/pdf/1907.03739.pdf

摘要:我們發現之前的工作竟需要花 80% 以上的時間進行對數據的不規則訪問以作為卷積運算的準備工作,而實際計算所佔的時間比例卻非常低,這無疑造成了基於點雲的深度學習方法往往比較低效。為解決這樣的問題,我們提出了 Point-Voxel CNN(PVCNN)來實現高效的三維深度學習。PVCNN 利用點雲的形式來存儲數據,以減小內存的消耗,而又選擇柵格化的形式進行卷積,這樣可以避免處理點雲稀疏性所帶來的巨大的非規則數據訪問開銷,很好地提升局部性。這種取長補短的設計使我們的 PVCNN 在內存和計算上都十分高效:我們只用十分之一的內存就可以取得遠高於 volumetric CNN baseline 的準確率,而對比於多個基於點雲直接進行深度學習的方法,我們又可以得到平均 7 倍的實測加速。

在 ShapeNet 數據集上,我們的完整通道數模型可以以 2.7 倍的實測加速達到略好於 PointCNN 的性能,同時我們的內存佔用也減小了 1.6 倍;而即便我們將通道數縮小四倍,我們的模型也可以在達到 PointNet++, DGCNN 等複雜方法性能的同時比 PointNet(此前這個領域中被認為最為精簡、高效的模型)快 1.9 倍、省 1.9 倍內存。

PVCNN 在邊緣設備上以低延遲進行高效地運行。完整的 PVCNN 可以在 NVIDIA Jetson AGX Xaviers 上以每秒 20.2 個物體的速度運行,而四分之一寬度版本的小模型在價格僅 99 美元的 NVIDIA Jetson Nano 上也可以達到接近每秒 20 個物體的速度。

推薦:隨著三維深度學習越來越成為近期研究的熱點,基於柵格化的數據處理方法也越來越受歡迎。但這種處理方法往往受限於高分辨下巨大的內存和計算開銷,因此麻省理工學院 HAN Lab 的研究者提出利用 Point-Voxel CNN 來實現高效的三維深度學習,同時能夠避免巨大的數據訪問開銷並很好地提升了局部性。該論文已被 NeurIPS 2019 接收為 Spotlight Presentation。

相關焦點

  • 17篇論文,詳解圖的機器學習趨勢 | NeurIPS 2019
    我們還有一個雙曲知識圖嵌入比賽,獲獎方法名為 RotationH,論文見 https://grlearning.github.io/papers/101.pdf  ,其實和上面的雙曲圖卷積神經網絡論文的作者是同一個人
  • GPT-3獲NeurIPS最佳論文獎,華人學者獲經典論文獎
    今天早晨,大會評委會公布了獲得最高榮譽的論文名單:,也是一篇關於學習理論的論文。>(Test of Time Award,也稱經典論文獎),以表彰這篇論文對AI學界產生的持久而深遠的影響。今年共選取了12篇候選者,最終獲獎的是在NeurIPS 2011年發表的論文:
  • 7500人參會,國內接收論文數量超越美國,ICCV 2019最佳論文揭曉
    機器之心報導機器之心編輯部兩年一度的計算機視覺國際頂會 ICCV 2019 已於 10 月 27 日在韓國首爾開幕。在過去兩天的 workshop 與 tutorial 上,我們看到了各個公司與團隊在挑戰賽上的角逐。今日,大會主會議正式開始,此屆大會的最佳論文、最佳學生論文等獎項也於剛剛揭曉。
  • NeurIPS 2019 程序委員會主席發聲明:19 篇論文因一稿多投被拒收!
    本文是 NeurIPS 2019 程序委員會主席對近期作者反饋階段工作的幾點說明,主要介紹了審稿進度以及本屆 NeurIPS 為防止一稿多投現象做所的努力,並宣布了提交至 NeurIPS 的論文中有 19 篇由於存在一稿多投的問題將被拒收的決定。
  • 7 Papers & Radios | ACL 2020獲獎論文;貝葉斯深度學習綜述
    機器之心 & ArXiv Weekly Radiostation參與:杜偉、楚航、羅若天本周的重要論文包括 ACL 2020 公布的最佳論文、最佳主題論文、最佳 Demo 論文以及其他獎項論文,此外還有 MIT 和香港科技大學學者的貝葉斯深度學習綜述論文
  • 算法最熱arXiv論文接收率高一倍,NeurIPS2019最全報告+視頻+筆記
    論文提交、接收基本情況在過去的五年中,NeurIPS 的投稿量翻了兩番。今年,經過篩選後,稿件的數量仍然達到了6,743 篇(在通知時減少到了 6,614 篇),總計有 4,500 多名審稿人撰寫了超過 2 萬條評審意見。最終,今年有 1,428 篇論文被錄用,錄取率為 21.6%。
  • 嚴禁一稿多投:NeurIPS 2019剛剛斃掉了19篇論文
    機器之心報導參與:澤南、杜偉上星期,人工智慧頂級學術會議 NeurIPS 2019 的論文評審結果剛剛放出。昨天,本屆 NeurIPS 程序主席、谷歌大腦研究員 Hugo Larochelle 等人發出了一篇公告,宣布大會剛剛因為一稿多投拒掉了 19 篇論文。
  • 2019 ACM博士論文獎公布,MIT學霸吳佳俊獲榮譽提名
    今日,2019 ACM 最佳博士論文獎公布,畢業於特拉維夫大學的 Dor Minzer 獲得該獎項。此外,來自微軟的 Jakub Tarnawski 和出身清華姚班的吳佳俊獲得榮譽提名獎。畢業於特拉維夫大學的 Dor Minzer 博士憑藉論文《On Monotonicity Testing and the 2-to-2 Games Conjecture》獲得該獎項。
  • 首屆AAAI/ACM SIGAI博士論文獎公布,姚班學霸吳佳俊獲獎
    麻省理工學院博士吳佳俊獲得了2019年AAAI / ACM SIGAI博士論文獎。另外還有兩位博士獲得了runners-Up獎項,分別是畢業於喬治亞理工學院的Aishwarya Agrawal和畢業於愛丁堡大學的董力。
  • Cell Press細胞出版社2019中國年度論文和機構揭曉
    論壇揭曉了細胞出版社2019中國年度論文和年度機構獲獎名單。細胞出版社2019中國年度論文共有10篇,其中生命科學領域6篇,分別為以鮑進、薛天為通訊作者,發表在Cell上的《可注射自主賦能的視網膜納米天線賦予哺乳動物近紅外圖像視覺》;以沈南、楊力、陳玲玲為通訊作者,發表在Cell上的《環形RNA結構與降解調控PKR激活和天然免疫反應》;以彭吉潤、任仙文、張澤民為通訊作者,發表在Cell上的《單細胞技術揭示肝癌免疫圖譜與動態特徵》;以翁志萍為通訊作者,發表在Cell
  • 深度圖高斯過程 | NeurIPS 2020論文分享第一期
    為了幫助大家了解NeurIPS最新研究成果和動態,我們特別邀請到清華大學伯克利深圳研究生院李乃琦博士、清華大學深圳國際研究生院李文杰博士作客AI研習社NeurIPS2020系列論文解讀直播間,為大家詳細介紹他們被收錄的論文情況,兩位嘉賓分享完還有問答環節,歡迎大家積極參與互動,一起探討《深度圖高斯過程》。
  • 全省法院司法技術優秀論文評選結果揭曉,我們獲獎啦
    喜 報為總結司法技術工作經驗,適應全省法院工作走在全國前列的新要求,提升全省司法技術工作水平,根據2020年度工作總體安排,在全省法院組織了司法技術優秀論文評選活動。全省16個中級人民法院經過認真遴選把關,共推薦報送115篇司法技術優秀論文參評。
  • NeurIPS圖表示學習研討會錄取論文揭曉:92篇論文看懂圖表示學習
    10 月 18 日,2019 中關村論壇平行論壇 ——AI WORLD 2019 世界人工智慧峰會在北京啟幕。新智元楊靜、科大訊飛胡鬱、微軟王永東、華為王成錄、英特爾宋繼強、曠視及智源學者孫劍、滴滴葉傑平、AWS 張崢、依圖顏水成、地平線黃暢、autowise.ai 黃超等重磅嘉賓中關村論劍,重啟充滿創新活力的 AI 未來。
  • 2019年度諾貝爾獎將於10月7日-14日公布,猜猜誰會獲獎?
    入駐化學加,推廣快人一步 導讀 近日,諾貝爾獎官網公布了2019年度諾貝爾獎揭曉時間,分別將於10月7日至14日公布,其中諾貝爾化學獎將於10月9日公布,大家猜猜今年會有哪些科學家獲獎呢,「諾貝爾化學獎」會不會又變成「諾貝爾理綜獎
  • Journal of Materials Science 2019 Cahn Prize 最佳論文獎揭曉
    期刊編輯們每個月都要經過嚴格的提名和投票程序,在當月的期刊上選出一篇論文發表。最終獲獎論文是由傑出的材料科學家組成的獨立小組從12名月度決賽選手中選出的,獲獎者會獲得5000美元的獎金。2019年度Cahn Prize於秋季2019 Materials Research Society Meeting 期間公布,由江南大學的付少海教授和張麗平教授的論文 「Robust raspberry-like all-polymer particles for the construction of superhydrophobic surface with high water
  • ACL 2019 27 篇論文實現代碼(持續更新中)
    ACL 2019 將於今年 7月28日-8月2日 在義大利佛羅倫斯舉行,作為 NLP 頂級會議之一,備受廣大 NLP 學術青年的關注。ACL 2019 共接收了 765 篇論文,目前官網已經全部公布了,官方連結:http://www.acl2019.org/EN/program/papers.xhtml但是官網沒有公布連結,部分論文也沒有展示出來。所以AI研習社給大家整理了343篇論文,供大家學習!
  • ACCV 2020最佳論文等三項大獎出爐!華為諾亞獲最佳學生論文獎
    ACCV 2020 共錄用論文 255 篇,官方提供所有論文開放下載。官網連結:http://accv2020.kyoto/截止目前,大會已經公布了最佳論文獎、最佳學生論文獎、最佳應用論文獎等三項大獎,其中帝國理工和華為諾亞方舟合作獲得了最佳學生論文獎。以下AI科技評論就帶大家讓我們一起來看看這三項大獎吧 !
  • 2020年諾貝爾化學獎揭曉 2名女科學家獲獎
    當地時間10月7日,2020年諾貝爾化學獎正式揭曉,Emmanuelle Charpentier和Jennifer A. Doudna獲得這一獎項。以表彰她們在「憑藉開發基因組編輯方法」方面作出的貢獻,兩位獲獎者將分享1000萬瑞典克朗獎金(約合760萬人民幣)。
  • 區政府關於公布2018—2019年度海門區自然科學優秀學術論文評審...
    為鼓勵廣大科技工作者積極投身科學實踐研究,推動科技進步與自主創新,促進學科發展與人才成長,由區科協牽頭,於2020年5月啟動2018-2019年度自然科學優秀學術論文徵集和評審工作。經各區級學會初評、區專業評審組複評和區自然科學優秀學術論文評審工作委員會審定、公示,共評出優秀自然科學學術論文44篇,其中一等獎6篇,二等獎18篇,三等獎20篇。現予以公布(名單見附件)。
  • 2014年度「人民網優秀論文獎」獲獎名單揭曉
    人民網北京12月17日電(萬丹妮)今天下午,人民網「最具潛質新聞人大賽」研究論文獎總決賽暨人民網獎學金頒獎典禮在清華校園舉行。頒獎典禮現場公布了2014年度人民網優秀論文獎獲獎名單(特等獎5000元;一等獎3000元;二等獎2000元;三等獎1000元)。