ICLR 2018和ICRA 2018參會見聞:機器學習並未被完全接受

2021-03-06 AI前線
AI 前線導讀: 在過去的一個月裡,我參加了兩個會議,ICLR 2018 和 ICRA 2018,ICLR 是關於深度學習的會議,而 ICRA 則是關於機器人的會議。雖然兩個會議相當不同,但是在這裡我們可以將他們做個對比。

更多優質內容請關注微信公眾號「AI 前線」(ID:ai-front)

從研究的角度來看,對抗學習仍將是 ICLR 的一大主題。

深度學習領域中目前最流行的就是生成對抗網絡。在本文中,我會統一介紹一下競爭事務裡的對抗樣本和環境。實際上,任何形式的極小極大化優化問題都可以看作是對抗學習。

我不知道 GAN 是不是真的很流行,或許這是我自己的偏見,因為我很喜歡這些方法,它們給人的感覺很強大。GAN 可以解釋為:通過使用網絡學習到的隱性損失來訓練生成器,而不是用人為定義的損失函數。這使你能適應生成器的能力,並且可以定義無需人工解釋的損失函數。

當然,這會使問題更加複雜。不過如果有足夠強的優化和建模能力,那麼隱性學習損失與其它方法相比,能提供更清晰的圖像。使用學習組件替換系統的部件的一個好處是,優化和建模能力的優勢能應用到問題的更多方面。學習損失函數的能力提升了,同時最小化這些學習損失的能力也提高了。

從更抽象的角度來看,這涉及到具有表達能力,可優化的函數集合,如神經網絡。極大極小值優化算法(Minimax)不是一個新概念,它已經有些年頭了。新的思想在於深度學習能基於高維度數據進行建模,並且學習複雜的損失函數。對我而言,GAN 的有趣之處不是圖像生成,而是它們在複雜數據,如圖像上的概念證明。整個框架並不要求使用圖像數據。

學習過程還有其他的部分可以用學習方法來代替,而不是用人工定義的方法,深度學習就是這樣一種方法。這樣做有意義嗎?也許有。問題是用的深度學習方法越多,讓每件事都具有學習性也變得越難。如果系統不穩定崩潰了,什麼也無濟於事。(烏龜塔理論,烏龜崩潰了,地球就沒有支撐點了)。

最近 Quanta Magazine 上有一篇文章,Judea Pearl 在上面表達了他的失望:深度學習只是學習相關性或曲線擬合,而這並不涵蓋所有的智能。我同意 Judea Pearl 的觀點,但作為深度學習的擁護者,我認為如果你把一個足夠大的神經網絡進行足夠好的優化,你可以學到一些看起來很像因果推理的東西,或者其它可以算作智能的東西。但這就接近哲學的領域了,所以我就講到這裡。

從與會者的角度來說,大量的海報展示相當討人喜歡。這是我第一次參加 ICLR,之前參加過的機器學習會議是 NIPS。NIPS 規模大得驚人,要閱讀每份海報是不可能的。而在 ICLR,這還是能做到的。

另一個值得稱讚的是,ICLR 上的企業招聘也不像 NIPS 那樣古怪。在 NIPS 上,有些企業會發放指尖陀螺等玩具,雖然這很獨特,不過實際上會給人帶來怪異的感覺。在 ICLR,我收到的最奇怪的東西就是一雙襪子,有點古怪但還不是那麼標新立異。

下面是我後續會關注的一些論文:

Intrinsic Motivation and Automatic Curricula via Asymmetric Self-Play

https://openreview.net/forum?id=SkT5Yg-RZ

Learning Robust Rewards with Adverserial Inverse Reinforcement Learning

https://openreview.net/forum?id=rkHywl-A-

Policy Optimization by Genetic Distillation

https://openreview.net/forum?id=ByOnmlWC-

Measuring the Intrinsic Dimension of Objective Landscapes

https://openreview.net/forum?id=ryup8-WCW

Eigenoption Discovery Through the Deep Successor Representation

https://openreview.net/forum?id=Bk8ZcAxR-

Self-Ensembling for Visual Domain Adaptation

https://openreview.net/forum?id=rkpoTaxA-

TD or not TD: Analyzing the Role of Temporal Differencing in Deep Reinforcement Learning

https://openreview.net/forum?id=HyiAuyb0b

Online Learning Rate Adaptation with Hypergradient Descent

https://openreview.net/forum?id=BkrsAzWAb

DORA The Explorer: Directed Outreaching Reinforcement Action-Selection

https://openreview.net/forum?id=ry1arUgCW

Learning to Multi-Task by Active Sampling

https://openreview.net/forum?id=B1nZ1weCZ

ICRA 是我參加的第一個機器人會議。我不知道該期待什麼,我最開始做的是機器學習研究,後來對機器人技術產生了興趣,所以我的興趣更接近於學習控制,而不是製作機器人。我認為理想格局是可以將實際物理世界的硬體看作抽象的。

這種想法再加上對控制理論的不完全理解,我對會議中的很多討論主題都不熟悉。不過,我還是很高興能參加該會議,因為有很多的學習領域論文。

在我能理解的一些研究題目中,我很驚訝有這麼多強化學習的論文。但沒有一篇採用存粹的無模型 (model-free RL)方法,這十分有趣。

對於 ICRA,如果你的算法在機器人上驗證過,相應的論文被採用的機會非常大。這會促使作者關注數據效率,因此對只採用 model-free 的 RL 有很大的偏見。在會場中,會不停聽到類似「我們在 X 中結合了無模型強化學習」的話,其中 X 是基於模型的強化學習(model-based RL),或者從人類表達(human demonstrations)中學習,或從運動規劃(motion planning)中學習,或從任何可以有助於問題解決的東西中學習。

從更廣泛的層面上來看,會議有其實用性。它雖然是一個研究性會議,很多觀點仍處於推理階段,但感覺人們對於有限的,目標明確的解決方案是可以接受的。這可以看作是作者必須使用實際硬體的另一個結果。如果需要實時運行模型,則不能忽略推理時間。如果要從實際機器人那裡收集數據,就不能忽視數據效率。真正的硬體不會關注你的問題是什麼。

(1) 網絡必須能夠運行。

(2) 不管做何努力,也不管賦予何種優先級,我們都無法提高光速。

(RFC 1925)

這讓許多 ML 領域中的人感到驚訝,但這個機器人技術會議並沒有像 NIPS/ICLR/ICML 一樣,完全地接受 ML,部分原因是 ML 並不總能奏效。機器學習是一個解決方案,但它不能確保總是有意義。我認為,ICRA 中只有少許人希望 ML 走向失敗的道路。如果 ML 能夠自證,其餘的人對於使用 ML 是完全沒意見的。而在某些領域,它已經證明了自己。我看到的每篇關於感知的論文都以不同的方式使用了卷積神經網絡(CNN)。但很明顯,極少數人使用深度學習來進行控制,因為控制有許多不確定因素。

和 ICLR 一樣,ICRA 上很多公司也會進行招聘或設置公司展臺。但和 ICLR 不同的是,ICRA 的展臺更有意思。大部分公司會攜帶機器人來演示。這肯定比聽一堆的招聘宣講有趣的多。

在去年的 NIPS 上,ML 公司的展臺讓我聯想到 Berkeley 招聘會上的一些問題。每個科技公司都想招聘 Berkeley 的應屆畢業生。這就像一場競賽,看誰能給出最好的待遇和最好的免費食物。感覺他們的目標是儘可能的讓自己看起來是最酷的公司,但是他們並沒有告訴應聘者以後要做的工作。同樣的,ML 公司在高檔酒吧舉辦的活動也越來越精緻。機器人技術領域還沒有走到這一步,它雖然在發展,但是沒有這麼多誇張的宣傳。

在一些 workshop 上,人們會談論在現實世界中怎樣使用機器人技術,都很有趣。研究會議通常傾向於討論研究和社交,這使人們容易忘記研究本身就具有清晰且即時的經濟價值。曾經有一個「農業中的機器人」報告,談到如何採用計算機視覺來檢測到雜草以及精準噴灑除草劑。這聽起來是很好的事情,用了更少的除草劑,殺死更少的農作物,同時降低了除草劑抗性的產生。

Rodney Brooks 也有一個類似的演講,他以 Roomba 為例,討論了將機器人轉化成消費產品所需的東西。他指出,在設計 Roomba 時,就已經考慮到價格,並且將所有的功能模塊控制在這個價格裡面。結果是,幾百美元的價位限制了傳感器和硬體的選擇,這樣在進行設備級推理時就帶來了很大的限制。

從組織的角度來看,ICRA 運轉的很好。會議中心右側緊鄰一個印刷店,因此在註冊時,組織者會說,如果與會者在特定期限內通過電子郵件發送 PDF 文件,他們會處理剩下的所有流程。與會者需要做的就是在線支付海報費用,並在會議上拿出來。所有的海報展示都在展臺進行,每個區域都有一個白板和一個展示臺,你可以在展示臺上用筆記本電腦播放演示視頻。

下面列出後續我會關注的一些文章:

Applying Asynchronous Deep Classification Network and Gaming Reinforcement Learning-Based Motion Planner to a Mobile Robot

http://ghryou.me/assets/pdf/ghryou_icra_2018.pdf

OptLayer - Practical Constrained Optimization for Deep Reinforcement Learning in the Real World

https://arxiv.org/abs/1709.07643

Synthetically Trained Neural Networks for Learning Human-Readable Plans from Real-World Demonstrations

https://arxiv.org/abs/1805.07054

Semantic Robot Programming for Goal-Directed Manipulation in Cluttered Scenes

https://www.youtube.com/watch?v=kOcdqUmXRRo

https://arxiv.org/abs/1604.03670

查看英文原文:

https://www.alexirpan.com/2018/06/06/iclr-icra.html

如果你喜歡這篇文章,或希望看到更多類似優質報導,記得給我留言和點讚哦!

相關焦點

  • ICLR2018 | 深度學習頂會見聞,乾貨資源都在這裡(附源碼、論文連結)
    第六屆ICLR於2018.4.30~2018.5.03在溫哥華會展中心召開,筆者署名的一篇文章有幸被workshop接收且受邀參會,下面聊一聊個人在ICLR2018上的見聞。筆者走馬觀花的聽了一下匯報、掃了一下海報,直觀感受(主觀感受)有:文章以及涉及的方向實在太多,只能走馬觀花的掃一下,有根據論文評審得分,給論文排了序,大家可根據自己感興趣的挑選和閱讀:https://chillee.github.io/OpenReviewExplorer/參會感悟
  • 「頂會見聞系列」之 EMNLP 2018 詳細參會見聞(下篇)
    Patrick Lewis 是 UCL 的自然語言處理博士生,早前參加了 EMNLP 2018,並在個人博客寫下了他的參會見聞,雷鋒網 AI 科技評論對此進行了有刪節的編譯。本文為頂會見聞的下篇,上篇可移步《「頂會見聞系列」之 EMNLP 2018 詳細參會見聞(上篇)》進行閱讀。
  • 自然語言處理頂會 ACL 2018 參會見聞
    作者在本文記錄了自己在自然語言處理頂會 ACL 2018 的參會經歷,從個人的角度出發,介紹了會議內外的內容、感興趣的工作和研究熱點,並簡單敘述了其以論文作者身份第一次參加學術會議的一些感想。2018 年 7 月 15 日至 20 日,自然語言處理領域的頂級會議 ACL 2018 在澳大利亞墨爾本舉行。
  • 【重磅】深度學習頂會ICLR2018評審結果出爐,一文快速了解評審分析簡報和評分最高的十篇論文
    Open Review 則非常不同,根據規定,所有提交的論文都會公開姓名等信息,並且接受所有同行的評價及提問(open peer review),任何學者都可或匿名或實名地評價論文。而在公開評審結束後,論文作者也能夠對論文進行調整和修改。這幾天ICLR 2018的審稿結果陸續出來了,讓我們來看一下。
  • 【收藏】2018年不容錯過的20大人工智慧/機器學習/計算機視覺等頂會時間表
    本文介紹了2018年值得關注的20個頂會,包括人工智慧、機器學習、計算機視覺、自然語言處理、體系結構等領域。目錄人工智慧/機器學習計算機視覺/模式識別自然語言處理/計算語言學體系結構數據挖掘/信息檢索計算機圖形學1.
  • 參會見聞系列:ACL 2018,在更具挑戰的環境下理解數據表徵及方法評價
    雷鋒網 AI 科技評論按:本篇屬於「頂會見聞系列」。每年這麼多精彩的人工智慧/機器學習會議,沒去現場的自然可惜,在現場的也容易看花眼。那麼事後看看別的研究員的見聞總結,也許會有新的收穫呢。想要將整個 ACL 2018 的內容歸納在一個主題下無異於異想天開。然而,細細品味一下,還是能明顯地看出一些重要的議題。在 2015 和 2016 年的自然語言領域的學術會議中,詞嵌入技術可謂一統天下。
  • ICLR 2018論文評審結果出爐:一文概覽論文 TOP 5
    論文評分前一百名結果:http://search.iclr2018.smerity.com/根據 Andrej Karpathy 的介紹,在今年 4 月的 ICLR 2017 大會上,提交論文的數量為 491 篇,而被接受的情況為:15 篇 oral(3%),183 篇 poster
  • 學界丨先睹為快:神經網絡頂會ICLR 2018論文接受結果速覽
    的論文接受結果揭曉,我們就帶大家來大致了解一下今年ICLR 2018的論文接受概況。論文接受率:2.3%的口頭展示,31.4%的poster接受,9%的workshop,51%拒絕。ICLR口頭論文中一大半的論文會成為ICLR Best paper,同時也代表了2018年的研究方向,下面我們就簡單的介紹一下今年的oral論文,由於ICLR會議的論文範圍較廣,方向比較新,我們也不能夠做到面面俱到。
  • 聽說NIPS 2018 門票十分鐘賣光,機器學習圈子炸了鍋
    雷鋒網 AI 科技評論按:全世界都知道人工智慧火、機器學習火。具體火到了什麼程度呢?昨晚 NIPS2018 的售票情況可謂是最直觀、也最驚人的展現了,作為一個研究人員們欣賞彼此論文、討論學術話題的嚴肅學術會議,正會門票 11 分鐘就宣告售罄,要比 Taylor Swift 演唱會門票還要搶手!
  • 2017回顧與2018前瞻:機器學習與人工智慧
    AI 前線導讀:2017 年,在機器學習和 AI 領域,AlphaGo Zero 的成功讓專家們印象深刻,2018 年,道德和隱私問題將成為最亟待解決的問題。時隔一年,科技媒體 KDnuggets 最近向大數據、數據科學、人工智慧和機器學習領域的一些頂尖專家徵詢了他們對於 2017 年這些領域最重要的發展,以及 2018 年的主要發展趨勢的看法。這篇文章是本系列的第一篇年終總結,主要是關於在 2017 年,機器學習和 AI 領域都發生了哪些大事,以及 2018 年可能會出現哪些趨勢。
  • 「收藏」2018年不容錯過的20個人工智慧頂會時間表
    本文介紹了2018年值得關注的20個頂會,包括人工智慧、機器學習、計算機視覺、自然語言處理、體系結構等領域。ICLR由Yann LeCun 和 Yoshua Bengio 等大牛發起,會議開創了公開評議機制(open review),但在今年取消了公開評議,改為雙盲評審。官網:http://www.iclr.cc4.
  • 機器學習頂會 ICML 2018 斯德哥爾摩開幕,公平性研究戴上光環
    雷鋒網 AI 科技評論按:經過 7 月 10 日的三個 Tutorial Session 和 Opening Reception 晚宴之後,在瑞典斯德哥爾摩舉辦的機器學習頂會 ICML 2018 正式進入第一天的正會。
  • ICLR 2020華人雄起!華人參與度近60%,清華、南大均斬獲滿分論文
    此次虛擬頂會的參會形式有所改變,所有被接受的論文都要預先錄製展示視頻。而上面這篇論文,正如所有被接受的ICLR論文一樣,通過發視頻來展示論文的成果。2020年4月26日,ICLR準時拉開序幕,眾多業界大咖紛紛齊聚線上,開啟「雲參會」。
  • 一份AI博士生的ICML2018「學霸」筆記(55頁)
    除了Best Paper的講述,還有不少workshop探討目前機器學習領域的最熱話題。大會內容之豐富,讓不少新參會者奔波於各個會場之間,很容易漏聽掉某些精彩內容。但是,有經驗的參會「老司機」不僅會先做好攻略,鎖定每一場精彩講座,還能根據錄音錄像,整理出一份完整精彩的參會筆記。
  • 航院助理教授眭亞楠獲得2020年機器人與自動化國際會議(ICRA)最佳...
    ICRA是機器人和人工智慧領域最重要的國際會議之一。這是加州理工學院和清華大學首次獲得ICRA最佳論文獎。 本文在眭亞楠等人前期工作的基礎上構建了一種交互式的機器學習方法,可以根據使用者的偏好和建議來優化外骨骼機器人的步態動作。文章提出了一個新穎且靈活的機器學習框架,並在真實外骨骼機器人系統中進行了細緻的實驗驗證。該方法在人機互動和康復醫療方面具有廣泛的應用空間。
  • 2018年最出色30個機器學習項目 (公號回復「機器學習2018」下載PDF資料)
    30個機器學習項目》是美國IT媒體Medium原標題30 Amazing Machine Learning Projects forthe Past Year (v.2018)漢譯文,來自Mybridge介紹了2017年最驚豔的30個機器學習項目。
  • 優必選機器人亮相IEEE ICDM 2018,助力全球AI學術研究和人才培養
    ICDM 2018大會期間,優必選機器人家族亮相會場,充滿表現力的優必選機器人吸引了參會嘉賓體驗互動,優必選AI及機器人教育解決方案受到全球各高校專家學者和研究者的關注。參會嘉賓與Cruzr(克魯澤)互動智能雲平臺商用服務機器人Cruzr(克魯澤)在大會籤到處擔任迎賓機器人,用英文歡迎全球參會嘉賓:「Welcome to ICDM 2018, have a nice day! (歡迎您參加ICDM 2018,祝您度過愉快的一天!)」,提供大會服務信息和充滿科技感的娛樂互動體驗,用暖心服務贏得了參會嘉賓的讚揚。
  • ICLR 2020接收結果已出,明年非洲見
    此外,由於舉辦地國情特殊(傳染病、禁止同性戀),大會官方還給出了一些特別的參會建議。「史上第一次在非洲舉行的 AI 頂會」ICLR 2020 將於明年 4 月 26 日於衣索比亞首都阿迪斯阿貝巴舉行。今年的 ICLR 也不算風平浪靜,先是投稿數量爆炸導致審稿負擔急劇增加,結果被爆出一半審稿人根本沒在相關領域發過論文,輿論風向一度演化為「機器學習同行評審崩塌了」。
  • 多倫多大學「神經網絡與機器學習導論(2018年春季)
    ▌概述機器學習是一套強大的技術,它允許計算機從數據中學習,而不是讓人類專家手工編程行為。神經網絡是一類最初受大腦啟發的機器學習算法,但最近在實際應用中取得了很多成功。_2018/slides/lec01.pdf講義地址:http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L01%20Introduction.pdf介紹什麼是機器學習和神經網絡,你會用它們做什麼?