來源:Medium、Yann LeCun
轉載公眾號:新智元
微信號:AI_era
作者:Carlos E. Perez、Yann LeCun
編譯:王楠、劉小芹
【新智元導讀】日前,Facebook AI 實驗室負責人、紐約大學教授 Yann LeCun 受邀在今年的 NIPS 大會發表主旨演講,暢談深度學習最近技術進展。值得注意的是,LeCun 試圖改變人們對 AI 的通常分類(即無監督學習、監督學習和增強學習),他在演講中用「預測學習」替代「無監督學習」,因為預測學習要求機器不僅能在沒有人類監督的情況下學習,而且能夠學習世界的預測模型。
此外,LeCun 還引入了使用 RNN 實體從文本中推斷世界的狀態等新的技術,結合深度學習領域最新發展,比如 TorchCraft、使用對抗訓練讓系統預測視頻接下來的內容。【在新智元微信公眾號回復1207,可下載全部75頁PPT】
要了解今年 NIPS 的盛況,先上一張圖:
2016 年,作為學界頂級盛會的 NIPS 共收到投稿超過 2500 篇,最終接收了 568 篇——保守估計接收率 22.7%。這個論文接收率並不算那麼低(相較其他頂會),不過,得到口頭展示機會的名副其實百裡挑一。
再看參會人數及其近年來的增長趨勢(上圖右)——尤其是近兩年,用「直線上升」形容毫不誇張。如果這個顯示的是某個國家的 GDP,估計領導人絕對合不攏嘴了。
作為 2016 年 NIPS 大會受邀發表主旨演講的第一人,紐約大學教授、Facebook 人工智慧實驗室(FAIR)主管 Yann LeCunn 的演講備受矚目:
(文/Carlos E. Perez)Yann LeCun 今年演講中多次提到這樣一個類比:
如果把「智能」(intelligence)比作一個蛋糕,那麼無監督學習就是蛋糕本體,監督學習是蛋糕上的糖霜,而增強學習是蛋糕上的櫻桃。我們知道如何得到糖霜和櫻桃,但不知道怎樣做蛋糕。
在 NIPS 2016 上,LeCun 開始使用「預測學習」(predictive learning)這個詞代替「無監督學習」(unsupervised learning)。LeCun 在演講中說:
我們缺乏的一個關鍵要素是預測(或無監督)學習:機器具有模擬環境,預測未來的可能性,以及通過觀察和參與理解世界如何運作的能力。
這是一個有趣的變化,表明 LeCun 的「做蛋糕」觀點有了一些微妙的變化。在 LeCun 看來,需要建立基礎,然後才能讓 AI 加速進步。換句話說,在我們能夠建立「預測基礎層」(predictive foundational layer)之前,試圖通過增加更多的內存、知識庫、協作智能體等構建當前的監督學習將會十分困難。
在 NIPS 大會上,他貼出了下面這張 PPT:
1. 機器需要學習/理解世界的運轉方式
物理世界、數字世界、人
需要掌握常識
2. 機器需要學會大量的背景知識
通過觀察或者行動
3.機器需要感知世界的變化
以作出精準的預測和計劃
4.機器需要更新並記住對世界狀態的預測
關注重大事件、記住相關事件
5. 機器需要會推理和計劃
預測哪些行動會帶來預期的改變
智能&常識=感知+預測模型+記憶+推理&計劃
LeCun 的演講強調了我們面前的艱巨任務。
預測學習要求機器不僅能在沒有人類監督的情況下學習,而且能夠學習世界的預測模型。這點非常重要,這也是為什麼 LeCun 試圖改變人們對 AI 的通常分類(即無監督學習、監督學習和增強學習)。
以下為 Yann LeCun NIPS 2016 演講實錄——《預測學習》
很高興跟大家分享,今天我演講的主題是「預測學習」。
什麼是預測學習?首先,我們還是要先從感知機講起。從下面的照片中可以看見年輕的 Geoff Hinton,他當時還是 CMU 的研究員。Tarry Knoafski、Jay McLaren(他當時也在CMU),在 McLaren 旁邊是 Michael Jordan。照片上的這些人現在基本都已經成就了一番大事業。還有我,我就在那裡。
當時是段美好的時間。那時候是人們第一次開始提起 Backpropagation,Backpro 這個概念在當時真的超級火,雖然論文還沒有發表出來——照照片的時候還是 1986 年7月,在章節中涉及 BP 算法的書後來才出版,相關論文也是一年後才在 Nature 發表。
我現在展示的這張照片顯示的是感知機——我們都忘記了 20 世紀 50 年代的感知機,但感知機可以說是所有神經網絡的基礎。感知機實際上並不是一個電腦程式,而是一臺模擬計算機(analog computer)。與神經元模型不同,感知器中的權值是通過訓練得到的。你只要一按鍵,當系統發生錯誤時,所有的模塊都會「死過去」。
我們都知道監督學習是什麼了,而我之所以要提監督學習,是因為後面我們會涉及為什麼它有局限。在機器學習中,我們將樣本——比如汽車或者飛機的圖像,輸入有很多可調參數的機器裡——這實際上是一個類比。當輸入的是一輛車時,紅燈就會亮,當輸入是飛機時就打開綠燈。然後我們就不停調整參數。通過增加梯度,我們可以調整亮綠燈的次數。
這張 Slide 大家都看過很多次了,用於物體識別的深度卷積網絡。監督學習實際上就是學會層次化的表徵。例如下面用卷積網絡做自動駕駛,這是當初 DARPA 挑戰賽做的機器人。
使用卷積網絡生成圖說、進行圖像詞義分割
使用卷積網絡進行的自動駕駛
多層神經網絡:
一個單元包含多層神經網絡
一個單元計算其獲得的輸入的一部分加權和
加權和會通過一個非線性函數
學習算法會改變權重
1.機器需要學習/理解世界的運轉方式
物理世界、數字世界、人
需要掌握常識
2. 機器需要學會大量的背景知識
通過觀察或者行動
3.機器需要感知世界的變化
以作出精準的預測和計劃
4.機器需要更新並記住對世界狀態的預測
關注重大事件、記住相關事件
5. 機器需要會推理和計劃
預測哪些行動會帶來預期的改變
智能&常識=感知+預測模型+記憶+推理&計劃
什麼是常識?代詞「它」的指代對象,動作的執行者。機器該怎麼理解。
預測學習/無監督學習的重要性
訓練大型學習機器所要求的樣本的數量,取決於我們讓它預測的信息量
我們向機器提問的信息越多,所需的樣本數量越大
大腦有 10^14 的神經突觸,而我們的生命只有 10^9 秒。我們擁有的參數的量遠超數據的量。這就激發了一種想法,即由於知覺輸入(包括本體感覺)是唯一能每秒得到 10^5 個維度的約束的地方,我們必須要做很多的無監督學習。
預測人類提供的標記是不足夠的
預測一個價值函數也不足夠
如果把「智能」(intelligence)比作一個蛋糕,那麼無監督學習就是蛋糕本體,監督學習是蛋糕上的糖霜,而增強學習是蛋糕上的櫻桃。我們知道如何得到糖霜和櫻桃,但不知道怎樣做蛋糕。
在 FAIR 使用強化學習訓練系統玩遊戲的例子
順便給剛剛開源的 TorchCraft 打一下廣告
有趣的是,在LeCun講解 Sutton例子時,Sutton 本人就在下面聽(最後排最右邊)。來源:Twitter
經典的基於模型的優化控制
用初始控制序列模擬世界
調整控制序列,通過梯度下降優化對象
在上世紀 50 年代,通過控制論,發明了 BP 算法
AI 系統 = 會學習的智能體 + 不可變對象
AI 系統 = 會預測 + 會規劃= 能夠進行推理
我們需要的是基於模型的強化學習系統
智能體的關鍵在於能夠預測
要進行預測,就必須對世界進行模擬,至少對物體功能進行一定程度上的預測
學習物理:物理網絡
具有記憶模塊的增強神經網絡
遞歸神經網絡不能長久地記憶,需要一個額外的記憶模塊
遞歸網絡的記憶時間不長:大腦皮層能維持的記憶時間只有 20 秒
我們需要「海馬體」(一個單獨的記憶模塊)
LSTM [Hochreiter 1997]
記憶網絡 [Weston et 2014] (FAIR),關聯記憶
Stack RNN [Joulin & Mikolov 2014] (FAIR)
神經圖靈機 [Graves 2014]
可微分神經計算機 [Graves 2016]
差分記憶
記憶增強遞歸網絡
實體RNN
保持對世界當前現狀的估計
每個模塊都是一個帶有「記憶」的遞歸網絡
每次輸入都當值記憶單元更新
基於能量的非監督學習,能量函數
塑造能量函數的七大策略
構建機器使低能物質的容量恆定
使數據點能量下降,其餘上升
使數據點能量下降,選定位置能量上升
使梯度最小,數據點周圍曲率最大
訓練動態系統
利用正則化項限制低能量的空間容量
假如 E(Y) = IIY - G(Y)II^2,使 G(Y) 儘量「恆定」
基於能量的非監督學習
對抗訓練:可訓練的對象函數
在圖像識別上的應用
人類的大腦是「預測機器」
我們能夠把機器訓練得能夠預測未來嗎?
在這方面,使用「對抗訓練」取得了一些進展
但是,離成功或者說完善的解決方案,還要十分遙遠的距離
使用對抗網絡進行視頻內容預測實例
編譯來源:
1.https://medium.com/intuitionmachine/predictive-learning-is-the-key-to-deep-learning-acceleration-93e063195fd0#.7ia0cj6ip
2.LeCun NIPS 2016 演講
新智元簡介:人工智慧領域排名第一的社交平臺,專注報導人工智慧領域的前沿資訊、產業分析和技術乾貨
慕編組成員:葉子
產權及免責聲明本文系「MOOC」公號轉載、編輯的文章,編輯後增加的插圖均來自於網際網路,對文中觀點保持中立,對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證,不對文章觀點負責,僅作分享之用,文章版權及插圖屬於原作者。如果分享內容侵犯您的版權或者非授權發布,請及時與我們聯繫,我們會及時內審核處理。了解在線教育,
把握MOOC國際發展前沿,請關注:
微信公號:openonline
公號暱稱:MOOC