AI領域的蝙蝠俠大戰超人:LeCun與Manning如何看待神經網絡中的結構...

2020-12-22 雷鋒網

雷鋒網 AI 科技評論按:近日,深度學習三駕馬車之一的 Yann LeCun 教授與史丹福大學 NLP 掌門人 Christopher Manning 教授共同出席了斯坦福 AI 實驗室所舉辦的 AI 沙龍,一同討論了關於「什麼是我們應該加入到深度學習系統中的先驗知識」的話題。儘管兩位教授對此話題有著不同的觀點,但是大牛之間思想的碰撞總能帶給大家很多啟發。

沙龍中所討論的主題是目前 AI 研究中很重要的一個問題:神經網絡中的結構設計,以及這些結構是如何與某些假設和歸納性先驗知識相對應的。事實上,去年就有研究者將「語言結構的回歸」作為 2017 年四大 NLP 深度學習研究趨勢之一。

Manning 教授提倡將更多的語言結構融入到深度學習系統中。而 LeCun 則認為簡單而強大神經網絡結構就能夠執行複雜的任務,而不需要大量針對特定任務的特徵工程方法。出於這個原因,兩個人之間的學術理念有很大的分歧。對此,一個 Twitter 上的評論認為,他們兩個就是 AI 領域中的蝙蝠俠大戰超人

LeCun:「他是說你是超人還是我是超人?」

然而,LeCun 和 Manning 之間互相認同的地方可能超出大家的預期。LeCun 最著名的貢獻(卷積神經網絡)是完全基於先驗知識的:圖像處理系統應該具有平移不變性。這個基本假設也體現在了卷積神經網絡的結構設計中(權值共享)。而對於 Manning 而言,他曾經公開表示,深度學習的復興對於 NLP 來說是一件好事。

儘管兩位教授在這次討論中得到了很多共識,但是同樣也存在很多分歧。完整內容可以觀看討論視頻:https://youtu.be/fKk9KhGRBdI 。下面雷鋒網(公眾號:雷鋒網) AI 科技評論編譯了整個討論中出現的主要話題。

結構:必要的善,還是必要的惡

在 Manning 和 LeCun 的開場發言中,兩個人就確立了主要分歧。

Manning 認為結構是「必要的善」(necessary good),他提出我們應該對網絡結構設計持積極的態度。相比於沒有結構設計的系統,一個精心設計的系統能夠從更少的數據中學到更多的知識,並且能夠在更高的抽象層次上學習。

相反,LeCun 將結構描述為「必要的惡」(necessary evil),他警告說:使用結構需要我們做出某些假設,而這些假設總會在某些數據上是錯誤的,而且可能在不久的將來過時。同時還舉例說,ConvNet 可能在 10 年之內就會過時。

儘管存在分歧,但是我們應該注意到,LeCun 和 Manning 至少同意結構是「必要的」,儘管他們對這種必要性持相反的態度。

Manning 認為加入更多結構設計是正確的,而且有是有道理的,比如,語言本質上就是遞歸的,因此 NLP 系統的結構也應該如此!比如,遞歸神經網絡(Recursive Neural Network,也叫做 Tree-RNN)在 NLP 中取得了成功,它就提出了遞歸語義合成性作為先驗知識。然而,Manning 也承認,在實踐中很難做出正確的結構假設,同時這些假設也不總是能轉化為性能提升。

LeCun 對結構設計的理想化程度則低得多。在討論過程中,他多次提到各種類型的結構(比如,殘差連接,卷積等),認為它們僅僅是為了網絡能夠優化到足夠工作的程度所需的「元級基礎」(meta-level substrate)。他認為,一個沒有任何結構限制的類似網絡結構也可以很好的工作,只是可能需要更長時間的訓練。

當前 AI 的限制因素

LeCun 和 Manning 都注意到了目前 AI 研究在整個 AI 發展的歷史軌跡中所處的位置。在過去的幾十年裡,基於眾多先驗知識的方法已經過時,目前的深度學習研究更傾向於將嚴格監督端到端學習視為主導範式(由大數據和豐富的計算資源所支持)。

LeCun 和 Manning 都一再強調這種範式的局限性,例如在記憶,計劃,遷移學習,世界知識和多步推理方面都存在問題。同時他們都對目前通過結構設計以解決這些問題的方法表達了積極態度。

然而,Manning 更進一步,斷言現代深度學習的大數據大計算範式實際上已經「顛覆了計算語言學領域」並且「偏離了軌道」。他認為,如果你能夠得到大量的數據和計算資源,你就能夠通過構建簡單但效率低下的系統獲得成功,而這個系統只需最表層的「最近鄰學習」。這阻礙了研究人員建立良好的學習系統:使用較少的數據,在較高抽象層次學習表示。他說這對整個領域都是不利的。而解決這個問題的答案就是,加入適當的結構,使系統能夠在正確的抽象層次上有效的學習概念。

儘管兩位教授有分歧,但是並不確定 LeCun 究竟是如何認為 Manning 聲稱的深度學習在某種程度上「顛覆了這個領域」的。然而,LeCun 確實同意深度學習缺少一些基本的原理(想了解更多,請參閱他的CVPR 2015的演講,「深度學習有什麼問題?」)。

無監督學習的重要性

儘管討論涉及了當今人工智慧技術的許多核心局限性,但其中有一個特別迫切的且特殊的挑戰,也就是無監督學習,或者至少是少監督學習。

兩位教授都舉了一些例子:人類能夠進行小樣本學習(few-shot learning),人類能夠通過觀察了解世界,而無須任務或者外部獎勵。並且人類還可以在沒有明確監督的情況下學習具有離散結構的抽象概念(例如對象分類)。

他們認為,這些無監督學習能力對 AI 的進步至關重要。但是,在結構應該在無監督學習革命中扮演什麼角色的問題上,LeCun 和 Manning 產生了分歧。

Manning 認為加強結構是解鎖無監督學習的關鍵。他說,如果我們為機器提供適當的結構工具,以在適當的抽象層級上學習,那麼他們就能夠在較少的監督下學習。

相反,LeCun 認為,如果能夠進行無監督學習,那就不需要使用結構。比如,LeCun 舉例說人類的大腦並沒有任何先天的卷積結構,大腦並不需要這種結構,因為作為一個高效的無監督學習器,即使沒有卷積權值共享的約束,大腦同樣可以學習大量相同的低級圖像特徵(如方向邊緣檢測器)作為 ConvNet。他總結說,對於我們目前的神經網絡架構使用更多的結構可能是徒勞的,因為一旦我們開發出了更好的無監督學習方法,那些結構設計就會過時。

兩者觀點之間的差異很微妙,也許就是蛋生雞還是雞生蛋的區別。Manning 認為結構是實現無監督學習的關鍵,而 LeCun 則將無監督學習當作學習結構的一個長期目標。

將結構作為硬連接的先驗(hard-wired prior),還是從環境中學習

在討論過程中,很明顯至少有兩種類型的「結構」:作為先驗嵌入到模型中結構(例如,ConvNet 中的卷積假設,或者遞歸神經網絡中的遞歸假設),和通過機器動態學習和計算出的結構(比如,通過膠囊網絡中動態路由計算出的結構,或注意力機制計算的關注區域)。兩者之間沒有一個簡單的區分方法,Manning 和 LeCun 在 ConvNet 層級結構應該屬於哪種結構的問題上持有不同的意見。

LeCun 一再反對硬連接先驗(hard-wired prior),它認為所有結構都應該從環境中學習。雖然 Manning 同意應該從環境中學習到很多結構,但他也認為我們(AI 系統的設計者)應該在提供這種結構方面起到一定的作用。雖然我們不應該回到人類設計複雜的系統(如 Chomskyan 文法)的時代,但他說,我們應該為機器提供正確的「基礎和腳手架」以更有效地學習。

使用獎勵作為先驗

LeCun 和 Manning 認為理想情況下,獎勵應該是天生的,也就是說,正確地理解世界就是它自己的獎勵。比如,人類不斷的構建自己的世界模型,並根據外部觀察對其進行修改。

相比之下,今天大多數機器學習系統從外部提供的與特定任務密切相關的獎勵中學習。Manning 認為目前這些目標函數定義的太過膚淺,他指出:如果將目標函數定義在如此低的水平,我們將永遠不會建立能夠學習抽象概念的 AI 系統。LeCun 認為獎勵需要是本質的,豐富的,而不是從特定任務的獎勵中學習,AI 系統應該通過不斷預測「一切事物」來學習,而不需要訓練標籤或者任務定義。

關於語言

在討論的最後幾分鐘裡,LeCun 可能有些挑釁,他認為語言「不那麼複雜」,也不是實現通用智能的關鍵。為了支持他這一觀點,他說猩猩幾乎像人類一樣聰明,但他們並沒有語言。Manning 則捍衛語言的重要性作為回應,他認為:語言對通用智能至關重要,因為語言是將人智能共享並轉化為社會智能的渠道。

在總長一個小時的對話裡,兩人還討論了許多其它的論文和學術思想,更多內容可以參見英文原博客 http://www.abigailsee.com/2018/02/21/deep-learning-structure-and-innate-priors.html ,以及現場視頻 https://youtu.be/fKk9KhGRBdI 。

via abigailsee,雷鋒網 AI 科技評論編譯

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 《蝙蝠俠大戰超人》蝙蝠俠憑什麼戰超人?
    《蝙蝠俠大戰超人:正義黎明》導演施耐德、「蝙蝠俠」阿弗萊克和「超人」卡維爾解析蝙蝠俠為什麼大戰超人+蝙蝠俠憑什麼大戰超人  提示:有《蝙蝠俠大戰超人:正義黎明》一點點的劇透內容  Heaven/編譯  《蝙蝠俠大戰超人:正義黎明》(Batman v Superman: Dawn of Justice)是明年最受期待的電影之一,大規模的官方宣傳也一波一波來了。
  • 《蝙蝠俠大戰超人》公布"超人"造型照
    時光網訊 今日,華納兄弟公司首次公布了《蝙蝠俠大戰超人》中「超人」的新造型,由亨利·卡維爾飾演的「超人」克拉克·肯特,掛著標誌性的紅鬥篷站在夜雨中,身軀極為強壯,但表情卻深沉凝重。畫面遠處的背景是夜色中煙囪林立的哥譚市,似乎預示著「超人」與哥譚名人韋恩少爺將有一場糾葛甚至是爭鬥,十分符合「蝙蝠俠」電影一貫的黑暗風格。
  • 蝙蝠俠大戰超人《超能復仇者》觀影必備攻略
    導 讀 《蝙蝠俠大戰超人:正義黎明》已正式上映,兩位來自DC(Detective Comics,與漫威漫畫公司齊名的美國漫畫巨頭
  • 《蝙蝠俠大戰超人》:正義黎明之後不一定是光明!
    《蝙蝠俠大戰超人:正義黎明》影片在大都會之戰18個月後,在那場戰鬥中許多建築和市民慘遭波及。兩個超級英雄就在盧瑟的小陰謀下爽快的幹了一架,而這兩大高手幹起架來造成成的破壞效果也堪比爆炸貝了,神奇女俠的瀟灑登場和片尾疑似超人復活的鏡頭也讓人對續集有了些許的期待。
  • "蝙蝠俠大戰超人"反派細節 艾森伯格飾演萊克斯·盧瑟變身金髮總裁...
    時光網訊 扎克·施奈德為DC娛樂和華納兄弟打造的《蝙蝠俠大戰超人:正義黎明》正在熱拍,除了出現在影片片名中的兩位超級英雄,還有一個角色的登場也很令人期待,那便是美國男星傑西·艾森伯格所飾演的超人死敵萊克斯·盧瑟(Lex Luthor)。
  • 《蝙蝠俠大戰超人》曝新劇照 蝙蝠俠摘面具 蝙蝠車哥譚街頭飛馳...
    DC超級英雄年度大作《蝙蝠俠大戰超人:正義黎明》今日曝光了多張劇照、概念圖和片場照。最新照片雖然沒有提供更多有趣的信息,但是我們還是可以看到蝙蝠俠沒有帶面具時的樣子,神奇女俠戰鬥時的英姿以及飛馳在哥譚街頭的蝙蝠車。  影片故事發生在《超人:鋼鐵之軀》中大都會之戰之後。
  • •貝爾(原蝙蝠俠)表示《蝙蝠俠大戰超人》「看上去棒極了」!
    新東方網>英語>英語學習>娛樂英語>影視英語>影視資訊>正文克裡斯蒂安•貝爾(原蝙蝠俠)表示《蝙蝠俠大戰超人》「看上去棒極了」!
  • 傳:「馬王」傑森·莫瑪加盟《蝙蝠俠大戰超人》 出演潛水俠!
    北京時間6月16日消息,在《冰與火之歌:權力的遊戲》中扮演「馬王」的傑森·莫瑪(jason momoa),將加盟《蝙蝠俠大戰超人:正義黎明》,出演另一個超級英雄「潛水俠」。據悉,這個角色會先在《蝙蝠俠大戰超人》裡亮相,但在《正義聯盟》中會有更多戲份。
  • 《蝙蝠俠大戰超人:正義黎明》人間之神大戰黑暗騎士
    《蝙蝠俠大戰超人:正義黎明》中的超人可以說是完美展現了人間之神的姿態,他並沒有把自己當成人類,而是當作一個拯救人類的神。那個人就是萊克斯·盧瑟,據電影中介紹,盧瑟的父親喜歡家暴,而且還是希特勒的崇拜者,所以盧瑟從小就憎恨著父親,他認為世間上不再需要暴君了。可超人卻出現了,他記恨著超人,雖然他掌握了世間的大部分知識,但超人的絕對力量可以壓倒一切,所以他決定幹掉超人,可自己卻不動手。
  • DC新片《蝙蝠俠:緘默》預告 老爺貓女合體大戰超人
    華納根據同名漫畫改編的大電影《蝙蝠俠:緘默》今日首曝預告片,布魯斯韋恩將與他的童年好友託馬斯艾略特展開真假大戰,貓女將與老爺纏綿悱惻共同對付超人和毒藤(後者魅惑了超人),還有阿爾弗雷德、超人、貓女、蝙蝠女、夜翼、達米安韋恩等大量英雄助陣,以及貝恩、希瓦夫人、、稻草人、謎語人、毒藤等大量反派登場
  • 《蝙蝠俠大戰超人:正義黎明》影評:超級英雄電影的出路何在
    這便是在中、美、日三國同時上映的《蝙蝠俠大戰超人:正義黎明》(以下簡稱《蝙超大戰》),相信喜歡超級英雄電影並鍾愛蝙蝠俠和超人至深的觀眾一定會熱血沸騰。  儘管現在漫威陣營的美國隊長、綠巨人、鋼鐵俠和雷神等超級英雄在全球聲名鵲起,但是DC陣營的蝙蝠俠和超人,實力也是不容小覷的。
  • 蝙蝠俠與超人為什麼要打一架
    至於是什麼原因能讓蝙蝠俠與超人兩大人氣角色互毆,這其中的原因不僅僅可以從《蝙蝠俠大戰超人:正義黎明》中可以找到,更多的還是要從漫畫發展以及DC電影宇宙建立的初衷上尋找答案。憤怒的超人對蝙蝠俠抱以老拳,最終結果導致韋恩企業與盧瑟工業合作。這段內容在電影《蝙蝠俠大戰超人》中可以找到影子。蝙蝠俠被盧瑟蠱惑被反派腦控大概是最粗暴的對戰方式,一方被壞蛋控制,與昔日隊友展開大戰。而且很少有手下留情這一說,被腦控的一方幾乎都是痛下死手,導致過程和結果非常慘烈。
  • 廢除的初版《蝙蝠俠大戰超人》開場就是阿福的葬禮!
    根據IGN的最新報導,如果大家覺得2016年由「扎導」扎克·施耐德指導的《蝙蝠俠大戰超人》是一部十分黑暗的電影的話,那麼這部影片於2000年編寫的原案,可能是「大家所見過的最黑暗的事物」。
  • LeCun:賦予機器 「常識」,重新設計神經網絡將是AI 研究重點
    今天,在2019國際固態電路研討會(ISSCC)的主旨演講中,Facebook首席AI科學家Yann LeCun闡述了深度學習研究的進展將如何影響未來的硬體架構。動態網絡、關聯存儲器結構以及稀疏激活等新的體系結構概念將影響未來需求的硬體體系結構類型。「這可能要求我們重新發明電路中運算的方式,」LeCun說。今天的計算機晶片通常沒有針對深度學習進行優化,即使使用不太精確的計算,深度學習也可以有效。
  • 蝙蝠俠完虐超人?太腹黑了
    視頻:《蝙蝠俠大戰超人》劇情曝光 神人11分鐘理清故事脈絡,時長約11分5秒騰訊娛樂專稿 (文/馬田 編輯/樟木)本月25日,萬眾期待的DC漫改大作—《蝙蝠俠大戰超人其實,由超人,蝙蝠俠,神奇女俠三巨頭成立的正義聯盟已經有半個多世紀的歷史了,而蝙蝠俠和超人也因為種種原因,在漫畫中相愛相殺,撕的天昏地暗。怎麼打?打過嗎?打得過嗎?那就讓我們從漫畫原著入手,從將近80年的漫畫連載中選出13場最知名的蝙超對決,看看蝙蝠俠是如何化不可能為可能,用智慧,頭腦和外掛完虐超人的。
  • 同樣是內戰,DC《蝙蝠俠大戰超人》為何不如漫威的《美隊3》好看
    漫威電影宇宙近十年來的表現確實非常亮眼,作為老對手的DC電影看著漫威一步步的壯大心裡怎麼可能會不著急,只是漫威已經鋪墊了十年,DC想要靠幾部電影就想「彎道超車」確實急於求成了,所以同樣是「自己人打自己人」的《美國隊長3:內戰》和《蝙蝠俠大戰超人:正義黎明》口碑自然就不一樣,說白了,還是DC太急了。
  • 《蝙蝠俠大戰超人》特效揭秘視頻 超炫綠幕合成技術!_遊俠網 Ali...
    DC超級英雄大片《蝙蝠俠大戰超人:正義黎明》遺憾落選了今年的奧斯卡最佳特效的提名,對於非常注重視覺效果的導演扎克·施奈德來說,確實相當可惜。日前,外媒曝出了一支《蝙超》特效視頻,揭示導演扎克·施奈德是怎樣與知名特效公司ScanlineVFX聯手打造特效的。
  • 超人與蝙蝠俠在各本漫畫裡的對戰勝負情況如何?
    在DC漫畫公司裡的黑暗騎士已經16次對戰鋼鐵之軀超人,而每一次都取得勝利。就在本周,觀眾們終於可以看到《蝙蝠俠大戰超人:正義黎明》裡超人反超蝙蝠俠了!這將是首度兩位DC漫畫裡的老牌英雄人物一同出現在大熒幕上,而他們即將摒棄以往好搭檔的形象,展開長時間的鬥爭。
  • 《蝙蝠俠大戰超人》再爆新劇照 超級大反派或將登場
    新東方網>英語>英語學習>娛樂英語>影視英語>影視資訊>正文《蝙蝠俠大戰超人》再爆新劇照 超級大反派或將登場 2016-01-28 09:51 來源:人人美劇 作者:
  • 有完美體質的超人為何打不過蝙蝠俠?蝙蝠俠有錢,超人有兩大弱點
    DC漫畫旗下兩大超人氣英雄超人和蝙蝠俠一直是DC迷津津樂道的人物,自從他們打過架後大家就討論蝙蝠俠厲害還是超人厲害? 從體質來看,超人完爆蝙蝠俠,人家是外星人,擁有超人類的各種數據,速度、鋼筋鐵骨、刀槍不入、眼睛發出雷射、飛行、能在太空自由飛行各種數據都遠遠超過蝙蝠俠。