要不要先驗?怎麼看混合模型?Marcus和Bengio激辯AI未來

2021-01-10 機器之心Pro

機器之心報導

參與:一鳴、張倩、蛋醬

Gary Marcus 對於當今人工智慧研究的批判終於讓深度學習先驅們坐不住了。聖誕節前夕,Marcus 與圖靈獎獲得者 Yoshua Bengio 進行了一次有關 AI 技術發展方向的現場辯論。

兩個人想要討論的焦點是:「符號處理和因果關係與目前 AI 發展方向之間的關係。」

最近在「風口浪尖上」的 Gary Marcus 是一名成功的科學家、暢銷書作家、企業家,以及 Geometric Intelligence (被優步收購的機器學習初創公司) 的執行長和創始人。作為一名作家,他經常為《紐約客》和《紐約時報》撰稿,並且是四本書的作者。作為紐約大學心理學和神經科學教授,他在人類和動物行為、神經科學、遺傳學和人工智慧等領域發表了大量文章,並經常刊登在 Science 和 Nature 等期刊上。

而在另一邊,Yoshua Bengio 則是最近一次計算機科學最高獎項圖靈獎的獲得者,以及 2020 年的 AAAI 當選 fellow。他目前任蒙特婁大學教授、魁北克人工智慧機構 Mila 的科學主管。Bengio 和 Geoffrey Hinton、Yann LeCun 一直被認為是深度學習先驅。正是他們在三十年以前發展了深度學習概念基礎,從而引領了最近一次 AI 技術的爆發。12 月 21 日,Bengio 和 LeCun 又雙雙入選 2020 AAAI Fellow,這是對他們長期以來堅持深度學習研究和應用的一種肯定。

總體觀察來看,兩方爭論的焦點在於符號處理(symbol manipulation)和因果關係與目前 AI 發展方向的聯繫。Gary Marcus 認為,符號處理對於因果關係至關重要。在人類等高級生物中,人們發現了很多分工不同的大腦區域。期望複製完整的體系結構是非常不現實的。

Yoshua Bengio 等人認為,我們可以在保持深度學習框架的同時加入因果推理,新的人工智慧系統或許可以利用注意力機制,或者通過新的模塊和訓練框架來實現(例如元學習和基於智能體的方式)。

將因果關係引入深度學習會對通用人工智慧帶來切實和持久的貢獻,但是利用單一架構來獲取所有的認知是否現實?

Bengio 和 Marcus 都認為,雙方共識和分歧的表達或許會為人工智慧領域帶來益處。

辯論首先由雙方介紹各自的觀點,然後開始根據提出的問題進行自由辯論,最後還有回答現場和網上提問的環節。

Gary Marcus:我沒說深度學習沒用,但是需要結合符號構建混合系統

由於長期以來對深度學習的批判,Gary Marcus 一直飽受爭議。在論點陳述階段,為了讓大家更好地了解自己的真實立場,Marcus 首先回顧了自己近二十多年對於深度學習的觀點和態度。這些觀點包括:

承認混合模型(符號處理和模式識別都包含在內)的價值;認識到外推(extrapolation)的重要性及純深度學習系統的弱點;認識到組合性(compositionality)的重要性;認識到捕獲和表徵關係的重要性;認識到因果的重要性;認識到記憶的重要性。

接下來,Gary Marcus 澄清了 Bengio 及其他人關於自己一些觀點的誤讀,如「深度學習無用論」。

我從未說過「深度學習無用」

Gary Marcus 澄清的「深度學習無用論」主要是指最近 Bengio 在接受 IEEE 採訪時所提到的內容。Bengio 在採訪中曾經說道,「一些人(如 Gary Marcus)表示「看啊,深度學習沒用。」但事實上,像我這樣的研究者正在做的是擴展深度學習的邊界。」

Gary Marcus 在辯論中澄清,「我從未說過深度學習無用,只是說深度學習不是唯一的選擇」。

他還表示,自己與 Bengio 的觀點分歧其實主要集中在後者早期的(如 2014-2015)的一些觀點,比如:1)過度信任黑箱深度網絡;2)過度依賴大型數據集;3)過度看中淺層的深度學習系統,對其他方法缺乏興趣。

其實,隨著深度學習缺點的逐漸暴露,Bengio 也已經意識到,單純依賴深度學習不可能解決所有問題。

Bengio 在今年的 NeurIPS 大會上做了題為《FROM SYSTEM 1 DEEP LEARNING TO SYSTEM 2 DEEP LEARNING》的報告,指出人的認知系統包含兩個子系統,一個是直覺系統(System1),主要負責快速、無意識、非語言的認知,這是目前深度學習主要做的事情;另一個是邏輯分析系統(System2),是有意識的、帶邏輯、規劃、推理以及可以語言表達的系統,這是未來深度學習需要著重考慮的。

所以,現在雙方爭論的焦點其實已經不是深度學習有沒有用,而是往裡面添加什麼東西來構建一個更智能的混合系統。

深度學習需要加入符號處理

在構建混合系統方面,Gary Marcus 認為,深度學習應該結合符號處理。

符號主義和聯結主義的爭論由來已久。在深度學習的潛力被挖掘之前,符號主義一直佔上風。但隨著深度學習的火熱,人們對聯結主義的追捧似乎也已經過了頭。Gary Marcus 認為,深度學習火了那麼久,缺陷也暴露無遺,是時候把符號處理加進來了。

但讓 Marcus 疑惑的是,Bengio 似乎對符號主義的東西不太感興趣。他甚至在給學生的一封信中寫道:「你提出的是神經符號混合系統,這個系統行不通,幾代研究者都做過嘗試,而且都失敗了。」

對於這種悲觀的態度,Marcus 反駁道,「如果要反對符號處理,那你就需要證明你的系統沒有用到符號」。在他看來,Bengio 並沒有做到這一點。

Marcus 還反駁了 Bengio「人類大腦就是一個神經網絡」的觀點(下文中會提到)。他認為,現在的人工神經網絡過於簡單,如每個神經元只有一個自由度,而且同質化嚴重。

Gary Marcus 認為,「人類大腦就是一個神經網絡」這一觀點淡化了一個假設,即大腦有可能在算法層面是符號的,在實現層面是神經的。對於「符號在生物層面是不可行的」,Marcus 認為這種觀點非常荒謬。他表示,這個問題的焦點不應該在於大腦有沒有用到符號,而是在多大程度上利用了符號。

對於這個假設,Gary Marcus 表示,退一步說,即使大腦本質上是一個神經系統,AI 也不應該將符號排除在外。首先,目前還沒有正式的證據表明符號無用;其次,符號已經在一些領域發揮了作用,比如谷歌的搜尋引擎。谷歌使用的是深度學習+知識圖譜的方式進行搜索,而且已經證明比單獨使用二者的任何一個效果都要好。

Yoshua Bengio:我比較關心怎麼做出 System 2

Bengio 在觀點陳述階段並未花費很多時間正面評價符號主義或 Marcus 的論點,而是具體介紹了深度學習發展中遇到的問題,以及他所認為的一些解決方法。

具體來說,Bengio 更關心的是如何升級深度學習,即 System 2 需要添加哪些東西。

System 2 需要重點關注 OOD,關鍵是注意力和意識

Bengio 認為:

傳統的機器學習都是基於 IID(獨立同分布),但 OOD(out of distribution)才是下一步的重要挑戰;注意力機制和意識先驗都是 System 2 的關鍵要素。

Bengio 在 NeurIPS 的報告中也表達了類似的觀點,唐傑老師對報告進行了解讀。

Bengio 在報告中指出,現實世界中我們感興趣的數據往往不是 IID 的,而是 OOD(即出現次數非常少),所以我們在處理時應該更加關注 OOD,也就需要在機器學習算法中建立新的數據假設。我們需要考慮哪些因素會影響數據分布的變化,以及不同分布的可組合性等方法如何對現在的 IID 和 OOD 進行泛化。而元學習則是可能實現機器學習到 OOD 和模型快速遷移的一個辦法。

而對於構建 System 2 來說,基本的要素包括:注意力和意識。

注意力(Attention)實際在目前的深度學習模型中已經有大量的實現和探討,比如 GAT(圖注意力機制)等;

意識最關鍵的是定義到怎樣的邊界。Bengio 提到意識先驗可以使用稀疏因子圖模型來實現。稀疏因子圖可以用來學習變量之間的因果關係,從而構造變量之間的因果關係。

基於規則的傳統符號處理有很多問題

對於 Gary Marcus 提到的在下一代深度學習系統中加入符號主義,Bengio 表示,傳統的基於規則的符號處理 AI 存在很多問題,包括:

需要高效、協調的大規模學習;和 System 1 一樣需要語義落地(semantic grounding),還需要感知動作循環(perception-action loop);需要用於泛化的分布式表徵;像 System 1 一樣需要高效搜索;需要處理不確定性

同時,Bengio 指出,他們要創建的下一代深度學習系統絕不是簡單地將好的老式人工智慧(Good Old-Fashioned Artificial Intelligence)與深度網絡相結合。原因在於:

System2 和 System1 一樣需要學習;高度抽象的概念需要「落地」,通過概率分布表示來實現泛化性;系統需要表示出不確定性;暴力搜索算法並不能擴展,而人類似乎是使用潛意識(System 1)處理並引導搜索,包括推理。因此 System1 和 System2 應當是緊密結合的;我們的大腦都是神經網絡;

這些論點無疑反駁了 Marcus 對於在人工智慧系統中引入符號計算的觀點。之後,雙方根據現場觀眾和在線留言提出的問題進行了解答。包括如何在深度神經網絡中引入先驗,應當引入什麼樣的先驗知識。所謂的「人工智慧的潛意識」指的是什麼。最終,辯論以友好但誰也沒說服誰的的方式結束。

輿論評價

對於這次辯論,輿論普遍認為:雙方普遍軟化了彼此的立場,從而淡化了爭論中的火藥味。然而,關於未來人工智慧發展的路線和理論趨勢,誰也沒有說服誰,更遑論得出一個令人信服的結果了。

Reddit 網友:立場軟化、難以信服

Reddit 上的網友對本次辯論的評價說:

「雙方並沒有真正在辯論,甚至沒有衝突。他們都沒有站在一個堅定的立場上。在談到細節上時,雙方都以一個安全的立場結束,去同意對方的一些觀點。」

另一位「Bengio」評論說:

「本次辯論沒有贏家,因為雙方都有令人信服的論點。一方面,Bengio 對於人類大腦從生物學處理的噪聲頂端意識到符號推理的觀點是正確的。而另一方面,Marcus 認為在可學習的智能體中部署硬編碼的符號算法可以提升泛化性和樣本複雜度。這是到達人類級別人工智慧的正確路徑。

時間會給我們答案。」

ZDNet:對術語有分歧,似乎在各說各話

科技媒體 ZDNet 也對本次辯論進行了報導,ZDNet 認為雙方在術語上有一些理解的分歧。各方從自己的表述中出發提出論點,而某些表述在對方看來有著不同的理解。

以符號為例,Marcus 在辯論中認為,AlphaZero 等類似的 AI 使用的就是符號系統。因為其採用的是蒙特卡洛樹搜索,「對於樹的追蹤和搜索難道不是符號嗎?」而 Bengio 則認為這不是符號,「符號必須能夠區分概念。」

同樣在先驗問題上出現了用詞的分歧問題。Marcus 批判了 Bengio 想要讓神經網絡拋棄先驗的想法,而 Bengio 則辯護說,自己只是想讓先驗更少一點,最好是元先驗(meta-prior),對此 Marcus 認為這和自己希望給 AI 加入先驗沒什麼不同,只是多少的區別。

當然,Marcus 也改變了一些觀點。例如,他談到說不能將神經網絡和人腦的神經系統類比,因為大腦神經元之間有很多可以被塑造的「軟連接」。Bengio 很快駁斥說,神經網絡中的門「Gate」控制就是這樣一種軟性的連接。Marcus 隨即表示同意,終結了這個問題的討論。

ZDNet 文章總結說,本次辯論的雙方都是從各自的立場出發,介紹了自己的一些想法。Marcus 談到的是人工智慧應當是什麼樣子的,並以人類的認知方式為例,認為人工智慧應當效仿人類的認知方式達到真正的智能。而 Bengio 則更多從實際出發,介紹現有的實驗和工作,講明以我們現在的技術,如何才能讓當前的 AI 系統克服缺點。

總而言之,本次辯論無疑對符號主義和聯結主義之間的爭論進行了一次系統性的梳理和總結,更像是一次意見的交換。儘管大佬們的爭論並沒有達成最終的共識,但是我們可以了解到:人工智慧並非只有深度學習一家,對於達成類人人工智慧的路徑也可能極為不同。深度學習並非最終道路,而先驅們已然孜孜探索。

以下是完整版視頻:

辯論從1小時40分鐘左右開始,請拖行進度條觀看。

官方視頻連結:https://www.facebook.com/MontrealAI/videos/498403850881660/

參考連結:https://www.jiqizhixin.com/articles/2019-12-16-4?from=synced&keyword=oodhttps://www.zdnet.com/article/devils-in-the-details-in-bengio-marcus-ai-debate/

相關焦點

  • 意識機器人即將來到,AI即將喚醒
    最近圖靈得獎者Bengio宣稱,AI該覺醒了,人工智慧將跨越無意識,進入全意識階段,也就是人工智慧將同人類一樣具有完全的意識和智能。到目前國際上還沒有人這樣明確第宣稱AI的覺醒和復活。他強調在目前的深度機器學習中要著重引入人的注意力機制。
  • 先驗概率是怎麼來的
    先驗概率是怎麼來的?我們在前文中,一直強調貝葉斯公式中先驗概率的重要性。
  • 騰訊AI Lab西雅圖實驗室負責人俞棟:語音識別領域的現狀與進展
    俞棟:去年底在 NIPS 會議上南大的周志華教授還和我開玩笑說,「語音識別已經解決了,你不要做了。」相信很多人有類似的感覺。在 90 年代初期,伯克利大學的研究人員就開始用多層感知機加上隱馬爾可夫模型進行語音識別,由於模型由一個傳統的生成模型 HMM 和一個比較時髦的判別式模型神經網絡組成,他們稱其為混合模型(Hybrid Model)。
  • 三扇門遊戲與先驗概率、後驗概率
    如果你是A,你怎麼看?他說的對嗎?在講條件概率的時候課本上提到了先驗概率與後驗概率,對於這兩個概念很多同學不理解,下面我來重點剖析一下。問題來了,先驗概率和後驗概率哪個更大呢?還是以此題為例:對以往的數據分析結果表明,當機器調整良好時,產品合格率為98%,而機器發生故障時產品合格率為55%,每天早上機器開動時,機器調整良好的概率為95%,已知某日早上第一件產品是合格品,試求機器調整得好的概率?
  • 如何使用AI混合工具繪製絢麗花朵?
    ai中的混合工具使用的方法有很多,下面來教大家如何繪製絢麗的花朵,原理是通過替換混合軸的原理,一起來看看吧。1.首先我們繪製出兩個橢圓,顏色是紅色和黃色。2.將它們全部框選住,點擊工具欄中的混合按鈕。3.雙擊混合按鈕彈出混合選項對話框。
  • 原標題:崔永元與復旦教授激辯轉基因 小崔完勝!
    摘要:近日,崔永元與復旦教授盧大儒就食品基因問題展開激辯。」  提起崔永元,從央視名嘴到轉基因鬥士,崔永元一直是以敢做敢言,立場分明的形象出現在公眾眼前。原標題:崔永元與復旦教授激辯轉基因小崔完勝! 原標題:崔永元與復旦教授激辯轉基因 小崔完勝!
  • 萬字長文:2020智源大會總結-多角度看AI的未來
    因果理論的核心,就是do calculus, 它提到我們的模型如果要包含因果,就要能夠模擬由行為產生的結果的不同, 這和我們之前物理的mechanic model 是相通的。你有現象模型可以預測數據,但是這是觀測數據的聯繫,而非基於某個行為產生一定變化的因果模型。
  • 論文推薦| 孟令奎:結合先驗概率估計的GF-3影像水體概率估計方法
    確定後向散射係數分布假設後,估計模型中的未知參數即可確定其統計特徵,給定的σ0即可計算其屬於水體的概率值p(W|σ0)。從上述水體概率估計的理論來看,本文方法的核心是參數估計,包括水體分布先驗概率Pprior和後向散射係數分布參數(μW, sW, μW, sW)。本文從先驗概率估計方法上著手改進。
  • 紐約大學Gary Marcus等撰文:人類思維對於AI的11個啟示
    如果我們知道 Laura 是 Charles 和 Caroline 的女兒,也知道 Mary 是他們的女兒,那麼我們可以推斷出 Mary 和 Laura 是姐妹。 認知模型和常識的表示形式是由抽象關係構建而成的,並以複雜的結構組合。
  • Xilinx、Spline.AI、AWS 推出 X 射線分型深度學習模型和參考設計
    開源的自適應深度學習模型,助力醫療設備製造商和醫療服務提供商快速開發經過訓練的模型,面向臨床和放射醫學應用通過採用這樣的開源設計,醫療診斷設備、臨床設備製造商以及醫療服務提供商能夠快速地為行動裝置、可攜式設備或護理點邊緣設備中的大量臨床應用和放射醫學應用開發和部署經過訓練的模型,並提供向雲端擴展的選項。
  • 米塞斯: 先驗知識
    不能因為先驗知識是套套邏輯的,就廢除其認知意義。按照定義,一個套套邏輯一定是對先前已經說過的某種東西的同義反覆,即重新表述。如果我們把歐幾裡得幾何學看作為一個分層次的套套邏輯體系,那麼,我們就可以說:畢達哥拉斯定理是套套邏輯的,因為它表達的只是已經隱含在直角三角形定義中的東西。
  • 如何理解康德的「先驗哲學」?
    它是經驗性知識後面得出來的知識,即先驗的知識。就是說,康德這個先驗哲學,是不摻雜任何經驗性的知識的,他是對人類心性的認識能力做一個純粹的考察,他說的那個知識,是看不見摸不著的。我們只有在經驗性的知識上反轉來思考,才能體會到康德這個先驗的知識。所謂的「先驗」知識,就是在經驗之前的知識。然而,一切知識,都從經驗開始,沒有經驗,何來知識?這個先驗知識,是什麼樣的知識?
  • r語言 動態面板模型 - CSDN
    模型選擇一般有三種形式 (1)無個體影響的不變係數模型(混合估計模型):ai=aj=a,bi=bj=b 即模型在橫截面上無個體影響、無結構變化,可將模型簡單地視為是橫截面數據堆積的模型。(2)變截距模型(固定效用模型):ai≠aj,bi=bj=b 即模型在橫截面上存在個體影響,不存在結構性的變化,即解釋變量的結構參數在不同橫截面上是相同的,不同的只是截距項,個體影響可以用截距項ai (i=1,2,…,N)的差別來說明,故通常把它稱為變截距模型。
  • ICRA 2020最佳論文授予加州理工和清華:首個自適應外骨骼步態AI算法
    以往,機械外骨骼一直被美國軍隊視為提升士兵作戰能力的工具,但加州理工和清華大學的這項研究在未來或許可為數千萬殘障人士帶來幫助。該研究提出了一種叫做 COSPAR 的算法,它可以將合作學習應用於下肢外骨骼操作時對人類偏好的適應,並在模擬和真人實驗中進行了測試。
  • 清華、北大教授同臺激辯:腦科學是否真的能啟發AI?
    認知有個「格拉斯法則 」,看世界時畫兩條線,兩條線在相交;但從數學的角度來說,可以認為兩個東西touch在一點。但是為什麼現在是這兩個相交?他們在認知上總結了另一個法則,在外界的時候會有些先驗知識來幫助我們從數學上降低維數,也就是說,人腦有先驗知識幫助我們只認識我們想認識的世界,而不是克服這個NP問題。
  • 谷歌AI模型在即時預報降水的使用
    據外媒報導,幾周前,谷歌人工智慧(AI)使用了一個機器學習模型來改進對乳腺癌的篩查工作。 據了解,傳統方法需要結合對大氣如何工作的先驗知識,而這批研究人員使用的「物理自由」法卻將天氣預報問題變成了一個單獨的從圖像到圖像的轉換問題。因此,由團隊訓練的 CNN--U-Net--只需要對提供給它的訓練例子估計大氣物理。 為了訓練U-Net,團隊使用了多光譜衛星圖像。從 2017 年到 2019 年在美國大陸收集的數據被用於最初的訓練。
  • 谷歌發布TensorFlow Lattice:得益於先驗知識,提升模型泛化能力
    另外,查找表中的相鄰值被約束為在輸入空間的給定方向上增長,因此模型的輸出值也是在這些方向上增長。重要的是,因為是在查找表值之間進行插入,所以點陣模型很平滑,預測也是有界的,這有助於避免測試階段出現有較大偏差的雜散預測。
  • 概率圖模型 vs. 邏輯學
    模式識別》之後,CMU博士、MIT博士後及vision.ai聯合創始人Tomasz Malisiewicz這一次帶領我們回顧50年來人工智慧領域三大範式(邏輯學、概率方法和深度學習)的演變歷程。通過本文我們能夠更深入地理解人工智慧和深度學習的現狀與未來。
  • Gary Marcus:因果熵理論的荒誕和認知科學帶給AI的11個啟示|文末贈書
    本章內容為《從認知科學中獲得的 11 個啟示》,作者試圖從認知科學出發,希望為AI未來具備人類智慧的寬度和魯棒性帶來啟發。文章較長,但值得你一讀。現在的機器學習界偏向於利用儘可能少的內部結構形成單一同質機制的端到端模型。英偉達 2016 年推出的駕駛模型就是一個例子,該模式摒棄了感知、預測和決策等經典的模塊劃分,而是使用了單一的、相對統一的神經網絡,避開了通常情況下的內部工作分工,偏重於學習在輸入(像素)和一組輸出(轉向和加速的指令)之間的更為直接的關聯。
  • ai文件用什麼軟體打開_ai文件怎麼打開
    打開APP ai文件用什麼軟體打開_ai文件怎麼打開 胡哥 發表於 2012-10-16 11:31:57 後輟為ai的文件是illustrator軟體(在廣告、印刷包裝方面使用的軟體)製作的矢量圖文件,而矢量圖的優點是如何放大圖像都不會產生馬塞克現象,即不會虛。