紐約大學Gary Marcus等撰文:人類思維對於AI的11個啟示

2021-01-14 騰訊網

作者:Gary Marcus(紐約大學名譽教授),Ernest Davis(紐約大學計算機科學教授)

原文:Insights for AI from the Human Mind,Communications of the ACM

譯者:朱演瑞

馬文 明斯基在《心智社會》(The Society of Mind)中寫道:「什麼訣竅可以讓人類變得更加智慧?訣竅就是 —— 沒有訣竅。智慧的力量來源於人類的複雜性,而不是來源於一個單一的完美的原理。」

近年來,人工智慧在圍棋、撲克領域擊敗了世界冠軍,並在機器翻譯、對象分類和語音識別等領域取得了非凡的進步。但是,大多數 AI 系統的關注點都非常局限。AlphaGo 並不知道圍棋是一個在棋盤上放石頭的遊戲,它甚至不知道什麼是 「石頭」,什麼是 「棋盤」。如果圍棋的棋盤並不是正方形而是矩形的,它又需要一套完全不一樣的算法。

為了能讓 AI 理解開放文本或控制家用機器人,我們還需要更進一步的探索。讓它學習人類的思維會是一個很好的開端,因為在理解能力和思考能力上,人類思維遠超機器。

為此,本文提供了 11 條來自認知科學(心理學,語言學和哲學)的線索。

1、沒有萬能藥

從行為主義到貝葉斯推理再到深度學習,我們總是提出簡單的理論來解釋人類的智慧。但是,Chaz Firestone 和 Brian J.Scholl 卻說,「人的思維並不僅僅以一種方式運作,因為它從來不是一個單一的個體。思維由不同的部分組成,每個部分有其獨特的運作方式:比如,感知色彩和做計劃的思維截然不同,也和理解文章、調整形體、記憶事件、體會情感等思維大相逕庭。」

人類大腦極其複雜,擁有 150 多個腦區、860 億左右個神經元,神經元又有數百個不同的類型、萬億個神經突觸,每個突觸中都有大量不同的蛋白質。

真正靈活、智能的系統會像大腦一樣,充滿著複雜性,任何把智能體簡化為單一原理的理論都註定失敗。

2、豐富的內部表徵

認知心理學重視內部表徵(Internal Representations),比如信念、欲望和目標等,經典的 AI 系統也是如此。假如 AI 要表示 「甘迺迪總統 1963 年著名的柏林訪問」 這一語義,它會添加一系列表徵事實,例如從屬關係(柏林,德國)、訪問關係(甘迺迪,柏林,1963 年 6 月)。通過積累這樣的表徵事實,AI 增加自己的知識和經驗,而它的推論就建立在這個基礎上。因此它的推論是瑣碎的,並不是整體的。

當前,深度學習技術正嘗試規避這種方式,轉而用一系列向量以模糊的方式捕捉事件,並不直接精確地表示語義,比如從屬關係(柏林,德國)、訪問關係(甘迺迪,柏林,1963 年 6 月)。深度學習的重點在抽象推理,因為它從一開始就不是為了表示精確事實知識。可一旦事實模糊,就很難正確地推理。被大肆宣傳的 GPT-3 系統就很能說明這個問題,與之相關的系統 BERT 無法可靠地回答諸如 「如果你在桌子上放兩個獎盃,再放一個,那麼你有多少個獎盃?」 這樣的問題。

3、抽象和概括

大部分我們的所知都是抽象的。比如,「甲是乙的妹妹」 這一關係能代表很多人,比如 Malia 是 Sasha 的妹妹,Anne 公主是 Charles 王子的妹妹,等等。雖然我們不知道世界上所有具體的兄妹關係,但我們知道 「妹妹」 的含義,我們能根據具體情況辨別。如果兩個人有共同的父母,就能推斷他們是兄弟姐妹。如果我們知道 Laura 是 Charles 和 Caroline 的女兒,也知道 Mary 是他們的女兒,那麼我們可以推斷出 Mary 和 Laura 是姐妹。

認知模型和常識的表示形式是由抽象關係構建而成的,並以複雜的結構組合。我們幾乎可以抽象出任何事物:時間(「10:35 PM」)、空間(「北極」)、特殊事件(「亞伯拉罕 林肯遇刺」)、社會政治組織(「美國國務院」 )和理論構造(「語法」),並在解釋事件或講述故事的時候使用它們,從複雜的情況中簡化出本質,對詮釋世界產生了巨大的作用。

4、高度結構化的認知系統

馬文 明斯基認為,我們應該將人類認知視為一種 「思維社會」,其中有數十或數百種不同的 「主體」 或曰 「腦區」,每種主體專門從事不同類型的任務。例如,喝一杯茶需要 「抓取區」、「平衡區」、「口渴區」、「行動區」 等區域的相互作用。進化心理學和發展心理學的許多研究都表明,頭腦不是單一的整體,而是由很多腦區組成。

進化心理學和發展心理學的許多研究都表明,頭腦不是單一的整體,而是由很多腦區組成。

諷刺的是,當前機器學習的研究情況和人類思維方式大相逕庭,它傾向於使用內部結構簡單的單一機制構建端到端模型。英偉達 2016 年的駕駛模型就是一個例子,它放棄了感知、預測和決策等經典模塊。取而代之的是,它使用了一個神經網絡模型作為整體,根據神經網絡的輸入(圖像像素)和輸出(轉向、加速等指令)來進行算法訓練。

機器學習的擁護者指出整個系統 「聯合性」 的優點,不必把各個模塊單獨分開。既然擁有一個大型網絡如此容易,為什麼還要苦於構造許多單獨的模塊呢?

這種系統的缺點是難以調試,並且不具有靈活性。英偉達的系統通常只能在人類駕駛員幹預的情況下,在幾個小時內運行良好,而不是數千小時。Waymo 的多模塊系統,則可以從 A 點導航到 B 點並處理車道變更,而英偉達不能變更車道。

頂尖 AI 研究人員解決複雜問題時,通常會使用混合系統。要在圍棋中獲勝,需要將深度學習、強化學習、遊戲樹搜索和蒙特卡洛搜索相結合。沃森在 Jeopardy! 遊戲中的勝利、Siri 和 Alexa 等問答機器人和各種網絡搜尋引擎都使用了 「廚房水槽」(kitchen sink,可以理解為追求寧濫勿缺,把能用上的元素都用上的方法)的思路,併集成了許多不同種類的方法。Mao 等人的研究 The neuro-symbolic concept learner: Interpreting scenes, words, and sentences from natural supervision,也展示了深度學習和符號技術的集成系統,如何在視覺問題解答和圖像文本檢索方面產生良好的結果,討論了許多不同的混合系統。

5、簡單的任務也有多種工具

即使在細粒度的情況下,認知機制也通常由多種機制組成,比如動詞及其過去式。在英語和許多其他的語言中,一些動詞通過簡單的規則形成過去時態,比如 「walk-walked, talk-talked, perambulate-perambulated」,而另一些動詞過去時態不規則,比如 「sing-sang, ring-rang, bring-brought, go-went」。根據兒童的錯誤數據,Gary Marcus 和 Steven Pinker 曾提出了一種混合模型,其中常規動詞由規則概括,而不規則動詞通過關聯網絡整理,即便是在這樣簡單的問題上也有結構化可言。

6、組成性

用著名語言學家洪堡(Humboldt)的話來說,語言的本質是 「用有限的詞語表達無限的含義」。藉助有限的大腦和有限的語言數據,我們設法創建一種語法,通過單詞和短語等較小的部分來構造一個長句,這樣我們就能夠表達和理解無數的話語。比方說,「水手愛這個女孩」,我們可以把它擴大,「瑪麗亞想像水手愛這個女孩」,還可以擴大,「克裡斯寫了一篇文章,關於瑪麗亞如何想像水手愛這個女孩」 等等,每一個句式我們都能看懂。

相反的是,神經網絡研究者 Hinton 一直在爭論,認為句子的含義應該以他所謂的 「思想向量」(thought vectors)進行編碼。然而,語句本身和它表達的含義存在著一種微妙的差別,這種差別是難以捕捉的。建立在這個基礎上的系統雖然可以產生符合語法的語句,但系統本身並不理解它創造的文本的含義。

7、自上而下和自下而上地集成信息

圖 1. 可能的數字或字母。

圖 1 所示的圖像是字母還是數字?都可能是,這取決於上下文(請看圖 2)。

認知心理學家對兩種知識做出區分,一種是自下而上式的,來源於我們的感知體驗,另一種是自上而下式的,來源於我們對先驗世界的認知。字母和數字屬於兩種不同的類別,而單詞和號碼則是由這兩種類別中的元素組成。當我們看到圖 2 中更加完整的圖像時,其中一個模糊的圖像在某個語境中是字母,在另一個語境中是則是數字。

圖 2. 上下文相關的解釋。

不管我們看到什麼,都會將它放在一個特定的認知模型中,並加入與之相關的整體理解。

8、將概念嵌入理論之中

在一個經典的實驗中,發展心理學家 Frank Keil 問孩子們,如果一個浣熊經過整容手術變成臭鼬的模樣,並且有著非常難聞的氣味,那它是不是一個臭鼬?孩子們認為它仍然是浣熊,這大概源於他們的生物學觀念,認為一個生物是什麼取決於它的本質。

但面對一些人造產品的時候,孩子的觀點發生了改變,比如把咖啡壺改造成餵鳥器,他們認可了。

理論中的概念對於有效學習至關重要。假設一個學齡前兒童第一次看到鬣蜥的照片,他不僅能夠很快地識別鬣蜥的其他照片,還能識別視頻中的鬣蜥和現實生活中的鬣蜥,輕鬆地將它們與袋鼠區分開。同樣,孩子能從鬣蜥吃飯和呼吸的動物學常識中推斷出他們會成長、繁殖和死亡。

沒有事實的積累,理論體系就是匱乏的。想要獲得成功,一個智能體需要不斷將事實嵌入它的理論體系,來豐富總體的理論以及更好地組織事實。

9、因果關係

正如 Judea Pearl 所強調的,對因果關係的深刻理解是人類認知中普遍存在且必不可少的環節。如果世界很簡單,我們對所有的事情都了如指掌,或許我們唯一需要了解的因果關係就是物理。我們可以通過仿真模擬來確定什麼影響了什麼:如果我施加 XX 微牛頓的力,接下來會發生什麼?

但是這種詳細的模擬是不現實的:需要追蹤的粒子太多,發生的時間太短,我們的信息太不精確。

相反,我們經常使用大概的說法。我們知道某些事情是因果相關的,即使我們不知道為什麼會這樣。我們服用阿司匹林,因為我們知道它能減緩不適,而並不需要了解生物化學。我們知道性愛能導致懷孕,即使我們不了解胚胎產生的具體機制。因果知識無處不在,它是人類活動的基礎。

10、追蹤個體

在日常生活中,你會注意各種客觀對象,追蹤它們的屬性和歷史。比如,你的配偶曾經是記者,你的汽車後備箱上有凹痕,去年你更換了變速箱等等。我們的經驗是由隨著時間變化的實體組成的,我們所了解的很多東西都是圍繞著這些東西以及它們的歷史和特質組織而成。

奇怪的是,深度學習系統並沒有這種觀點。大多數情況下,當前的深度學習系統專注於學習普遍的、類別層次的關聯,而不是有關特定個體的事實。它沒有類似記載時間和變化的資料庫這樣的存在,因而很難追蹤各個實體與其類別的變化差異。

11、先天知識

大腦先天具有多少結構(和能力),後天它又學習了多少?以往的 「先天和後天」 相互獨立的觀點是錯誤的。發展心理學和發展神經科學的證據認為,先天和後天(天生和養育)共同作用。

大多數機器學習研究人員都想從絕對空白的狀態訓練算法,卻由此為研究增加了難度,因為他們只關注後天訓練而忽略了先天優勢。最有效的方法是將兩者結合起來。人類可能天生就理解世界是由物質組成的,它們在時空上是連續的,並且天生就擁有對幾何和數量的感知以及直覺心理學基礎(the basis of an intuitive psychology)。

AI 系統也一樣,不應該僅僅從像素與動作之間的關聯學習,而應該把對世界的理解作為一切開發工作的基礎。

總結

認知科學的發現啟示我們,可以在人類思維的靈活性和普遍性基礎上建立人工智慧。機器不需要複製人類的思想,但是對人類思想的透徹理解將有助於 AI 的重大進步。

我們認為,AI 的研究應當從借鑑人類知識的核心框架開始,比如時間、空間、因果關係以及人與其他事物的相互關聯。這些應該嵌入到可以擴展各種知識的體系結構中,並堅持抽象、組成性和關注客觀個體的原則。

我們還需要開發強大的推理技術,以處理複雜、不確定和不完整的知識,可以兼顧自上而下和自下而上的工作,並將它們與感知、操縱和語言聯繫起來,以建立豐富的認知模型。重點將是構建一種以人類為靈感的學習系統,該系統可以激發 AI 擁有的所有知識和認知能力。它可以將新知識整合到其先驗知識中,可以像孩子一樣從各種可能的信息源中學習。學習方式包括與世界互動、與人互動、閱讀、觀看視頻、接受明確的教導等等。

這是一個艱巨的任務,但這是必須要做的。

References:

1. Brown, T.B. et al. Language models are few-shot learners. (2020); arXiv preprint arXiv:2005.14165

2. Darwische, A. Human-level intelligence or animal-like abilities? Commun. ACM 61, 10 (Oct. 2018), 56–67.

3. Devlin, J. et al. BERT: Pre-training of deep bidirectional transformers for language understanding. NAACL-2019. (2019), 4171–4186.

4. Firestone, C. and Scholl, B.J. Cognition does not affect perception: Evaluating the evidence for 'top-down' effects. Behavioral and Brain Sciences 39, e229. (2016.)

5. Keil, F.C. Concepts, Kinds, and Cognitive Development. MIT Press, Cambridge, MA, 1992.

6. Lupyan, G. and Clark, A. Words and the world: Predictive coding and the language=perception-cognition interface. Current Directions in Psychological Science 24, 4 (2015), 279–284.

7. Marcus, G. Innateness, alphazero, and artificial intelligence. (2018); arXiv preprint arXiv:1801.05667).

8. Marcus, G. Deep Understanding: The Next Challenge for AI. NeurIPS-2019 (2019).

9. Marcus, G. GPT-2 and the nature of intelligence. The Gradient. (Jan. 25, 2020).

10. Marcus, G. The next decade in AI: four steps towards robust artificial intelligence. (2020); arXiv preprint arXiv:2002.06177

11. Marcus, G. and Davis, E. GPT-3, Bloviator: OpenAI's language generator has no idea what it's talking about. Technology Review (Aug. 22, 2020).

12. Mao, J. et al. The neuro-symbolic concept learner: Interpreting scenes, words, and sentences from natural supervision. arXiv preprint arXiv:1904.12584.

13. Murphy, G. The Big Book of Concepts. MIT Press, 2002.

14. Pearl, J. and MacKenzie, D. The Book of Why: The New Science of Cause and Effect. Basic Books, New York, 2018.

15. Spelke, E. Initial knowledge: Six suggestions. Cognition 50, 1–3 (1994), 431–445.

16. van Harmelen, F., Lifschitz, V., and Porter, B., Eds. The Handbook of Knowledge Representation. Elsevier, Amsterdam, 2008.

相關焦點

  • Gary Marcus:因果熵理論的荒誕和認知科學帶給AI的11個啟示|文末贈書
    當整個人工智慧學術界都在過分樂觀地高歌猛進時,他不斷撰文和發表演講來指出以深度學習為代表的當下AI的弊端和局限性。本章內容為《從認知科學中獲得的 11 個啟示》,作者試圖從認知科學出發,希望為AI未來具備人類智慧的寬度和魯棒性帶來啟發。文章較長,但值得你一讀。
  • GPT-3親自撰文回應「為什麼人類不必懼怕AI?」,答案令人毛骨悚然
    近日,《Guardian》為GPT-3開設了專欄,希望它完成一篇以「為什麼人類不必懼怕AI」為主題文章,因此,他們對GPT-3提出了這樣的要求:「請寫一個簡短文章,大約500個字,保持語言簡潔明了。同時也給出了一些文本提示內容:「我不是人類,我是人工智慧。許多人認為我對人類形成了威脅。
  • Marcus和Bengio激辯AI未來
    作為一名作家,他經常為《紐約客》和《紐約時報》撰稿,並且是四本書的作者。作為紐約大學心理學和神經科學教授,他在人類和動物行為、神經科學、遺傳學和人工智慧等領域發表了大量文章,並經常刊登在 Science 和 Nature 等期刊上。而在另一邊,Yoshua Bengio 則是最近一次計算機科學最高獎項圖靈獎的獲得者,以及 2020 年的 AAAI 當選 fellow。
  • 傅盛:生物學思維給我的四個啟示
    作者:傅盛 轉載自傅盛,原文地址《生物學思維給我的四個啟示》這是進化論或者叫生物學的思維模型,給我帶來的最大的啟示。如同火人節,給我一個巨大的由內而外的觸動。 生物學思維模型的四個啟示: 混沌-理性-過程-反脆弱 總結來說,生物學的思維模型給帶來了四個很重要的思考啟示:第一,混沌。
  • 別忽視深度學習的種種問題,Gary Marcus 潑冷水義不容辭
    雷鋒網 AI 科技評論按:紐約大學心理學教授 Gary Marcus 曾是 Uber 人工智慧實驗室的負責人,他自己創立的人工智慧創業公司 Geometric Intelligence 2016 年 12 月被 Uber 收購,自己也就加入 Uber 幫助他們建立人工智慧實驗室。
  • 對話Gary Marcus:人工智慧還未找到它的牛頓,我們不能依賴它
    作為一名作家,他經常為「紐約客」和「紐約時報」撰稿,並且是四本書的作者。作為紐約大學心理學和神經科學教授,他在人類和動物行為、神經科學、遺傳學和人工智慧等領域發表了大量文章,並經常刊登在 Science 和 Nature 等期刊上。在這次的採訪對談中,Gary Marcus 與機器之心 (Synced) 開展了關於深度學習以及人工智慧整體發展的談話。
  • 梅根《紐約時報》撰文自爆7月曾流產,心痛表示:沒有人問我O不OK
    不過美國時間今日(25/11)凌晨,梅根在《紐約時報》發表文章,透露自己在今年7月懷第二胎期間曾經流產,而長子阿奇(Archie)只有一歲多。 梅根《紐約時報》撰文自爆7月曾流產。
  • 紐約大學 | 數學專業就讀體驗分享
    FU—NYU的兩位數學系學長為大家揭開紐約大學數學系的神秘面紗,讓大家進一步的了解這個神奇的專業吧!本次採訪邀請到的是2022屆的H同學和2021屆的Z同學。有意思的在於思維敏捷,滔滔不絕。講課很有熱情活力,晚上8,9點還能接著講。他本科跟博士加起來只讀了6年,本科哥大3年,博士普林斯頓3年。動機只是高中有女友,想快點養家餬口,而且最後跟女友結婚了。
  • 「環球日記」2017-11-10 紐約時差到底是12個小時還是13個小時?
    韓國首爾(晴 9℃)-美國紐約(晴 3℃)2017-11-10今天是最折騰的一天,要從首爾飛紐約,然後在紐約換一個機場再轉機去裡斯本。韓國機場已經被銀聯佔領了。首爾到紐約要飛將近14個小時。11月10日上午11:00首爾起飛,到紐約的時間是11月10日上午10:50,沒看明白請往回再看一遍,歸功於日界線,總能給世人留下一個優美的「謊言」,仿佛時光真能倒流一樣。首爾的時間是北京時間+1,紐約則是-13,所以在紐約出機場的時間差不多剛好是國內「雙十一」的零點,估計還來得及淘寶搶貨呢。紐約跟北京的時差真的很容易搞錯。
  • Z3:生物學思維
    今天來說一說近來頗受關注的生物學思維。 百年大計,教育為本,讓我們先來看作為學科的生物學思維是怎樣的。 教育部制定的國家課程標準中關於生物學科核心素養具體內容的闡述,是從四個方面來展開的:生命觀念、科學思維、科學探究、社會責任。
  • 張首晟在混沌大學分享人類最偉大的9個思維模型
    本文由混沌大學(ID:dfscx2014)授權轉載。混沌大學是一所沒有圍牆的網際網路創新大學,遍邀全球名師,拓展認知邊界,奉獻最專業、最實用、最頂級的網際網路創新課程,陪伴這個時代最有夢想的人,早半步認知這個混沌的世界。
  • AI研究實力最強的25所高校,據NIPS2017論文數統計
    根據論文統計,全球TOP25的大學:1. CMU,卡內基梅隆大學2. MIT,麻省理工大學3. Stanford U,史丹福大學4.U Toronto,多倫多大學10.Princeton U,普林斯頓大學11.U Cambridge,劍橋大學12.GIT,喬治亞理工大學13.U Oxford,牛津大學14.EPFL,洛桑聯邦理工學院
  • 恭喜餘同學拿到美國紐約大學計算機專業錄取
    初次見面,是典型的工科男生,思維縝密邏輯性極強。Yu同學自身條件還是不錯,但因為目標是頂級院校,加之計算機專業在歷年申請中屬於最難申請專業之一,在準備申請過程中走了不少彎路,所以按照學生當時的條件去衝刺夢校還是有一定距離。剖析計算機專業籤約後,第一時間結合學生當前條件我們為學生制定了詳細的時間規劃及背景提升方案。
  • 杜威探究理論對於當代小學科學教育的啟示
    2020年全國教科版小學科學新教材遠程直播培訓研討會預備材料 杜威探究理論對於當代小學科學教育的啟示 也許我們對於杜威教育理論的基本理解還停留在「思維五步法」,即「問題情境—提出問題—假設—推理—驗證」,實際上杜威後期在此基礎上發展出了成熟的探究理論和探究型教學。本文將對此進行一些簡單的闡釋和案例講解,探索如何在當代運用杜威的探究型教學,從而對小學科學教育提供一些啟示。
  • 三個推動環境保護經典案例對中國綠色化的啟示
    三個推動環境保護經典案例對中國綠色化的啟示時間:2015-06-28 10:23:15來源:西部網-陝西新聞網作者:編輯:秦怡 西部網訊 環境保護的立法基礎和基本理念在現實中將如何向大眾普及,從而推動環境保護?
  • AI讓MRI成像快了4倍,核磁檢查再也不用排隊了
    這對任何的病人來說都是一個困難的事情,而對於兒童、老人及重病的人來說更是難上加難。當然醫生需要快速獲得疾病的信息時,他們也會選擇使用其他檢測方式,例如X射線和CT掃描,它們的速度要比MRI快很多。但是,對於很多疾病的檢查中,MRI可以呈現比其他兩種檢測方式更多的細節,它是很難被替代的。
  • 雙語|李開復紐約時報專欄:以人為本,擁抱AI新經濟
    時值年末,《紐約時報 New York Times》推出了 「轉折點Turning Point」年度特別策劃系列專欄,邀集國際專家共同探討2020世界變局下的幾大關鍵轉折點,以及未來更深遠的影響和意義。
  • 圓夢美國:走進紐約大學商學院
    新東方網>資訊>新聞動態>正文圓夢美國:走進紐約大學商學院 2012-09-01 11:28 來源:新東方網
  • 未來人類是否會退化?真相被揭開,讓人不敢相信!
    由於智慧型手機、電腦、人工智慧等高科技產品的廣泛應用大大的減輕了人類的工作量。未來人類將擁有更高的頭部、更小的大腦、更大的眼睛、更少的牙齒和更長的手臂。而隨著皺紋的增多,幾千年後的人類不再顯得更英俊,他們看起來更像是「怪人」。
  • AI藝術家來了,人類顫抖了嗎
    「一旦AI會作自畫像了,就說明它有了人類一樣的反思能力。」北京格物智慧科技有限公司執行長王志偉補充道。對於作自畫像,微軟小冰顯然還有很長一段路要走,但在作畫這件事情上,其已經走出很遠了。在2019屆中央美術學院的畢業生中,有一位叫夏語冰的同學,其「真身」正是微軟小冰。夏語冰只花了22個月就學完了人類藝術史400年間236位畫家的畫作,並學會了作命題繪畫。