「直覺機器」和「代數思維」,哪條路能走向通用人工智慧?

2020-11-29 36氪

編者按:不久前紐約大學心理學教授、Uber人工智慧實驗室前負責人、人工智慧創業公司Geometric Intelligence創始人Gary Marcus給深度學習潑了10次涼水,指出了這種人工智慧方法存在的諸多限制。這次《人工直覺與深度學習手冊》作者Carlos E. Perez開始針鋒相對,逐條予以反擊。總的說來,這是直覺機器與代數思維的路線之爭,究竟誰更有道理呢?看誰先實現AGI吧。

對於Gary Marcus有關深度學習的限制,我至少欠他一個更詳細的解釋。那些研究人員在研究深度學習時沒有盡職的問題在於,其實他們並不理解這一領域取得的大規模進展。通過把恐懼、不確定和懷疑(FUD)注入這個最有可能實現AGI(通用人工智慧)的學習領域,其實他們是在幫倒忙。更大的問題不在於其他AGI研究活動得到的資金變稀少了,而是中國相對於美國和歐洲,資助這方面的政府開支要大得多。

有點跑題了啊,不過我的確把Marcus的每一條質疑都好好看過了,我會給大家解釋這每一條用我從事的認知範式研究(比如直覺機器)的話可以如何實現。

如果離開了自動化對象跟環境的交互機制,任何有關實現AGI的對話都是不完整的:

深度學習是非常好的通用逼近器(我們現有最好的一個),當然,除了學習模式以外AGI還需要更多。我已經在之前的文章中寫過了。不過,除非有人構思出了更好的模式識別器,否則的話AGI的發展還將繼續由深度學習推動。吸收了逼近器的現金方法有很多。GAN引入了競爭學習的思路,將識別器與生成器進行結合。RL+DL表明,通過利用Q-learing算法和DL,僅靠觀察像素來學習是有可能的。AlphaZero通過MCTS(蒙特卡洛樹) + DL表明,通過自己跟自己下棋就能形成更先進的策略。在「深度學習」這個東西被發明出來之前沒人設想過上述任何一個新辦法。然而,所有這些新方法成功的主要原因是由於它們把深度學習作為了一個組件。從方程式裡面撤走深度學習的話你就什麼也得不到了。

好了,現在我們要搬出Gary Marcus的觀點看看用深度學習(或者直覺機器)可以如何解決了。

3.1. 迄今為止的深度學習對數據非常饑渴

這是因為大多數實驗裝置都是要從零開始對環境沒有任何的先驗知識。相反,人類嬰兒在這一點上有著永恆的進化優勢。

不過,如果我們看看AlphaZero的最新進展的話,那麼這種需要大量數據的限制似乎已經被消除了。AlphaZero學會下出大師級水平,但是卻不需要從棋譜中學習。相反,它僅僅靠定義了棋類的規則就做到了這一點。它只用了4個小時就學會了下期策略(不同的開局著法、開局讓棋法、對棋盤的控制、殘局的下法、迫移等)。換句話說,它在短得不可思議的時間內就學會了人類在下了很多世紀才領悟到的所有東西。

要是無視這一點風險就得你自己承擔了。

3.2. 迄今為止的深度學習很膚淺遷移能力有限

我們對深度學習的遷移學習的理解仍在初期階段。在用於類似領域是我們已經目睹過遷移學習的進展。舉個例子,對預先訓練過的網絡進行訓練的話培訓會變得更快。這一領域令人印象最為深刻的進展就是高解析度圖像的生成。這讓我們通過逐步從較小規模的網絡學習慢慢搭建出一個更大的能力更強的網絡。

然而,我們還無法訓練網絡做的事情是,學會知道哪些是不變的東西,這樣才能去學習那些重要的東西。深度學習似乎什麼都學,我們也不理解如何才能區分對另一個領域不重要的東西。比方說,如果你改變一個視頻遊戲的維度,受訓萬這個遊戲的RL+DL系統就沒法玩下去了。這種規模變化讓學習模型陷入了困境。

這是一個有趣的問題,但看起來並不像是無法克服。

3.3. 迄今為止的深度學習沒有應對層次結構的自然手段

基本上,深度學習是在沒有理解層次概念的情況下連續向量空間內建立起表示的。然而,像Capsule Network、Hyperbolic空間以及Graph Convolutional Network(圖卷積網絡)等工作都能捕捉這些分層。

DL方面每年都有成千上萬的論文發表。我想Marcus繁忙的日程安排能跟得上這些文獻的閱讀。

3.4. 迄今為止的深度學習仍搞不定開放式推理

對非靜態環境下有著多個競爭與合作共存的神經網絡的新的研究論文現在已經有發表了。開放式要求在信息不完整的情況下建立起策略。這也是半監督學習領域的重要研究課題。這種情況下部分信息是打了標籤的,但是大部分信息都不是。深度學習系統已經表明它們在這個領域表現很好。

信息不完整環境的一個例子是撲克遊戲。利用深度學習來玩競爭性很強的撲克遊戲已經取得了重大進展,它們打得非常好。

我可以大膽地說,最先進的開放式推理目前為深度學習型技術所統治。

3.5. 迄今為止的深度學習透明度不夠

這點沒錯,不過難道我們不應該在通用人工智慧的背景下來討論這個的嗎?人類自己的透明度就充分了嗎?

人類利用直覺進行的推理就像深度學習直覺機器做出的推理一樣令人費解。請讀讀我在解釋深度學習的時候對2018年做出的預測。

3.6. 迄今為止的深度學習沒有跟先驗知識整合

這個跟AGI也沒有關係。如果我要給洞穴人一個語義網絡或者牛頓的運動方程式的話,他也沒法消化吸收進自己的知識庫。人類並沒有《黑客帝國》裡面的那種機制,只需要下載知識即可。

人類消化先驗知識的辦法是通過K-12學校課程,需要好幾年的教學。

不管怎樣,我們先暫時忽略這要求的荒謬。在NLP當中,那些應用了深度學習的,那些吸收了語義網絡的識別引擎已經表明要比那些沒有的表現更好。

3.7. 迄今為止深度學習無法自行區分因果關係和關聯關係

普通人也沒法做到。這不是AGI的要求。

3.8. 深度學習假定世界基本上是穩定的,這可能會引起問題

深度學習最大的未解難題之一是學會如何遺忘。其重要性在於對世界的心智模式是如何建立的。當我們有了那種更高級的智能,可以對世界以及某人的想像進行模擬和實驗時,你就可以了解到先驗知識是不正確的,因此也必須進行相應調整。

知道之前了解到的知識由於與現實世界觀察到的東西不一致而必須進行改變,這種可鍛性是很困難的技能。

再說了,哪怕是當今的美國總統都缺乏這種技能。

3.9. 迄今為止的深度學習從逼近性來說工作得不錯,但是它的答案往往不能完全信任

信任是一種突現社會行為。(除非它被編碼進區塊鏈)

如果無人車的底層技術採用的是深度學習的話我們能怎麼信任它呢?

我們信任它們是因為保險公司會進行測算然後開始對那些選擇自己開車的人收取較高價格。

建議你讀一下這篇文章來了解人類兼容AI的複雜性。

3.10. 迄今為止的深度學習難以設計

說得沒錯,這正是深度學習有時候被稱為「深度點金術」的原因。不是每一次革命都不用付出努力的!

理想情況下我們想要結構更加生物性的系統。我在《靈感源自生物的架構》中提到過這些問題。如果你的確想要理解開發深度學習架構的複雜性,那麼也許你可以從這篇文章開始。

Marcus似乎把對精心設計的認知系統的要求與對AGI的要求弄混了。在某些情況下,它們的問題是有關聯的,但不是次次都是。

但這只是Gary Marcus對深度學習和AGI認知錯誤的一個原因。我們在人類身上找到的通用智能並不是「代數思維」,相反而是直覺機器。這是我們對AGI的實現路徑看法上的不同。Marcus的代數思維讓我想到了創始論者提出的「智能設計」。這種觀點認為,進化演進出一個眼睛是不可能的。然而,這個卻是深度學習研究人員的論斷。先天的認知機器可以通過學習方法而不是通過設計來發展起來。

我們可能會在不理解其工作機制的情況下發現AGI。在科學史上,理論很少會走在發現的前面。可能會發生的情況是深度學習方法會發現更先進的學習方法,引領我們走向AGI。這個跟AlphaGo或者AlphaZero發現的那種新的下棋方法未必有什麼不同。我們剛開始的時候以為它們的下法是算法出問題,結果在人家下贏了之後才發現對方的天才。然而,哪怕我們回過頭來再去復盤,我們的理解也是有限的,人不不知道機器這麼下的動機。這是因為洞察作為直覺的結果永遠都是很難解釋的。

原文連結:https://medium.com/intuitionmachine/intuition-machines-versus-algebraic-minds-fad052b46ad5

編譯組出品。編輯:郝鵬程。

相關焦點

  • 棋類大師 AlphaZero 無師自通,「通用人工智慧」加速到來?
    Perez看來,這是他提出的複雜的邏輯思維可以通過直覺機器來完成的直接證據。AlphaZero的橫空出世,跨越了實現通用人工智慧的一道巨大鴻溝——「語義鴻溝」。Perez認為,這是AGI的一個極其難以實現的裡程碑事件,而且它到來之快已經遠遠超出了專家的估計。現代文明以及披上技術的外衣導致了我們自身直覺的衰退。
  • 張立華:突破全息直覺理論,打造機器智能引擎
    而在同樣環境下,人類卻往往可以依靠直覺做出較為迅速且適宜的判斷,這為我們發展新的人工智慧理論來解決上述問題提供了靈感。」在復旦大學,智慧機器人研究院常務副院長、智慧機器人教育部工程研究中心副主任張立華正帶領一個科學家團隊,與清華大學腦與認知科學研究院合作,提出了機器直覺這一新的交叉學科研究方向,致力於讓機器實現類似甚至超過人類的直覺能力,賦予機器洞察力與創造性。
  • 思維與機器:哥德爾不完全性定理的哲學推論,人腦無限超越機器
    ·彭羅斯(他是2020年諾貝爾獎得主)相信哥德爾和圖靈的工作以數學精度證明了人類的思維「無限超越機器」。也許我們可以用哥德爾的一句話:誰能證明人類思維的一致性?即使大腦超越了機器,也許它還有一些未知的東西。
  • 思維與機器:哥德爾不完全性定理的哲學推論,人腦無限超越機器
    一些思想家,如約翰·盧卡斯和著名物理學家羅傑·彭羅斯(他是2020年諾貝爾獎得主)相信哥德爾和圖靈的工作以數學精度證明了人類的思維「無限超越機器」。儘管盧卡斯和彭羅斯的觀點不同,他們的推理的要點是:考慮一個具有遞歸公理和足夠表達能力來表述算術真理的正式系統S,它在圖靈機M中有一個對等物。
  • 深度| 構建好奇的機器,Maluuba的通用人工智慧探索(附論文)
    原標題:深度 | 構建好奇的機器,Maluuba的通用人工智慧探索(附論文) 選自Maluuba 機器之心編譯 參與:李澤南、比如在網上搜索,思考為朋友挑選哪件禮物,你一開始會隨便搜搜——以對方的年齡、性別和自己的錢包為導向——隨後再在縮小的範圍內以興趣和推薦等條件為依據找到最終目標。 由於這種方式構建了智能行為的基礎,人們對人工智慧尋找信息的方法已經進行了廣泛的研究,認知科學、心理學、神經科學和機器學習的角度都已被涉足。
  • 什麼是通用人工智慧,會對人類產生威脅嗎?
    通用人工智慧作為人工智慧學科的核心目標,成為了最受關注的人工智慧科技之一。近日,作家馬丁·福特在採訪人工智慧領域的傑出人物時,讓他們對人類在哪一年能夠有50%的機會實現通用人工智慧作出預測,受訪者給出的預測時間平均算下來是在2099年。雖然,根據專家預測,距離通用人工智慧的到來還有相當長的一段時間。但是,仍有人提出了通用人工智慧會對人類造成威脅的觀點。那麼,事實真會如此嗎?
  • 造就 | 當機器擁有了和人一樣的直覺,它所能做的事遠比下圍棋多得多
    動物逐漸有了頭腦,有了越來越複雜的腦結構,最後出現了人腦這樣一個非常精妙和強大的思維機器。這是地球物種演變數百萬年的歷史所帶來的巨大成果。究竟是什麼原因讓我們面對一個如此複雜的智能遊戲,能做到心中有數,並且非常漂亮地走步?愛因斯坦說過,真正有價值的東西就是直覺。
  • 為什麼說用現有馮諾伊曼架構的計算機即可實現通用人工智慧AGI?
    我們將要得到的,不是與人腦同樣聰明的AGI,而是能把人腦智力擴展數億倍的超人工智慧!與人腦智能相比,機器智能只有兩種狀態:遠不及人腦和遠超人腦,這是因為,計算機的信息存儲量的運算速度都億倍於人腦,所以,如果模擬人腦智能的相應機制,那麼,機器智能在相應方面就能遠超人腦,反之,如果不模擬人腦智能的相應機制,那麼,在相應方面就遠不及人腦。
  • 「全能棋王」AlphaZero 背後的真正啟示:直覺是如何戰勝邏輯的
    我在人工智慧領域所做的工作圍繞「先進的認知機器將使用直覺作為其智力基礎」這一想法。我們人類的思想為一般化的智力提供了充足的證據。人類本質上是直覺機器,而我們理性(和自覺)的自我只是基於直覺的機器之上的一個模擬。這與笛卡爾的名言「我思故我在」形成鮮明的對比,意味著我們的理性思維就是把我們與其他所有生物區分開的東西。
  • 思維進化:突破直覺思維、線性思維定勢,提升思考能力
    初級思維一:直覺思維(單點反射) 基本特徵:直觀,表面,孤立的,對某一個點的反射,可以理解為 膝跳反射 和盲人摸象 1、 直覺思維案例:取出保鮮盒內的冷凍鮮奶她認為男士需要這個,外觀小巧美觀已經超過了刀片能用多久,這個剃鬚刀用於然後後面25天銷售數量等於公司其他銷售員總合3、直覺思維案例:超市儲物櫃,已用密碼紙開櫃,但部分物品遺漏,櫃門已關,如何處理?
  • 人工智慧再下一城:機器翻譯提前7年達到人類專業翻譯水平
    由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導的中譯英測試集上,達到了人類專業譯者水平。這是首個在新聞報導的翻譯質量和準確率上媲美人類專業譯者的翻譯系統。
  • 人工智慧中的11個悖論(誤區)預示了實現通用人工智慧的正確道路
    ,把它移植到計算機的軟體中,就能實現人腦那樣的通用人工智慧,甚至是超人工智慧。、靈感、直覺等高級思維,但你說不出上述識別和思維的具體過程是什麼,這是因為,智能的機制或智能的規律和自然界中的自然規律一樣,都是隱性的,是隱藏著的,如同被加密的文檔,是有待我們去破解和發現的,需要我們去破解後才能知道它的真面目,我們需要通過科學研究和心理學研究才能發現它們,搞清楚它們。
  • 為何除了馬斯克,沒人願意猜通用人工智慧何時出現?
    如果我們研究出思維水平和人類相當甚至優於人類的機器,而且這些機器思考速度很快、從不疲倦的話,那麼解決現有問題會更有勝算。在 1965 年,計算機科學家古德便說:「只要發明出來第一臺超智能機器,人類便能一勞永逸。」 埃隆 馬斯克早期曾投資 DeepMind。他的預測總令人瞠目結舌,但是成千上萬的人都在關注他說了什麼。
  • 如果機器可以自我思考,人工智慧是否會走向失控?
    大家好,我是來自電子科技大學大數據研究中心的張千明,很高興能夠在班豆平臺給龍泉驛區和全省的孩子們帶來人工智慧知識的科普。 01 不同群體的討論 在上個世紀五十年代,人工智慧之父圖靈發表了一篇論文,裡面提出了一個問題就是,機器能思考嗎?在1951年和1952年,BBC連續報導了阿蘭·圖靈對此問題的討論,當然是和先賢的一些大人物們去討論機器能不能思考。
  • 人工智慧的生存競爭需要從狹域走向廣域
    海納模型意味著,在任一給定不確定性水平的環境裡已生存著的物種,智能程度較低的(例如海星和螞蟻)有最可預測的行為模式,而智能程度最高的(例如「神」或「上帝」),其行為是最不可預測的。狹域的生存競爭,極端而言,就是在完全確定的生存環境裡競爭。這時,達爾文的學說完全適用。
  • 受腦認知和神經科學啟發的人工智慧
    去年,谷歌和MIT聯合發表了一篇文章,文章的中心思想是怎麼利用神經科學構造健壯的人工智慧系統。我們現在深度學習的基本框架,是通過多層神經網絡輸入,根據誤差來調整連接,這建立在大量數據標註的基礎上,通過標記數據得到網絡優化的成本函數。 我要強調一點,我們通常講深度學習是從機器學習發展來的,要構造一個學習機器,關鍵是在不同區域、不同任務下,怎麼去構造一個成本函數。
  • 孩子的認知地圖:認知與思維決定了他能走多遠
    古時候的農民,他能想像的世上最好的生活,就這樣!還有一個撿糞的農夫坐路邊上嘆氣:「他媽的,我要是當了皇上,這撿糞的叉子得是金的!而且路兩邊的糞都得歸我一個人撿!」這就是見識對一個人的妨礙。2.李子樹在道路旁邊,就是深度嵌入到社會網絡裡的,它的過去、現在和未來,都是和其他網絡節點互動的結果。另外還有「司馬光砸缸」「曹衝稱象」都是「認知地圖」不同造成的思維高度不同!所以造就了千古美談!
  • 量子計算和人工智慧的最佳時機相遇
    量子人工智慧是由量子計算和人工智慧相結合而發展起來的新興學科和技術。在過去的幾十年中,量子計算和人工智慧技術經歷了自己起起伏伏,並逐漸走向落地,有望為人類技術創新,生產和生活帶來顛覆性變化。當我在1950年代和1960年代開始研究人工智慧時,我感到自己可以實現強大的人工智慧,這種人工智慧可以在二十年內像人類一樣具有自主感和感知力,這有點太難了。到目前為止,儘管AlphaGo在圍棋比賽中可以實現很高的計算複雜度,但它仍屬於弱人工智慧類別,即在特定規則下的程序化操作。人們認為孩子可以理解AI難以實現的情感和動作技能,但人們認為非常聰明的高級代數幾何和超級西洋棋技巧可以通過例程來實現。
  • 人工智慧,「吃一塹長一智」的機器
    機器能思考嗎?早在20世紀初,人類就開始想像機器像人類一樣思考的可能性。1970年,Intel 4004處理器每秒可以運行92,000條指令,而我們現在的普通手機能每秒處理10億條指令。不斷湧現的成果向投資者和研究者證明了人工智慧是可以實現的,而且其應用能極大地提高商業利潤和社會生產力。
  • 機器會思考?圖靈為何被稱為人工智慧之父?
    1912年6月23日生於英國倫敦,他從小就具有跳躍性思維在中學時,一位老師給學生們出了個光學難題,圖靈竟立刻得出正確答案。可是當老師要他說清計算過程時,他卻回答不出來。幾天之後,圖靈竟然把光學公式自己推導出來了。在老師們的眼中,圖靈的思維可以像袋鼠般跳躍。