機器具備「理解」能力究竟是什麼意思?

2021-01-08 36氪

神譯局是36氪旗下編譯團隊,關注科技、商業、職場、生活等領域,重點介紹國外的新技術、新觀點、新風向。

編者按:AI發展著幾十年,總像四季一樣經歷起起伏伏。每每取得一定進展之後,又會遭遇所謂的寒冬,一下子一蹶不振。最近十年,隨著機器學習的崛起,對AI的炒作一下子到達了頂峰,然後末日論和質疑聲又日益喧囂起來。質疑者提出,那些僅具備單項能力的AI並不具備理解能力,算不上真正的AI,深度學習已經走進了死胡同,要另起爐灶。對此,傑出名譽教授Thomas G. Dietterich提出,其實並沒有什麼「真正」的理解,人類的理解也永遠都不是完整和完美的。所以我們不要再把我們取得的成功視為不夠「真實」而摒棄,而應該繼續以誠實的、富有成效的自我批評去推進AI發展。原文標題在Medium上,標題為:What does it mean for a machine to 「understand」?

對人工智慧最新進展的批評者抱怨說,儘管這些進展已經給AI系統中帶來了顯著進步,但這些系統依然未能展現出「真實」、「正確」或者「真正」的理解。像「真實」、「正確」以及「真正」之類詞彙的使用意味著「理解」是二進位的。一個系統要麼表現出「真正」的理解,要麼就是沒有理解。這種思維方式的困難在於,人類的理解永遠都不是完整和完美的。在本文中,我將提出「理解」是能力的系列連續譜。比方說,不妨考慮一下「水」的概念。大多數人都理解水的許多特性:水是溼的,水可以喝,植物需要水,溫度很低的話水會結成冰,等等。但不幸的是,很多人不理解,水是導電體,所以,淋浴的時候不應該用風筒。儘管如此,我們不會說這些人對誰缺乏 「真實」、「正確」或「真正」的理解。相反,我們會說他們對水的理解是不完整的。

我們也應該以同樣的態度來評估我們的AI系統。現有的系統已經表現出了某些類型的理解。比方說,當我讓Siri「打電話給Carol」,然後它能夠撥打正確的號碼時,你就很難說服我說Siri並不理解我的要求。當我問Google「IBM的深藍系統擊敗了誰?」,後者返回一個信息框,給出用大寫字母寫成的「卡斯帕羅夫」時,它就已經正確地理解了我的問題。當然,這種理解是有限的。如果我接著問它「什麼時候?」的時候,它只會給我提供一個「when」的字典定義——而不會把我的問題解釋成對話的一部分。

關於「理解」之爭可以追溯到亞裡斯多德,也許John Searle的「中文房間」思想實驗對此闡述得最清楚。我鼓勵大家可以去看看《斯坦福哲學百科全書》裡面科爾的那篇出色的文章。我的態度是一種功能主義的形式。我們從功能上去表示理解,並且根據大腦或者某AI系統各種內部結構在產生所衡量的功能中存在的因果關係來評估它們所做的貢獻。

從軟體工程的角度來看,功能主義鼓勵我們設計一系列測試去衡量系統的功能。我們可以問一個系統(或一個人),「如果把水冷卻到–20度會發生什麼?」或者「如果在洗澡的時候用吹風機會發生什麼?」然後對回應進行衡量。就回應恰當而言,我們可以說系統理解了,而如果說回答錯誤的話,我們可以說發現了系統存在不理解的情況。

為了讓一套系統能夠理解,它必須建立不同概念、狀態和動作之間的關聯。今天的語言翻譯系統可以正確地把英語的「水」跟西班牙語的「agua」關聯到一起,但是它們沒有在「水」和「電擊」之間建立起任何的關聯。

對於最新的AI進展,批評大都來自兩個方面。第一個是,(研究人員、前者所在的組織,甚至政府以及資助機構)圍繞著人工智慧的炒作已經達到了極端水平。這種炒作甚至引發了對「超級智能」或「機器人末日」迫在眉睫的恐懼。批評對於抵制胡說八道至關重要。

其次,另一種批評是持續進行的有關人工智慧研究的未來研究方向以及政府撥款的分配之爭的一部分。爭論的其中一方是聯結主義的倡導者,他們發展出深度學習並支持繼續進行這方面的研究。而另一方則是倡導基於符號的建構和操縱(比方說,形式邏輯的使用)的AI方法。主張在混合結構中結合這兩種辦法的社區業主日益壯大。對於這類討論來說批評也是至關重要的,因為AI界必須不斷挑戰我們的假設,並選擇如何把社會的時間和金錢投入到AI科學和技術的發展當中。但是,我反對這樣的觀點,即「因為當今基於深度學習的系統並沒有表現出真正的理解,所以我們應該放棄深度學習」。這種說法跟「今天基於深度學習的系統已經取得了巨大的進步,並且進一步研究下去將可以『解決智能問題』」的說法一樣有問題。我喜歡Lakatos 做出的分析,也就是應該不斷深入研究計劃,直到研究不再產生有效成果。所以我認為我們應該繼續去追求連結主義計劃,符號表徵主義計劃以及新興的混合計劃,因為它們都將繼續結出累累碩果。

對深度學習的批評已經把我們帶到了新的方向。尤其是,一方面已經證明深度學習系統在各種基準任務上跟人類的表現可以相匹敵,但另一方面又不能將其推廣到表面上非常相似的任務上,這已經導致了對機器學習的批評。研究人員正在用新想法予以回應,比方說學習不變性(learning invariants),發現因果模型(discovering causal models)等。這些想法既適用於機器學習的符號主義也適用於聯結主義。

我相信我們不應該去爭論什麼才算是「真正的」理解。相反,我鼓勵大家把那個先放到一邊,去尋求人工智慧的科技進步,把焦點放在未來5、10或者50年內應該努力去實現哪些系統功能上面。我們應該根據可以在AI系統上進行的測試來定義這些功能,來衡量它是否具備這些功能。為此,這些功能必須是可操作的。簡而言之,我的觀點是要AI開發要以測試為驅動。這需要我們把我們對「理解」和「智能」的模糊概念轉化為具體的,可衡量的能力。這本身就是一個非常有用的練習。

操作測試不需要只考慮AI系統的輸入輸出行為。還可以可以檢查產生這種行為的內部結構(數據結構,知識庫等)。人工智慧優於神經科學的一大優勢是,我們可以更輕鬆地在人工智慧系統上進行實驗,從而了解和評估它的行為。但是請注意,包括深度學習在內的聯結主義方法往往會建立難以解釋的內部結構,似乎我們的大腦也是如此。因此,我們不應該將確保特定結構(比方說,符號表示)存在作為研究目標。相反,我們應該專注於希望具備的行為能力,並詢問內部機制是如何實現這些能力的。比方說,要想讓對話成功進行,對話的每一位參與者都必須能夠跟蹤互動的歷史。但是有很多方法可以做到這一點,我們未必就要指望在深度學習系統裡面找到明確的歷史記憶。相反,僅僅因為我們編寫了特定的內部結構,並不意味著它就會按照我們的預期方式工作。德魯·麥克德莫特(Drew McDermott)在他著名的批評文章《人工智慧遇到天生愚蠢》中曾詳細討論過這個問題。

人工智慧總是不斷地取得發展又受到批評,其後果之一是所謂的「AI效應」,也就是因為最新的系統沒有表現出「真正的理解能力」或者「真實的智力」,所以人工智慧領域被視為失敗。其結果是人工智慧的成功被忽略,投入的資金也相應減少了。比方說,有一段時間以來,大家認為,下西洋棋或者圍棋能達到人的水平就可以認為達到了智能的標準。但是,當IBM的深藍在1997年擊敗了卡斯帕羅夫時,一位著名的AI研究人員認為,西洋棋擊敗人類其實很容易——為了展現真實的智力,AI必須解決「卡車倒車問題」,也就是把鉸接式半掛卡車倒入停車位置的問題。實際上,這個問題早在九年前就被Nguyen和Widrow 用強化學習給解決了。今天,許多深思熟慮的批評家又再次提出了新的任務以及新的必要或充分條件來證明系統具備「理解」能力。

與此同時,人工智慧的研發正在為我們提供可以為社會帶來價值的,功能越來越強大的系統。無論是出於學術誠信還是為了繼續獲得資助,人工智慧的成功要歸功於那些研究人員,而存在的問題也需要他們站起來負責,這一點很重要。我們一方面必須壓一壓那些圍繞著AI新進展進行的炒作,另一方面,不管我們的系統是怎麼理解或者不理解用戶、目標以及所處的更廣闊世界的,我們也必須客觀地予以衡量。我們不要再把我們的成功視為「假的」,不夠「真實」而摒棄,而應該繼續以誠實的、富有成效的自我批評去推進AI發展。

譯者:boxi。

相關焦點

  • 京東AI研究院獲QuAC機器閱讀理解競賽冠軍,模型能力業界領先
    其中,在 F1-Measure(又稱為 F1-Score) 指標上達到 74.6,大幅拉近了機器與人類在該任務上的水平差距。這也意味著以零售、物流、金融、客服等優質場景為依託的京東 AI 研究院,在機器閱讀理解能力上取得了突飛猛進的成果。
  • 從京東 618 導購機器人說起,機器如何更理解人類?
    此外,JOY也強化了自己的多輪對話能力,以便應對用戶的反覆追問。在京東JOY強大的對話能力中,基於開放域目標驅動的生成式對話服務來自於人工智慧企業「深思考人工智慧」(iDeepWise.ai)。其在多模態深度語義理解、人機對話等核心AI技術上已不斷突破創新。這些新技術的不斷迭代,也在一步步推動AI實現商業化落地。AI對話機器人背後的黑科技究竟是什麼?
  • 機器視覺的定義!機器視覺的優勢究竟有哪些?
    打開APP 機器視覺的定義!機器視覺的優勢究竟有哪些?機器視覺主要用計算機來模擬人的視覺功能,從客觀事物的圖像中提取信息,進行處理並加以理解,最終用於實際檢測、測量和控制。機器視覺技術最大的特點是速度快、信息量大、功能多。 什麼是機器視覺? 機器視覺的定義:機器視覺就是使用光學非接觸式感應設備自動接收並解釋真實場景的圖像以獲得信息控制機器或流程。
  • 把英語讀成英語的能力:a man of importance什麼意思?
    把英語讀成英語的能力:a man of importance什麼意思?一、什麼是「英語閱讀」英能力訓練?這個能力是什麼?我們說的這個能力就是你閱讀時「對著英語說英語」的能力,而不是「對著英語說中文」。這個不叫做英語閱讀,這個叫做中文閱讀。二、注意英語詞彙裡有一種詞性轉換的現象。
  • 搜狗超越微軟成CoQA新紀錄保持者,閱讀理解能力可媲美人類
    2019年1月3日,搜狗搜索人工智慧研究團隊在對話型機器閱讀理解挑戰賽CoQA(Conversational Question Answering Challenge)中全面刷新所有評價指標成績,以總成績82.8%奪得第一。
  • 接力貸是什麼意思 申請接力貸需具備哪些條件
    接力貸是什麼意思 申請接力貸需具備哪些條件 來源:吉屋網綜合整理   發布時間:2016-12-01
  • 機器的「無限有趣空間」:人類將無法理解機器的崛起
    除了控制飛船和星球,指揮作戰,照顧數十億人類以外,Mind也有自己的樂趣,其中就包括超出人類理解範疇的推測計算。由於能夠在自身想像中模擬整個宇宙,一些Mind永遠地撤到了這個無限有趣的空間,這是一個只有元數學可能性的領域,只有超級人工智慧才能進入。至於剩下的我們,如果我們摒棄那道拱門的話,留給我們的只有有限樂趣,徒勞地分析機器做出的、超出我們理解的決定。
  • 科學究竟是什麼?機器研發的知識算是科學嗎?頂尖科學家給出看法
    傳統的科學和現代科學有什麼區別呢?但它的出現使得一些人對「究竟什麼是科學」產生了懷疑。在提出這類質疑的10位科學家中,領頭人就是利普森在康奈爾的同事史蒂芬·斯特勞蓋茨(Steven Strogatz)。
  • PPM單位究竟是什麼意思?
    那麼究竟什麼是PPM單位呢?PPM詞是part per million的簡稱,翻譯成中文的意思就是百萬分之分數,有點類似於我們的百分數,但要比百分數更加精準。百萬分之一的精確度是什麼概念呢?我們大致可以這樣理解,假如有毒氣體和空氣分子大小差不多,那麼100萬個空氣分子中假如有一個有毒氣體分子,氣體檢測儀就能顯示出來。據悉現在優秀的氣體檢測儀器檢測精確度已經達到0.1PPM,相當於是1000萬個空氣分子中假如有一個有毒氣體分子,氣體檢測儀就能顯示出來。
  • 話題| 機器可以「翻譯」但不能真正理解
    侯世達在17日的演講上,做了一個簡寫SEA重疊在一起的圖案,就是大海的意思,正好對應中文的「腦海」,表達了本書「類比是人類思維的燃料與火焰」的主題。湛廬文化創始人韓焱接著,《表象與本質》的中文版譯者、侯世達的同事與好友劉健教授,介紹了將《GEB》與《表象與本質》從美國介紹到中文世界的過程。
  • 自動化究竟是什麼?
    自動化港口今天給大家講解一下什麼是自動化,自動化究竟指的是什麼意思。自動化簡單來講就是控制系統和信息技術的使用,用於處理工業中的不同過程和機械以代替人。這是最基本最簡單的理解!但是使用自動化機器只有0.00001%的左右的錯誤率。自動化不在只代表降低人工成本,而是傑出的、優秀的,可以更好地完成精細的操作,來降低硬體、材料、時間、人工等等的陳本。
  • 英語My car/phone is a lemon究竟是什麼意思?
    英語My car/phone is a lemon究竟是什麼意思?是什麼樣的car or phone呢?lemon是一個我們在高中就「認識」了的英語單詞:a yellowish fruit with a very sour taste那麼,英語裡如果有人說:My car/My phone is a lemon,他想說的究竟是什麼意思?是什麼樣的car or phone呢?
  • 《道德經》:「柔弱勝剛強」這句話,究竟是什麼意思?
    老子沒有向孔子闡述什麼是道,卻在出函谷關時,特意留下五千言《道德經》給關令尹,其用意眾說紛紜,至今沒有一個統一的說法。但是從歷史看來,《道德經》對於開啟人們的智慧,的確起到了很大作用。《道德經》能開啟人們的智慧,裡面有許多的話涵義極深,很少有人能真正看懂的。
  • 究竟具備了什麼?讓固特異S210 KMAX如此與眾不同
    究竟具備了什麼?讓固特異S210 KMAX如此與眾不同   十幾年如一日奔跑在路上,輪胎不僅承載著貨物,還承載著卡友們的夢想。
  • 什麼是架構師?有何作用,成為一名架構師需要具備怎樣的能力?
    他並不是僅僅只作些表面上的修改,而是擬定了一個重建摩託羅拉整個基礎結構的計劃,這個計劃可以徹底修整公司的基礎建設,就像一個建築師設計一幢房子一樣,Redshaw 擬出了一張技術構架藍圖,一座技術性的建築,以便使被他稱作「如義大利麵條般錯亂的應用程式,機器和管線」那些東西變得井然有序。
  • 王維、楊絳與機器翻譯的本質
    翻譯:時空穿梭的旅行 侯世達教授在演講之初就問: 翻譯究竟是什麼,它可以實現什麼目的? 機器翻譯的發展之路 翻譯,是侯世達教授始終非常關注的一個研究課題。他認為,翻譯不僅指圍繞英漢、漢英之間的翻譯,也涉及到人類理解能力與機器翻譯之間的關係。
  • 如何判斷什麼才是真正的人工智慧?
    概括而言,圖靈測試是通過考察機器的外部行為來說明其內部心智的問題,即一旦機器能夠展現出與人類通過思維展現出的行為相同或相似的行為活動,則有理由相信機器與人一樣具有思維。 圖靈測試的關鍵點在於,如果通過測試,則認為機器擁有思維能力,而這項能力是智能最為重要的表現。
  • der什麼意思,你是個derder啥意思,網絡語der是什麼意思一起來看看
    最近大家是不是被網絡詞der刷屏了,例如你個der der,有地方也說也稱"得兒"或"德兒",今天我們就一起來了解看看,der這個網絡詞究竟是什麼意思。der網絡詞其實是從東北方言"得兒"或"德兒"演變而來的,主要意思是形容一個人特傻,特憨,比較彪或者虎,例如你這人真der,其中在網絡節目奇葩說中,馬東就問der是什麼意思,李佳芮的回答就是蠢、傻、虎、彪,馬東調侃自己問這問題就比較der。
  • 什麼是「分子機器」?
    近年來,「分子機器」這一詞彙逐漸出現,那麼這究竟是一種怎樣的機器呢?與宏觀機器相比,它又有什麼不同?分子機器是一種新型的分子尺寸的機器,分子機器的構件由分子單元構成。中國科學院院士田禾介紹,分子機器是模擬和參照宏觀機器進行製造的,但是是在分子的層面上。
  • 網絡語拔草是什麼意思究竟買了還是沒買 拔草出處介紹
    文章為大家詳細解釋了拔草這個詞語的意思和出處,一起來了解一下!  拔草是什麼意思究竟是買了還是沒買:  網絡詞彙,在網絡語言中,「草」字通常可以理解為長勢很兇猛的購買慾。而「拔草」一詞原本是指,「拔」除購買慾可以理解為發現之前想要購買的東西並沒有想像中那麼好,或者是因為自己囊中羞澀,因此取消原定購買計劃的意思。後來隨著使用的越來越廣泛有了如今常見的第二層含義是指將原先想要購買的東西,已經買回來了。