清華唐傑:GPT-3表示能力已經接近人類,但它有一個阿喀琉斯之踵

2021-01-09 量子位

編輯部 整理自 MEET 2021量子位 報導 | 公眾號 QbitAI

人工智慧,現在發展到什麼階段了?

從發展脈絡上看,從符號智能、感知智能,現在應該到認知智能階段了。

或者說,我們正走在認知智能的路上。

今年大火的GPT-3,其參數量已然達到了千億級別,規模已經接近人類神經元的數量了。

這說明,GPT-3的表示能力已經接近人類了,但它仍有一些認知局限——沒有常識。

那我們何時、又將如何走向認知智能?

未來計算機的認知能力,能否超過人類?

什麼樣的模型可以驅動未來的認知AI?

認知智能的概念是否又該重新定義?

……

在MEET 2021 智能未來大會現場,清華大學計算機系教授、系副主任唐傑用簡單、通俗的例子為我們一一解答。

當時聽完演講的觀眾直呼:求唐傑老師的PPT!

(在不改變原意的基礎上,量子位對唐傑的演講進行了編輯整理)

關於MEET 智能未來大會:MEET大會是由量子位主辦的智能科技領域頂級商業峰會,致力於探討前沿科技技術的落地與行業應用。本次大會現場有李開復等20餘位行業頂級大咖分享,500餘名行業觀眾參與,超過150萬網友在線收看直播。包括新華社、搜狐科技、澎湃新聞、封面新聞等數十家主流媒體在內紛紛報導,線上總曝光量累計超過2000萬。

亮點

1、認知圖譜有了一個全新概念,它包含三個核心要素:常識圖譜、邏輯生成以及認知推理。

2、GPT-3參數規模已經接近人類神經元的數量,這說明它的表示能力已經接近人類了。但是它有個阿喀琉斯之踵——沒有常識。

3、數據+知識雙重驅動,也許是解決未來認知AI的一個關鍵。

4、用計算模型來解決認知是不夠的,未來需要構建一個真正能夠超越原來的,超越已有模型的一個認知模型。

5、通用人工智慧還有多遠?我們希望它有持續學習的能力,能從已有的事實,從反饋中學到新的東西,能處理一些更複雜的任務。

為什麼是認知圖譜

我給今天的分享起了一個新名字:「認知圖譜:人工智慧的下一個瑰寶」。

為什麼叫認知圖譜?首先看一下人工智慧發展的脈絡。

從最早的符號智能,再到後面的感知智能。最近,所有人都在談論認知智能。

我們現在需要探討「計算機有沒有認知」、「計算機能不能做認知、推理」、「計算機到未來有沒有意識,能夠超過人類」這些問題。

人工智慧發展到現在已經有三個浪潮,我們把人工智慧叫做三個時代分別是符號 AI、感知 AI 和認知 AI,現在正處在實現認知AI的路上。

具體如何實現呢?

我認為需要一些基礎性的東西,比如裡面的認知圖譜怎麼構建,裡面認知的一些邏輯,包括認知的基礎設施怎麼建,這也是我們特別想做的一件事情。

回顧機器學習的發展歷程,首先想到的就是很多分類模型,比如決策樹,貝葉斯、神經網絡……

最左邊是分類模型、序列模型、概率圖模型,往右一點是最大化邊界,深度學習,循環智能,隨後是強化學習、深度強化學習,以及最近常提及的無監督學習。

機器思考VS人類思考

機器學習發展到現在,離認知到底還有多遠?

於是,我整理了很多諾貝爾獎和圖靈獎得主的研究,對比了人的認知與機器認知之間的發展模式。

在探究人類思考的歷程裡,1900年初才有了神經系統結構的第一次解析,隨後在1932年左右,誕生了一個諾獎級的研究:神經元功能「突觸」。

然後就是神經末梢傳遞機制、視覺系統機理、嗅覺系統機理……直到幾年前,科學家們才探索出人的大腦是如何實現定位導航、以及機理是怎麼回事,這也是一個諾獎的研究。

我們來看下機器是如何思考的。

1950年左右,學者創立了人工智慧系統,但是1970年左右大家開始拼命去模仿人腦,我們要做一個計算機,讓他跟人腦特別相同。

1990年左右,科學家突然發現其實沒有必要模仿,更多的應該是去參考人腦,參考腦系統,做一個有更多機器思考、機器思維的計算機。

所以在當前這個時代,我們應該用更多的計算機思維,來做計算機的思考,而非人的思考。

因此在這之後,就出現了概率圖模型、概率與因果模型以及深度學習。當然,有人會說,到最後你還在講機器學習,在講一個模型,這個離我們真正的認知智能是不是太遠了?

用計算的方式打造通用人工智慧

過去幾年連我自己都不信,我們可以建造一個通用人工智慧,讓計算機系統甚至能夠超越人。

舉一個例子,OpenAI。

兩年前,OpenAI做了**GPT,所有人都覺得只是一個很簡單的語言模型,並不會有什麼水花;

去年,GPT升級成GPT-2,15億的參數規模。很多人都可能玩過它的Demo,叫talk to transformer。你可以輸入任何文本,transformer幫你把文本補齊。

但在今年6月份的時候,OpenAI發布了一個GPT-3,參數規模一下子達到了1750億,數量級接近人類的神經元的數量。

這個時候給我們帶來了極大的震撼,至少說明GPT-3的表示能力已經接近人類了。

意味著理論上,如果我們能讓計算機參數達到最好,GPT-3可能跟人這種智商表現差不多。

這時候給我們另外一個啟示:

我們到底是不是可以直接通過計算機的結果,也就是計算的方法得到一個超越人類的通用人工智慧?

我們來看一下整個模型過去幾年發展的結果,幾乎每年參數規模是10倍左右的增長,右邊的圖給出了自然語言處理中最近幾年的快速變化,幾乎是一個指數級的變化。

可以看到,前幾年變化相對比較小,今年出了GPT-3,谷歌到了6000億的產出規模,明年ds可能還會到萬億級別。所以這是一個非常快速的增長。

現在,則給到我們另外一個問題,

我們到底能不能用這種大規模、大算力的方法,大計算的方法,來實現真正的人工智慧呢?

與此同時,也暴露出另一個痛點——成本問題。

GPT-3,如果用單卡的訓練需要355年,整個訓練成本將達到幾億人民幣,一般的公司是做不起來的。

但就算是有網際網路巨頭願意去做,大家是不是都可以用了?

GPT-3有個阿喀琉斯之踵

不著急。先來看看這樣一個例子,左邊是GPT-3模型,右邊是結果。

第一個是長頸鹿有幾個眼睛?GPT3說有兩個眼睛,沒有問題。

第二個問題,我的腳有幾個眼睛?結果是也有兩個眼睛,這就錯了。

第三個,蜘蛛有幾個眼睛?8個眼睛。

第四個太陽有幾個眼睛?一個眼睛。

最後一個問題,一根草有幾個眼睛?一個眼睛。

可以看到,GPT3很聰明,可以生成所有的結果,但它有個阿喀琉斯之踵——沒有常識。

這時候就需要一個常識的知識圖譜。

2012年,谷歌發出了一個Knowledge Graph,就是知識圖譜。

當時的概念是,我們利用大量的數據能不能建一個圖譜?於是在未來的搜索中,可以自動把搜索結果結構化,自動的結構化的數據反饋出來。

知識圖譜不僅可以應用到搜尋引擎,還可以給計算機帶來一些常識性的知識。

因此,我們是否可以通過這一方法來幫助未來的計算呢?

「數據+知識」驅動未來的認知AI

其實,知識圖譜在很多年前就已經發展起來。

從第一代人工智慧——符號AI的時候,就已經開始在做,當時將知識圖譜定義為「符號 AI 的邏輯表示」。

但到現在也還沒有大規模的發展起來,主要有幾個方面的原因。

第一,構建的成本非常的高。

CYC,最早的知識圖譜之一,負責定義知識斷言。

簡單來說就是,一個ABC三元組,A 就是主體,B 就是關係,C是受體。

比如,人有手,人就是主體,有就是關係,手就是受體。

這麼一個簡單的問題,成本就在5.7 美元。

第二,自動構建精度很低。

另一個典型的知識圖譜NELL,網際網路完全自動方法的生成出來,但錯誤率一下子提高到10倍。

這兩個項目目前基本上都處於半停滯狀態。

於是,我們現在就在思考,若是將上述兩種方式結合在一起,是否能夠驅動認知AI?

第一,從大數據的角度,做數據驅動。用深度學習舉十反一的方法,把所有的數據進行建模,並且學習數據之間的關聯關係,學習數據的記憶模型。

第二,我們要用知識驅動,構建一個知識圖譜,用知識驅動整個事情。

我們把兩者結合起來,這也許是解決未來認知 AI 的一個關鍵。

當然這些也還不夠。我們的未來是需要構建一個真正能夠超越原來的、已有模型的一個認知模型。

我們需要一個全新的架構框架,也需要一個全新的目標函數,這時候才有可能超過這樣的預訓練模型,否則就是在跟隨 GPT-3。

而放在眼下要做的,就是讓機器有一定的創造能力,光文本還不夠,我們希望創造出真正的圖片,它是創造,不是查詢。

比如,機器可以通過文字,將原有的圖片生成新的圖片。

當然,光創造還不夠,我們離真正通用的人工智慧還有多遠?

我們希望真正的通用人工智慧有持續學習的能力,能夠從已有的事實,從反饋中學習到新的東西,能夠完成一些更加複雜的任務。

認知AI的九準則

這時候,再回到起初最基本的問題:什麼叫認知?

只要有可持續學習的能力就是認知嗎?

如果這樣的話,GPT-3也有持續學習的能力,知識圖譜也有學習的能力,因為它在不停的更新。

如果能完成一些複雜任務就是認知嗎?

也不是,我們已經有些系統已經可以完成非常複雜的問題。

那什麼是認知呢?

最近,通過我們的一些思考,定義了認知 AI 的九準則。這九個準則是我從人的認知和意識中抽象出來的九個準則。

第一個,叫適應與學習能力。

比如說今天MEET 大會,機器人自動學習,可以知道在這個特定的場景下應該做什麼事情。

第二個,叫定義與語境能力。

模型能夠在特定語境下感知上下文,對環境有一定的感知能力。

第三個,叫自我系統的準入能力。

機器能夠自定義什麼是我,什麼是非我,這叫人設。如果這個機器能知道自己的人設是什麼,那麼我們認為它有一定的認知能力。

第四個,優先級與訪問控制能力。

在一定的特定場景下它有選擇的能力。我們人都可以在雙十一選擇購物,如果機器在雙十一的時候能選擇我今天想買點東西,明天后悔了,不應該買。

這時候機器有一定的優先級和訪問控制。

第五個,召集與控制能力。這個機器應該有統計和決策的能力。

第六個,決策與執行能力,機器人在感知到所有的數據以後可以做決策。

第七個,錯誤探測與編輯能力。

這個非常重要,人類的很多知識都在試錯中發現的。比如現在學的很多知識,我們並不知道什麼知識是最好的。

我們需要不停的試錯,也許我們今天學到了1+1=2 是很好,但是你嘗試1+1=3,1+1=0,是不是也可以呢?你嘗試完了發現都不對,這叫做錯誤探測與編輯,讓機器具有這個能力,非常地重要。

第八個,反思與自我控制、自我監控。

如果這個機器人在跟你聊天的過程中,聊了很久,說「不好意思我昨天跟你說的一句話說錯了,我今天糾正了。」這時候機器具有反思能力。

最後,這個機器一定要有條理和理性。

一個面向認知的AI架構

在九個準則的基礎上,我們提出了一個全新的認知圖譜的概念。

主要有三個核心要素。

第一個,常識圖譜,這與知識圖譜的幾個要素非常相關。比如說高精度知識圖譜的構建、領域知識圖譜的應用系統、超大規模知識圖譜的構建,還有基於知識圖譜的搜索和推薦,這是傳統的一些東西。

第二個,邏輯生成。這需要超大規模的預訓練模型,並且能夠自動進行內容生成。同時我們在未來可以構建一個數字人的系統,它能夠自動的在系統中,能夠生成相關的東西,能夠做得像人一樣的數字人。

第三個,認知推理。讓計算機有推理、有邏輯的能力。

這時候說起來比較虛,用人的認知來通俗理解一下。

人的認知有兩個系統,一個叫系統1,一個叫系統2。

系統1就是計算機做的匹配。

你說,清華大學在哪?它便立刻匹配出來北京。

但如果你要是問,清華大學在全球計算機裡到底排第幾?以及為什麼是這個名次?

這時候計算機就回答不了,這就需要一定的邏輯推理,也就是系統2所做的事情。

當前所有的深度學習都是做系統1,解決了系統1問題——直覺認知,而不是邏輯認知。

因此在未來,我們要做更多關於系統2的事情。

從腦科學來看,相對現在做的事情有兩個最大的不同,第一,就是記憶,第二就是認知推理。

記憶是通過海馬體實現,認知是前額葉來實現。這兩個系統非常關鍵,如何實現呢?

我們看記憶模型,巴德利記憶模型分三層,短期記憶就是一個超級大的大數據模型。

在大數據模型中,我們怎麼把大數據模型中有些信息變成一個長期記憶變成我們知識,這就是記憶模型要做的事情。

那認知模型呢?我們構建了一個面向認知的AI架構。

這個框架左邊是一個查詢接口,這是輸入,也可以說成是用戶端。

中間是一個超大規模的預訓練模型,然後是一個記憶模型。

記憶模型通過試錯、蒸餾,把一些信息變成一個長期記憶存在長期記憶模型中。

長期記憶模型中會做無意識的探測,也會做很多自我定義和條理的邏輯,並且做一些認知的推理。

在這樣的基礎上我們構建一個平臺。最終目標是打造一個知識和認知推理雙輪驅動的一個框架。底層是分布式的存儲和管理,中間是推理、決策、預測,再上面是提供各式各樣的API。

好,我今天大概就把我們的理念和想法給大家介紹一下,如果大家有興趣的話,可以查閱我們更多的信息。

謝謝大家!

相關焦點

  • 習近平:創新能力不強是我國發展的「阿喀琉斯之踵」
    原標題:創新能力不強是我國發展的「阿喀琉斯之踵 ◎內蒙古自治區中國特色社會主義理論體系研究中心 我國創新能力不強,科技發展水平總體不高,科技對經濟社會發展的支撐能力不足,科技對經濟增長的貢獻率遠低於發達國家水平,這是我國這個經濟大個頭的「阿喀琉斯之踵」。
  • 什麼是阿喀琉斯之踵?寓意深刻的古希臘神話與寓言
    阿喀琉斯之踵(Achilles' Heel),原指阿喀琉斯的腳跟,因是其唯一一個沒有浸泡到神水的地方後人常以「阿喀琉斯之踵」譬喻這樣一個道理:即使是再強大的英雄,他也有致命的死穴或軟肋。傳說荷馬史詩中的英雄阿喀琉斯,是凡人珀琉斯和美貌仙女忒提斯的寶貝兒子。
  • Alina塔羅佔卜——小人與阿喀琉斯之踵
    Alina塔羅佔卜——我的性格特點及在人際關係中的近況、對策中提到的)阿喀琉斯是古希臘神話中的英雄。阿喀琉斯是凡人珀琉斯和海洋女神忒提斯在阿喀琉斯剛出生時就捏住他的腳後跟將其倒提著浸入可是令人遺憾的是,阿喀琉斯的腳後跟由於被母親的手提著,因此並未沾到冥河水。這成了他全身留下的唯一的弱點。後來,在特洛伊戰爭中,阿喀琉斯被帕裡斯一箭射中腳踝而死去。
  • 再有本事的人,也有「阿喀琉斯之踵」,這六字是保護它的不二法門
    爺爺說,古希臘神話中有個著名人物,叫阿喀琉斯。阿喀琉斯,是凡人英雄珀琉斯和海洋女神忒提斯的愛子。忒提斯為了讓兒子煉成「金鐘罩」,在他剛出生時就將其倒提著浸進冥河。遺憾的是,阿喀琉斯被母親捏住的腳後跟卻不慎露在水外,在全身留下了唯一一處「死穴」。後來,阿喀琉斯被帕裡斯一箭射中腳踝而死去,所以,大家常以「阿喀琉斯之踵」來說明這樣一個道理:即使是再有本事的人,也有致命的死穴或軟肋。
  • 唐本忠:獨闢蹊徑 打破光材料「阿喀琉斯之踵」
    唐本忠:獨闢蹊徑 打破光材料「阿喀琉斯之踵」 近年來,隨著人們對發光標記材料探索的深入,它的應用已進入高靈敏生物檢測、成像和診療等領域。唐本忠說,螢光成像技術因其高靈敏、無損、生物相容性好、成本低廉等優點,越來越多地被用於癌症早期診斷中。製備發光性能優異的先進材料,一直是科學家的追求目標。然而,很多發光材料只有在溶液中才有較高的發光效率。
  • 《特洛伊》:以阿喀琉斯之名
    母親早已預言了阿喀琉斯的命運:他為這場戰爭而生,也將為這場戰爭而亡。 阿喀琉斯,即便他相信自己是天神子嗣,以希臘人的信仰,這也並不予人不死之身。但奧德賽的一句話「參戰的英雄,都將千古留名」就讓他心甘情願地走向戰場。阿喀琉斯與母親談話拒絕參戰,他會有妻子和子女,死後他的子孫會記得他,但很快也會忘記。
  • 《摩天營救》:空軍一號裡的阿喀琉斯
    &nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp《摩天營救》:空軍一號裡的阿喀琉斯&nbsp&nbsp&nbsp&nbsp《摩天營救》的故事結構和1997
  • 希臘神話(五十三):特洛伊戰爭中的第一勇士 - 阿喀琉斯
    佩琉斯和忒提斯結合生下的兒子就是阿喀琉斯,具有半神血統的希臘聯軍第一勇士。致命弱點雖然身為半神擁有強大的力量,但並沒有獲得不老不死的能力。無論是哪個原因,阿喀琉斯都通過母親忒提斯的加護擁有了刀槍不入的身體,唯獨腳踵成了他的致命弱點。參戰忒提斯早在特洛伊戰爭爆發之前就通過一個關於阿喀琉斯的預言得知自己的兒子將名垂青史,卻會早逝。為了讓阿喀琉斯遠離戰場,忒提斯將他託付給斯庫羅斯島的國王呂科墨得斯,將其偽裝成女孩在宮中秘密養大。
  • 毫釐之差!馬龍的「阿喀琉斯之踵」被樊振東找到,丟冠後搖頭嘆氣
    今天晚上桌球世界盃決賽中,樊振東以4-3戰勝隊友馬龍,繼2016、2018和2019年後第四次捧杯,也由此追平了前國手馬琳的奪冠次數紀錄。這場比賽3-1領先的樊振東一度被馬龍追至3-3平,不過第六局他在1-10落後的情況下連續挽救6個局點,也為決勝局埋下伏筆。
  • 帕特克羅斯,阿喀琉斯悲慟之源,希臘人獲勝的關鍵性死亡
    當宙斯看著赫克託耳的所作所為,特別是那副送給忒提斯婚禮的鎧甲被穿在赫克託耳身上,宙斯動怒了,已經起了殺心。後面不可避免的赫克託耳被阿喀琉斯所殺,為摯友報了仇。這裡重點要說明的是,獲知帕特克羅斯死訊的阿喀琉斯表現出了異常的悲痛。
  • 無人船的阿喀琉斯之踵是什麼?
    然而,隨著網絡安全不斷威脅著各行各業,這項新生的技術也成了一個龐大的攻擊對象。如果說自主航行船舶是海運行業的未來,那麼網絡威脅就是它的阿喀琉斯之踵。羅羅公司已經推出了一艘自動化拖輪,系統供應商瓦錫蘭正在測試自動化靠泊解決方案,在這兩項設計中,網絡安全都是不可分割的一部分。
  • FGO阿喀琉斯寶具技能怎麼樣?阿喀琉斯寶具如何?
    FGO阿喀琉斯近期上線,五星金卡。FGO阿喀琉斯寶具怎麼樣?FGO阿喀琉斯技能怎麼樣?小編艾米分享下FGO阿喀琉斯寶具技能,供參考。  FGO阿喀琉斯寶具怎麼樣?FGO阿喀琉斯技能怎麼樣?
  • 文藝系句子‖你是我的阿喀琉斯之踵,魯伯特之淚的尾巴
    你是我的阿喀琉斯之踵,魯伯特之淚的尾巴。You are my Achilles' heel, the tail of Rupert's tears.我深知自己並不優秀,遇到一些像太陽的人,我也許追趕不上,但是可以學著他們奔跑的樣子,也往前走上兩步。
  • 外媒:中國能源安全的阿喀琉斯之踵——中東石油
    參考消息網9月12日報導 日本外交學者網站9月8日刊登題為《中國能源安全的阿喀琉斯之踵:中東石油》一文。作者為美國大西洋理事會布倫特·斯考克羅夫特國際安全問題研究中心中東和平與安全倡議項目助理歐文·丹尼爾斯和大西洋理事會全球能源中心項目助理克裡斯·布朗。
  • 中國人崇拜聖人,為什麼西方人崇拜像阿喀琉斯這樣的悲劇英雄?
    你看,偉大的阿喀琉斯不就是被太陽神射死了嗎?在特洛伊戰爭中,阿喀琉斯是希臘聯軍中武藝最高強,最英勇無畏的英雄戰將。特洛伊將領中唯一有能力和阿喀琉斯相抗衡的是赫克託爾。赫克託爾也是神的兒子,他是特洛伊人中武藝最高強、最勇敢的戰將。
  • 希臘戰神阿喀琉斯故事 英勇暴躁但珍視友誼 把勇敢視為最高榮譽
    阿喀琉斯,又譯阿基裡斯、阿基琉斯、阿奇裡斯、阿克琉斯。是荷馬史詩《伊利亞特》中描繪特洛伊戰爭第十年參戰的半神英雄。海洋女神忒提斯和英雄珀琉斯之子。阿喀琉斯故事:2、 英勇暴躁據傳,阿喀琉斯是人間國王珀琉斯與海洋女神忒提斯結婚生下的兒子,具有健美的肌體、無敵的武藝和忘我戰鬥的冒險性格。神諭他有兩種命運:或默默無聞而長壽,或在戰場上光榮地死亡。
  • 跨越不平等陷阱|發展中國家的阿喀琉斯之踵
    從歷史的經驗看,不平等不僅對發達國家有重大影響,對發展中國家經濟社會發展的影響則同樣深遠。第二次世界大戰以來,世界上有11個發展中國家實現了從低收入向高收入的跨越,成為發達經濟體,分別是葡萄牙、西班牙、希臘、波蘭、斯洛伐克、愛沙尼亞、以色列、賽普勒斯、韓國、日本和新加坡。這些經濟體的共同特徵是在其高速增長階段收入差距都比較小。
  • IGN評分8分的《全面戰爭傳奇:特洛伊》,2分的「阿喀琉斯之踵」
    本作取材與荷馬的《伊利亞特》,整個遊戲將會從兩個視角來還原歷史上的特洛伊之戰,分別是希臘和特洛伊。在聊遊戲前,我們先簡單的了解一下歷史上的「特洛伊之戰」。「特洛伊之戰」對於稍稍了解希臘歷史的人來說,都是耳熟能詳的。在特洛伊之戰中,有一位重要的角色,一個名叫「海倫」的女子,據說她是當時世界上最美麗的女子,而特洛伊之戰的目的正是為了爭奪「海倫」。
  • 機場成亞洲航空繁榮的阿喀琉斯之踵 印尼尤甚
    為此,它開除了航空官員、聘請了安全專家並收緊了航空監管。  然而,印尼作出的努力掩飾了一個根本性問題:儘管它在新航站樓上投入巨資,但有些機場的設備配備仍然非糟糕,不足以處理過去十年來飆升的客流量。隨著數百萬旅客開始首次乘坐飛機出行,同時機場安全投入未能跟上,這一隱患在亞洲其它地區也存在著。
  • 特洛伊木馬屠城,你只記住了勇士阿喀琉斯……
    2PAC的匪幫說唱與特洛伊戰爭特洛伊戰爭是以爭奪世上最漂亮的女人海倫為起因,以阿伽門農及阿喀琉斯為首的希臘聯軍進攻以帕裡斯及赫克託爾為首的特洛伊城的十年攻城戰他們對地中海沿岸最富有的地區早就垂涎三尺,一心想佔為己有,於是以海倫為藉口發動戰爭,這才是特洛伊戰爭的真正目的……