中國學者為 AI 系統測了測智商,Google 遙遙領先但仍不及 6 歲兒童

2021-01-11 極客公園

如果你一直很好奇各大公司的人工智慧系統跟人類比起來到底有多聰明的話,今天你將收穫一份「標準」答案。

幾天前,一篇上傳到康奈爾大學網站上的論文吸引了媒體的注意,這篇題為《人工智慧的智商評測與智能等級研究》的論文由 3 位中國學者所著,出自中國科學院虛擬經濟與數據科學研究中心,研究者們在論文中分析了 Google、微軟必應、百度和蘋果 Siri 等系統,並且為人工智慧系統劃分了 7 個智能等級。

根據作者的闡述,該論文的部分研究成果如下:

人工智慧的 IQ

AI 到底有多聰明?隨著越來越多的人開始鼓吹人工智慧威脅論,人們也開始對這個問題表現出關心,而來自中國科學院的 3 位學者也關注到了這一問題,通過研究,他們提出為人工智慧系統建立一個標準的智能模型。

為了更好的分析 AI,人類等智能體的智能水平,我們把「知識的獲取,掌握,創新和反饋」又分成 15 個小分類,從更多維度評測 AI,人類的智能。

這 15 個小分類是「圖像、文字、聲音的識別和輸出,常識、計算、翻譯、排列,創作、挑選、猜測、發現等」。

簡單來說,就是給人類和機器的智能水平建立了一個統一的標尺。

在模型建立完成後,研究團隊在 2014 年和 2016 年兩次對世界範圍內的大公司人工智慧系統進行了智商測試。

在 2014 年的測試中,他們對世界 50 個 AI 系統和 3 個不同年齡段人類進行了測試,測試結果顯示 Google、百度和搜狗在這些這些系統中表現最佳,但對比人類仍相去甚遠。

隨後 2016 年,研究團隊對 Google、百度、搜狗和蘋果 Siri、微軟小冰等人工智慧系統進行了測試,目前工作仍在進行中,不過從已經完成的工作來看,Google 和百度等人工智慧系統比起兩年前已經有了大幅的提升,但相較人類 6 歲的兒童還有一定差距。

研究者之一的劉鋒在其博客中表示,「雖然人工智慧系統,這兩年得分增長很快。但在創造性這個大分類上,得分一直進展不大。而且這個分類的權重又比較高。」

人工智慧的 7 個智能等級

根據上面的人工智慧「標準智能模型」,論文還為智能系統劃分了 7 個智能等級,從 0 級到 6 級。

第 0 級系統,其基本特徵在理論上存在,但現實中並不存在這樣的人工智慧系統。

第 1 級系統,其基本特徵是無法與人類測試者進行信息交互。

第 2 級系統,其基本特徵是能夠與人類測試者進行交互,存在控制器和存儲器,但系統內部知識庫不能增長。

第 3 級系統,其基本特徵是除具備 2 級系統的特徵外,其控制器、存儲器中包含的程序或數據可不聯網進行升級或增加。

第 4 級系統,其基本特徵除了包含 3 級系統的特徵外,最重要的是可以通過網絡與其他智能系統共享信息和知識。

第 5 級系統,最基本的特徵就是能夠創新創造,識別和鑑定創新創造對人類的價值,以及將創新創造產生的成果應用在人類的發展過程中。

第 6 級系統,最基本的特徵就是隨著時間的向前推進,並趨向於無窮點時,不斷創新創造產生新知識的智能系統其輸入輸出能力,知識的掌握和運用能力也將趨近於無窮大,按照基督教對於上帝的定義「全知和全能」,可以看出智能系統在不斷創新創造和不斷積累知識的情況下,在足夠的時間裡以人類為代表的智能系統將最終實現「全知全能」的狀態。

AlphaGo 屬於第 3 等級

規劃了系統後,論文對去年至今大熱的圍棋 AI AlphaGo 做了分析與探討,他們認為,從公開的資料看,AlphaGo 雖然可以通過網絡實現大量 CPU 和 GPU 協同工作,但是目前 Google 目前還沒有在網際網路上開放 AlphaGo 接受用戶的在線挑戰,所以該系統不具備第 4 級智能系統的條件。

論文作者認為,對人工智慧系統進行智商測試和分級有助於人們對智能系統進行分類和評判,同時也能為低等級的智能系統提供發展方向的參考。

研究團隊將在 2018 年進行第三次世界範圍內的 AI 系統智商測試,通過測試檢驗人工智慧的發展水平,並繪製出對比人類智力發展的曲線。

最後,今天下午論文作者之一劉鋒在自己的博客上對有關論文出處的誤解做了闢謠,他聲明該論文出處為中國科學院虛擬經濟與數據科學研究中心,研究者為該機構的劉鋒、石勇和劉穎,而不是很多媒體報導中的康奈爾大學。

文章插圖來源:劉鋒博客

頭圖來源:視覺中國

相關焦點

  • 中國學者為AI測智商:Google遙遙領先但仍不及6歲兒童
    幾天前,一篇上傳到康奈爾大學網站上的論文吸引了媒體的注意,這篇題為《人工智慧的智商評測與智能等級研究》的論文由 3 位中國學者所著,出自中國科學院虛擬經濟與數據科學研究中心,研究者們在論文中分析了 Google、微軟必應、百度和蘋果 Siri 等系統,並且為人工智慧系統劃分了 7 個智能等級。
  • 兒童醫院測智商爆滿 多是成績差被老師要求測
    兒童醫院測智商被擠爆 多是成績差被老師要求  這個學期開學不到兩個月,市兒童醫院兒保科變得格外忙碌,令醫生們納悶的是這個學期以來測智商的學生明顯增多,每個周六都要為這些來測智商的孩子加班。
  • 三歲的孩子智商多少算達標?你會給你家的寶寶測智商嗎?
    門薩俱樂部1946年成立於英國牛津,入會者須通過門薩智商測試,證明申請人智商處於當地人口中最高的前2%。對於10歲內的孩子,評估過程要得到教育心理學家協助。中國也有句老話,叫做三歲看大,七歲看老。意思就是說孩子在3歲時的情況,可以預測長大後的成就。
  • 青測智商人數上升 2%兒童得分超130屬極超常
    近日,英國一名11歲少女被測出智商高達162分,之後這名少女被一個名叫「門薩」的組織收為會員,青島及全國各大城市也因此掀起一股門薩測商熱。記者了解到,除了「門薩」等社會組織的推動外,近年來青島參與智力測驗的人數也在逐年上升。對此,專家表示,智商並不是一成不變的,對智力測驗市民應當理性對待。
  • 網上測智商熱試題泛濫 門薩俱樂部暫停亞洲招新
    10月6日,揚子晚報報導了只有智商超130才能加入的「門薩俱樂部」。直到昨天,稿件見報第18天了,記者還能接到來自全國各地讀者的來電,諮詢有關測智商和門薩的問題。自從三位南京門薩「天才」的稿子10月6日見報以來,記者每天都能接到不少像這樣的諮詢電話:如何加入門薩?南京哪裡能測智商?智商高低有什麼?……對「智商」這個話題,很多讀者表現了極大的興趣。而當初接受記者採訪的南京門薩會員俞善龍,這半個多月也頗為忙碌,先後有近20家國內媒體採訪過他。很多人慕名找到他,諮詢測智商的事。
  • 最強大腦這樣測出來 我市三家機構可測智商
    原標題:最強大腦這樣測出來 我市三家機構可測智商   近日,江蘇衛視綜藝節目《最強大腦》的熱播在網上掀起一股測智商熱,測智商的手機應用軟體有數十種,最火的應用下載量過萬。  智商可以網上自測嗎?科學的智商測試是怎樣的?重慶有無智商測試機構?
  • 給孩子測智商?!這事靠譜嗎?
    據捲兒媽了解,發達國家給孩子測智商相對普遍,可能他們更崇尚「先天智力」,而我們的文化更注重「後天努力」。不過兒童智商測試大都是在孩子上小學之前,而非傳說中的嬰兒期(0~3歲)。國外沒有必須對嬰幼兒做智力測試的規定。不過,由於嬰幼兒的特殊性,使得給他們做體檢和進行智力測試,看起來「很像一回事」。美國兒科醫學學會建議:從寶寶出生到3歲,要進行12次體檢。
  • 《0~6歲兒童發育行為評估量表》:261項指標測異常
    中國國家衛生健康委員會最新發布了「0~6歲兒童發育行為評估量表」,本量表於2018年正式開始實施。 1 評估前一定要了解的事 本標準適用於0歲~6歲(未滿7周歲)兒童發育行為水平的評估,是評估兒童發育行為水平的診斷量表
  • 婦幼醫院流出的0-6歲兒童智力測試表!趕緊給寶寶測一測
    本標準適用於0-6歲兒童發育行為水平的評估適應能力指兒童對其周圍自然環境和社會需要作出反應和適應能力。社會行為指對周圍人們的交往能力和生活自理能力。  測試說明:  ①測查環境安靜,光線明亮,4歲以下兒童需有家長陪同,家長在測查過程中不要暗示、啟發及誘導。  ②帶「R」的選項是表明此項可以通過詢問家長獲得。
  • AI 「智商」不及6歲小孩,如何提高他們有一招
    他們可能在為自動駕駛公司標註路上的紅綠燈和行人,也可能是在為無人售貨公司標註麵包巧克力,還可能是在為醫療肺部影像標註病毒數據。儘管阿爾法狗已經能在圍棋上戰勝人類,但主流AI 的「智商」,還不如一位6歲小孩聰明。於是標註員的工作,就像是「幼兒園老師」教會機器識別。 舉例來說,想要教會機器識別「蘋果」,在人看來很簡單的一件事,但在機器看來,蘋果的顏色、大小、甚至被咬掉了一口的蘋果,都需要大量且精準的「蘋果」AI數據進行訓練,直到「教會」機器人能識別各種不同的蘋果。
  • 人工智慧的崛起:智商測試得分超過四歲兒童
    在一項為檢測兒童智商而設計的測中,ConceptNet的得分超過了一名智商正常的四歲兒童。該測試共包含五項與詞語推理和詞彙有關的測驗,ConceptNet的總得分為69分,與之進行對比的學齡前兒童得分則為50分。並且專家認為,該系統的智能程度還會進一步加強。
  • 人工測智商存誤差?專家稱核磁共振可測特殊才能
    眼下,當得知37歲的華裔澳洲人陶哲軒以230分的IQ得分成為當今全球「最聰明」的人,在我們無限崇拜的同時,也帶著很多疑惑:無影無形的智商是怎樣被精細地測算成一個「分數」的呢?  測出「世界最高智商」的題在中國通用嗎?
  • 千萬不要帶孩子去測智商,因為人的大腦可塑性高,受到後天的影響很大
    有媽媽留言問:智商怎麼測?幾歲可以測智商?我們以韋克斯勒(簡稱韋氏)智商測驗為例,來了解一下。 它經過幾個版本的更新升級,第一版出現在1949年,最新版本是2014年秋天發布的第五版,是目前常用的兒童智商測量工具,經常被心理學家和教育專家應用於世界各地的學校和專業中心。
  • 期中考試成績出爐 杭州七醫院測智商的孩子多了三成
    浙江在線11月07日訊這段時間,杭州市七醫院兒童心理科格外火爆,大多都是家長領著孩子來測智商的。  為什麼近期來測智商的孩子特別多?兒童心理科主任周國嶺告訴記者,杭州大部分學校期中考試成績單剛出爐,不少家長對自己孩子的成績不滿意,擔心孩子智商不夠高,所以就想來做個測試,看看孩子的學習成績究竟跟智商扯不扯得上關係。  據醫院初步統計,近期到醫院來測智商的孩子比往常增加了三成,而且後面還排著許多預約號。  孩子的學習成績優劣是否和智商高低成正比?盲目測智商是否會對孩子的心理健康產生消極影響?
  • 筆記|《心測》C10 測驗等值 & C12 能力測驗(上)
    (2)斯坦福—比內量表①1916年推孟發表了斯坦福—比內量表,首次引入比率智商的概念,開始以IQ作為個體智力水平的指標;②1937年第一次修訂,由L型和M型兩個等值量表構成,適用年齡擴展到1.5-18歲。③1960年捨棄了比率智商,引入了離差智商的概念,以平均數100、標準差為16的離差智商作為智力評估指標。
  • 一口唾液就能測智商 測道德?長沙現天賦 美容等基因檢測
    一口唾液就能測智商 測道德?近日,記者調查發現長沙也有這樣的產品在售,商家宣稱,通過對人的唾液、口腔內壁細胞等進行基因檢測,就可獲知其智商多高、情商如何,甚至連道德、領導力等也可測出。專家提醒,基因檢測技術在國內尚處起步階段,不少機構存在誇大檢測功能、誤導消費者等問題。   【天賦基因檢測】智商 道德都可測?
  • 爸爸嫌9歲兒子數學考80分 覺其智商低要做測試
    200孩子測智商  醫生說 6歲以上絕大多數孩子沒必要做此測試  學習「不好」,需要測智力嗎?  暑假40多天,兒童醫院200人測智商  昨日下午4點,秋雨綿綿,西安市兒童醫院兒保科智力測試室外,家長和患兒都不是很多。一個護士告訴記者,小孩做智力測試的時間不等,因為「孩子和孩子的反應不一樣」。  「假期的時候,我們一天平均能接待五六個要求給兒童測智商的家長。」
  • 研究表明:人工智慧的智商已達4歲兒童水平
    最近,一系列旨在測試一些世界上最好的人工智慧(AI)系統和人類智商(IQ)之間的勝負關係的試驗表明,人工智慧的智力目前已經達到了 4 歲兒童的水平。
  • 這5道智力題,聽說智商150的人才能答對!快來測一測
    這5道智力題,聽說智商150的人才能答對!快來測一測人的智商是可以通過測試得出來的,據說下面這5道智力題,只有智商150的人才能答對!快來測一測,看看準不準!知道答案的網友 ,記得把答案寫下來,告訴一下像小編這樣智商一般的人哈。
  • 一滴唾液就能測兒童天賦受家長追捧 項目利潤嚇人
    「唾液測兒童天賦」項目利潤超70%?  專家表示 僅靠一個基因去推測孩子是否有天賦是不負責任的  近日,北京青年報記者注意到,一種名叫「兒童天賦基因檢測」的服務項目在電商平臺上悄然流行開來,價格從數百元到數萬元不等,其賣點是「一滴唾液就能檢測出孩子具備的天賦」,以幫助家長「定向培養」。  這種基因檢測方法可信嗎?