中國學者為AI測智商:Google遙遙領先但仍不及6歲兒童

2020-11-30 千龍網

如果你一直很好奇各大公司的人工智慧系統跟人類比起來到底有多聰明的話,今天你將收穫一份「標準」答案。

幾天前,一篇上傳到康奈爾大學網站上的論文吸引了媒體的注意,這篇題為《人工智慧的智商評測與智能等級研究》的論文由 3 位中國學者所著,出自中國科學院虛擬經濟與數據科學研究中心,研究者們在論文中分析了 Google、微軟必應、百度和蘋果 Siri 等系統,並且為人工智慧系統劃分了 7 個智能等級。

根據作者的闡述,該論文的部分研究成果如下:

人工智慧的 IQ

AI 到底有多聰明?隨著越來越多的人開始鼓吹人工智慧威脅論,人們也開始對這個問題表現出關心,而來自中國科學院的 3 位學者也關注到了這一問題,通過研究,他們提出為人工智慧系統建立一個標準的智能模型。

為了更好的分析 AI,人類等智能體的智能水平,我們把「知識的獲取,掌握,創新和反饋」又分成 15 個小分類,從更多維度評測 AI,人類的智能。

這 15 個小分類是「圖像、文字、聲音的識別和輸出,常識、計算、翻譯、排列,創作、挑選、猜測、發現等」。

簡單來說,就是給人類和機器的智能水平建立了一個統一的標尺。

在模型建立完成後,研究團隊在 2014 年和 2016 年兩次對世界範圍內的大公司人工智慧系統進行了智商測試。

在 2014 年的測試中,他們對世界 50 個 AI 系統和 3 個不同年齡段人類進行了測試,測試結果顯示 Google、百度和搜狗在這些這些系統中表現最佳,但對比人類仍相去甚遠。

隨後 2016 年,研究團隊對 Google、百度、搜狗和蘋果 Siri、微軟小冰等人工智慧系統進行了測試,目前工作仍在進行中,不過從已經完成的工作來看,Google 和百度等人工智慧系統比起兩年前已經有了大幅的提升,但相較人類 6 歲的兒童還有一定差距。

研究者之一的劉鋒在其博客中表示,「雖然人工智慧系統,這兩年得分增長很快。但在創造性這個大分類上,得分一直進展不大。而且這個分類的權重又比較高。」

人工智慧的 7 個智能等級

根據上面的人工智慧「標準智能模型」,論文還為智能系統劃分了 7 個智能等級,從 0 級到 6 級。

第 0 級系統,其基本特徵在理論上存在,但現實中並不存在這樣的人工智慧系統。

第 1 級系統,其基本特徵是無法與人類測試者進行信息交互。

第 2 級系統,其基本特徵是能夠與人類測試者進行交互,存在控制器和存儲器,但系統內部知識庫不能增長。

第 3 級系統,其基本特徵是除具備 2 級系統的特徵外,其控制器、存儲器中包含的程序或數據可不聯網進行升級或增加。

第 4 級系統,其基本特徵除了包含 3 級系統的特徵外,最重要的是可以通過網絡與其他智能系統共享信息和知識。

第 5 級系統,最基本的特徵就是能夠創新創造,識別和鑑定創新創造對人類的價值,以及將創新創造產生的成果應用在人類的發展過程中。

第 6 級系統,最基本的特徵就是隨著時間的向前推進,並趨向於無窮點時,不斷創新創造產生新知識的智能系統其輸入輸出能力,知識的掌握和運用能力也將趨近於無窮大,按照基督教對於上帝的定義「全知和全能」,可以看出智能系統在不斷創新創造和不斷積累知識的情況下,在足夠的時間裡以人類為代表的智能系統將最終實現「全知全能」的狀態。

AlphaGo 屬於第 3 等級

規劃了系統後,論文對去年至今大熱的圍棋 AI AlphaGo 做了分析與探討,他們認為,從公開的資料看,AlphaGo 雖然可以通過網絡實現大量 CPU 和 GPU 協同工作,但是目前 Google 目前還沒有在網際網路上開放 AlphaGo 接受用戶的在線挑戰,所以該系統不具備第 4 級智能系統的條件。

論文作者認為,對人工智慧系統進行智商測試和分級有助於人們對智能系統進行分類和評判,同時也能為低等級的智能系統提供發展方向的參考。

研究團隊將在 2018 年進行第三次世界範圍內的 AI 系統智商測試,通過測試檢驗人工智慧的發展水平,並繪製出對比人類智力發展的曲線。

最後,今天下午論文作者之一劉鋒在自己的博客上對有關論文出處的誤解做了闢謠,他聲明該論文出處為中國科學院虛擬經濟與數據科學研究中心,研究者為該機構的劉鋒、石勇和劉穎,而不是很多媒體報導中的康奈爾大學。

相關焦點

  • 中國學者為 AI 系統測了測智商,Google 遙遙領先但仍不及 6 歲兒童
    幾天前,一篇上傳到康奈爾大學網站上的論文吸引了媒體的注意,這篇題為《人工智慧的智商評測與智能等級研究》的論文由 3 位中國學者所著,出自中國科學院虛擬經濟與數據科學研究中心,研究者們在論文中分析了 Google、微軟必應、百度和蘋果 Siri 等系統,並且為人工智慧系統劃分了 7 個智能等級。
  • 兒童醫院測智商爆滿 多是成績差被老師要求測
    兒童醫院測智商被擠爆 多是成績差被老師要求  這個學期開學不到兩個月,市兒童醫院兒保科變得格外忙碌,令醫生們納悶的是這個學期以來測智商的學生明顯增多,每個周六都要為這些來測智商的孩子加班。
  • 三歲的孩子智商多少算達標?你會給你家的寶寶測智商嗎?
    門薩俱樂部1946年成立於英國牛津,入會者須通過門薩智商測試,證明申請人智商處於當地人口中最高的前2%。對於10歲內的孩子,評估過程要得到教育心理學家協助。中國也有句老話,叫做三歲看大,七歲看老。意思就是說孩子在3歲時的情況,可以預測長大後的成就。
  • 青測智商人數上升 2%兒童得分超130屬極超常
    近日,英國一名11歲少女被測出智商高達162分,之後這名少女被一個名叫「門薩」的組織收為會員,青島及全國各大城市也因此掀起一股門薩測商熱。記者了解到,除了「門薩」等社會組織的推動外,近年來青島參與智力測驗的人數也在逐年上升。對此,專家表示,智商並不是一成不變的,對智力測驗市民應當理性對待。
  • 人工智慧的崛起:智商測試得分超過四歲兒童
    在一項為檢測兒童智商而設計的測中,ConceptNet的得分超過了一名智商正常的四歲兒童。該測試共包含五項與詞語推理和詞彙有關的測驗,ConceptNet的總得分為69分,與之進行對比的學齡前兒童得分則為50分。並且專家認為,該系統的智能程度還會進一步加強。
  • 網上測智商熱試題泛濫 門薩俱樂部暫停亞洲招新
    揚子晚報記者 張筠  智商測試熱  天天有讀者來電問智商 到腦科醫院測智商的人多了兩成  「我兒子也蠻聰明的,到哪能測一下?」昨天上午,上海市民錢先生給記者打來電話,說他估計自己上高二的兒子智商一定不低,他覺得兒子很有加入門薩的潛質。
  • AI智商不如6歲兒童?卻將帶來場景與效率革命
    國內國外很多研究證明,人工智慧系統雖然不斷發展升級,但大多數AI的「智商」,哪怕相較人類6歲的兒童也有不小差距。但這並不能阻礙AI在某些應用場景中的落地,美國哲學家約翰·塞爾曾將人工智慧劃分為「弱人工智慧」和「強人工智慧」。弱人工智慧雖然沒有意識,但屬於擅長於單個方面的人工智慧。也就是說,在與傳統產業及特定場景的結合中,AI仍有巨大的發揮空間。
  • 8歲兒童智商發育標準
    兒童智商發育標註 6一7歲能從 7一8歲會讀、寫3位數的數字,能從小到大或從大到小任意數5個數;能做2位數的加減法,能熟練使用乘法表;能使用常見的度量衡,並清楚相互關係;認識鐘錶時間;能進行一般閱讀,並加以理解;明白不同的人有著自己不同的職業和謀生方式;堅持作摘記、讀書筆記;能做簡單的計劃,並去達成計劃;知道傳記、詩歌、散文等文學形式,懂得區分虛構和非虛構作品;開始獨立運用工具和資料研究動物、
  • 研究表明:人工智慧的智商已達4歲兒童水平
    最近,一系列旨在測試一些世界上最好的人工智慧(AI)系統和人類智商(IQ)之間的勝負關係的試驗表明,人工智慧的智力目前已經達到了 4 歲兒童的水平。
  • 給孩子測智商?!這事靠譜嗎?
    一提到孩子的智力,很多寶媽就淡定不下來了:孩子走路、說話,比別人早一點,心中就暗喜:我娃智力過人!孩子怯生、不愛說話,立馬聯想到智力問題,急三火四帶去測智商。這些做法對孩子好不好?究竟要不要給孩子測智商?今天,口袋育兒(微信:koudaiyuer)就跟大家聊聊「嬰兒智力測試」的話題。1 | 什麼是嬰兒智力測試?
  • 《0~6歲兒童發育行為評估量表》:261項指標測異常
    中國國家衛生健康委員會最新發布了「0~6歲兒童發育行為評估量表」,本量表於2018年正式開始實施。反映兒童智力水平高低的指標。 註:在編制的量表中,按年齡分組編制測查項目,若被試者通過3歲的測查項目,就表示他使用該量表測查的智力年齡為3歲。
  • 8歲男孩智商高達146,成中國智商最高兒童,媽媽的方法值得學習
    8歲男孩智商高達146,成中國智商最高兒童,媽媽的方法值得學習每一位父母都希望自己的孩子將來能夠「成龍」、「成鳳」,而想要孩子未來有出息智商是少不了的,那麼什麼是智商呢?智商智商又被稱為智力商數簡稱IQ,是指一個人智力檢測的成績與同齡人對比得出的指數,是用于衡量一個人智力高低的標準。
  • 「全球平均智商分布圖」:不誠實的智力測驗,及其血腥往事
    2013年,林恩發布了一篇題為《中國三十一個地區的智力差異及其經濟、人口關係》的論文,試圖在「包括中國人在內的東亞人智商全球最高」的基礎上,進一步證明「在中國境內漢族的智商最高」。為證成該結論,林恩引用了很多中國學術界80、90年代關於智力測驗的學術成果。③ 據筆者觀察比對,林恩的引用非常地不誠實。
  • 最強大腦這樣測出來 我市三家機構可測智商
    原標題:最強大腦這樣測出來 我市三家機構可測智商   近日,江蘇衛視綜藝節目《最強大腦》的熱播在網上掀起一股測智商熱,測智商的手機應用軟體有數十種,最火的應用下載量過萬。  智商可以網上自測嗎?科學的智商測試是怎樣的?重慶有無智商測試機構?
  • 爸爸嫌9歲兒子數學考80分 覺其智商低要做測試
    200孩子測智商  醫生說 6歲以上絕大多數孩子沒必要做此測試  學習「不好」,需要測智力嗎?專家說,大部分孩子不需要測智力。  數學考了80分,爸爸帶他測智商  新學期開學前,西安雁塔區鴻基新城的王志(化名)找到記者,他說,小學快開學了,他想帶9歲的兒子樂樂去「測一下智商」。  記者認識樂樂,這小孩才上三年級,下圍棋就常贏他爸爸,還會幫家裡打醬油。
  • 智商測試,基本不靠譜
    在王女士的強烈要求下,醫生為果果做了智商測試。  智商測試結果是104分,醫生解釋說,兒童的智商90為及格線,大多數人在100~110,智商達到120~130的只佔7%,極少數人才能達到130甚至140的智商。王女士舒了一口氣:「這下,我得和老師好好談談了。」
  • 智商130的女兒竟然是多動症?也許是個天才兒童!
    近日,由於小學三年級的女兒成績一直不理想,杭州某母親帶著她去某家醫院新開的「學習困難諮詢門診」諮詢,可是測出來的智商居然有130,遠遠超出了平均水平30分。根據報導,女孩在整個諮詢過程中,也都安靜地坐著,交流對答大方得體。
  • 聊聊孩子「智商」那些事
    我家孩子智力好不好,智商(IQ)高不高呀?相信每個家長都有過這樣的疑問。 那麼,要怎樣才能知道孩子的智商(IQ)呢? 我們要對孩子進行一場正式的智力測驗! 韋氏兒童智力量表是國際上應用最廣泛,認可度最高的兒童智力測驗。
  • 智商高達146的8歲兒童,成我國智商最高兒童,媽媽的方法值得借鑑
    家長應該先把智商這個詞語的含義理解透徹:智商就是智力商數,智力就是指孩子的智慧,智商由觀察力,注意力,記憶力,思維力,想像力這五種因素組成家長應該怎麼樣來判斷孩子智力的高低呢?在韋氏量表中,正常人的智商的iq是在90到109之間的,110到119為中上水平,120到139為優秀水平。145以上就算是高智商人才了,而69分以下就是代表智力低下。
  • 兒童智力測試題目 9歲兒童智力測試題目
    6個月到3歲為發病高峰,而90%以上以致病微生物為病毒,一般會反覆發熱3天左右,多以夜間明顯,患兒不但服藥困難,輸液又加重痛苦,家長承受著肉體和精神的雙重折磨;洩瀉(腹瀉病)腹瀉病是一組多病原、多因素引起的疾病,它是造成小兒營養不良、生長發育障礙及死亡的重要原因之一。