人工智慧的崛起:智商測試得分超過四歲兒童

2020-11-30 cnBeta

研究人員最近對一個名叫ConceptNet的人工智慧系統進行了測評。在一項為檢測兒童智商而設計的測中,ConceptNet的得分超過了一名智商正常的四歲兒童。該測試共包含五項與詞語推理和詞彙有關的測驗,ConceptNet的總得分為69分,與之進行對比的學齡前兒童得分則為50分。並且專家認為,該系統的智能程度還會進一步加強。

在測試過程中,試題會通過語言處理工具轉換成ConceptNet 4能夠理解的語言,如「我們為什麼要握手?」、「我們為什麼要在夏天戴太陽鏡?」和「為什麼將刀子放入嘴中是不好的行為?」等等。

如果你本來就擔心自己的工作有一天會被機器人取而代之,那麼下面這則來自麻省理工學院的最新消息可能會讓你更加惶恐。

研究人員最近對一個名叫ConceptNet的人工智慧系統進行了測評。在一項為檢測兒童智商而設計的測試中,ConceptNet的得分超過了一名智商正常的四歲兒童。

該測試共包含五項與詞語推理和詞彙有關的測驗,ConceptNet的總得分為69分,與之進行對比的學齡前兒童得分則為50分。並且專家認為,該系統的智能程度還會進一步加強。

ConceptNet是一項由麻省理工學院常識計算計劃團隊(MIT Common Sense Computing Initiative)管理的開源項目。該團隊研發的ConceptNet 4運用了所謂的「關係」這一概念。例如,當讓該系統解釋什麼是「小鹿」時,它會明白「小鹿是一種鹿」,而不是」鹿是一種小鹿「。也就是說,它能夠理解這種動物的概念,以及「小鹿」和「鹿」這兩個詞彙和概念之間的關係。同時,該系統還可以使用所謂的「對立標記」表示負相關關係,比如「企鵝不會飛」等。

研究人員讓ConceptNet 4參與了「韋克斯勒學齡前兒童智力量表」測試(WPPSI-III),並將研究結果發表在論文《Measuring an Artificial Intelligence System's Performance on a Verbal IQ Test For Young Children》上。WPPSI-III測試包含14項測驗項目,以及一份針對操作智商和言語智商的完整評估表。

在對單項測試計分時,研究人員先使用每道題目得分最高的答案計分,然後再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為「嚴格計分」,後者稱為「放鬆計分」。圖中左側為ConceptNet得分,右側為受測兒童得分。

操作智商測驗通常會要求受測人完成繪畫、解謎、記憶等任務。言語智商測驗則會考察兒童的詞語推理、詞彙及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對言語智商進行測試。

在測試過程中,試題會通過語言處理工具轉換成ConceptNet 4能夠理解的語言,如「我們為什麼要握手?」、「我們為什麼要在夏天戴太陽鏡?」和「為什麼將刀子放入嘴中是不好的行為?」等等。

該研究由芝加哥大學的斯特蘭?奧爾森(Stellan Ohlsson)帶領。在對單項測試計分時,研究人員先使用每道題目得分最高的答案計分,然後再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為「嚴格計分」,後者稱為「放鬆計分」。

在「信息」測試中,ConceptNet得到了20分,而同時參加測試的四歲兒童通過轉換後的得分為10分。這名兒童在詞語推理和理解上得分更高,均為7分,而ConceptNet在這兩項上的得分分別為2和3分。此外,ConceptNet表現出了更豐富的詞彙量,詞彙得分為20分,而兒童得分為13分。

「ConceptNet系統的得分與四歲兒童相仿,但低於五至七歲兒童的平均得分,」研究人員解釋道,「該系統在每個單項中得分差異很大,說明還有改進的空間。在所有測試中,『理解』是最關乎人類常識的測試項目。得分差異大、常識方面表現一般,這說明ConceptNet尚不具有四歲兒童的語言能力。但本次研究說明,兒童智商測試可以為人工智慧系統的評估和比較提供一種客觀的度量手段。」

ConceptNet是一項由麻省理工學院常識計算計劃團隊(MIT Common Sense Computing Initiative)管理的開源項目。該團隊研發的ConceptNet 4運用了所謂的「關係」這一概念。例如,當讓該系統解釋什麼是「小鹿」時,它會明白「小鹿是一種鹿」,而不是」鹿是一種小鹿「。也就是說,它能夠理解這種動物的概念,以及「小鹿」和「鹿」這兩個詞彙和概念之間的關係。

「此外,許多由ConceptNet給出的錯誤答案和兒童給出的錯誤答案不僅相去甚遠,而且違反常識。」

例如,在關於「獅子」的詞語推理測驗中,該AI系統和首測兒童被給予三條線索——「雄性長著鬃毛」,「該動物生活在非洲」,以及「它是一種體型很大的棕黃色貓科動物」。

由ConceptNet給出的排名前五的答案按順序排列為:狗,農場,生物,家庭,貓。

研究團隊解釋道,「生物」和「貓」尚且還能與「獅子」沾邊,但其它的答案就明顯有悖於常識了。

「按照常識,受測者應該至少能將答案限制在動物的範圍內,同時能做出簡單的推理:「既然線索說它是貓科動物,那只有貓科動物能夠被列入考慮範圍。」

該論文被發表在期刊《arXiv》上,共同作者包括羅伯特?斯隆(Robert Sloan)、捷爾吉?圖蘭(Gy?rgy Turán)和阿隆?尤拉斯基(Aaron Urasky)。

ConceptNet系統的得分與四歲兒童相仿,但低於五至七歲兒童的平均得分。這說明該系統並不具備「四歲兒童」的語言能力,但可以為評估類似系統提供指導方法。

測試方法

研究人員讓ConceptNet 4參與了「韋克斯勒學齡前兒童智力量表」測試(WPPSI-III),並將研究結果發表在論文《Measuring an Artificial Intelligence System's Performance on a Verbal IQ Test For Young Children》上。WPPSI-III測試包含14項測驗項目,以及一份針對操作智商和言語智商的完整評估表。

操作智商測驗通常會要求受測人完成繪畫、解謎、記憶等任務。言語智商測驗則會考察兒童的詞語推理、詞彙及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對言語智商進行測試。

在測試過程中,試題會通過語言處理工具轉換成ConceptNet 4能夠理解的語言,如「我們為什麼要握手?」、「我們為什麼要在夏天戴太陽鏡?」和「為什麼將刀子放入嘴中是不好的行為?」等等。

該研究由芝加哥大學的斯特蘭?奧爾森(Stellan Ohlsson)帶領。在對單項測試計分時,研究人員先使用每道題目得分最高的答案計分,然後再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為「嚴格計分」,後者稱為「放鬆計分」。

什麼是ConceptNet

ConceptNet是一項由麻省理工學院常識計算計劃團隊(MIT Common Sense Computing Initiative)管理的開源項目。該團隊研發的ConceptNet 4運用了所謂的「關係」這一概念。

例如,當讓該系統解釋什麼是「小鹿」時,它會明白「小鹿是一種鹿」,而不是」鹿是一種小鹿「。也就是說,它能夠理解這種動物的概念,以及「小鹿」和「鹿」這兩個詞彙和概念之間的關係。

同時,該系統還可以使用所謂的「對立標記」表示負相關關係,比如「企鵝不會飛」等。

相關焦點

  • 研究表明:人工智慧的智商已達4歲兒童水平
    最近,一系列旨在測試一些世界上最好的人工智慧(AI)系統和人類智商(IQ)之間的勝負關係的試驗表明,人工智慧的智力目前已經達到了 4 歲兒童的水平。
  • 青測智商人數上升 2%兒童得分超130屬極超常
    近日,英國一名11歲少女被測出智商高達162分,之後這名少女被一個名叫「門薩」的組織收為會員,青島及全國各大城市也因此掀起一股門薩測商熱。記者了解到,除了「門薩」等社會組織的推動外,近年來青島參與智力測驗的人數也在逐年上升。對此,專家表示,智商並不是一成不變的,對智力測驗市民應當理性對待。
  • 中國學者為AI測智商:Google遙遙領先但仍不及6歲兒童
    幾天前,一篇上傳到康奈爾大學網站上的論文吸引了媒體的注意,這篇題為《人工智慧的智商評測與智能等級研究》的論文由 3 位中國學者所著,出自中國科學院虛擬經濟與數據科學研究中心,研究者們在論文中分析了 Google、微軟必應、百度和蘋果 Siri 等系統,並且為人工智慧系統劃分了 7 個智能等級。
  • 英國節目評選天才兒童 12歲少年智商超愛因斯坦
    ;另一個是3歲時就能讀媽媽博士論文的9歲女孩,被同學稱作「會走路的百科全書」……現在,他們將與數名其他孩子展開比拼,看誰才是英國的「天才兒童」。  智商高過愛因斯坦  據英國《每日郵報》22日報導,英國電視四臺(Channel 4)將於本月30日再度迎來「天才兒童」,這檔備受爭議的選秀節目將評選出英國最聰明的孩子。  在節目正式開播之前,「天才兒童」的選手們已經成了備受矚目的焦點人物。  託馬斯是其中一位參賽選手。
  • 3歲男孩智商超過99.7%的人,成為高智商協會最年輕的成員
    外媒報導,一名居住在英國的3歲馬來西亞男孩成為了加入門薩英國協會的最年輕成員。 這個男孩叫穆罕默德·哈裡茲·納齊姆(Muhammad Haryz Nadzim),他母親表示,孩子在見過心理學家之後被邀請加入門薩協會,他在斯坦福-比奈智商測試中得了142分,超過99.7%的人。
  • 英12歲女孩智商測試滿分 超過愛因斯坦和霍金
    【環球網綜合報導】據美國合眾國際社9月9日報導,來自英格蘭埃塞克斯郡科爾切斯特縣的12歲的女學生麗迪雅•塞巴斯蒂安(Lydia Sebastian)在門薩智商測試中取得滿分162分,比愛因斯坦和霍金還高2分。
  • 英國10歲男孩門薩測試得分162 創智商測試世界紀錄
    2015年6月8日訊,據英國《每日電訊報》6月6日報導,來自布萊克本的男孩阿希爾·卡利格(Aahil Kallingal)在門薩測試中獲得162分的最高分,創造了該項測試的世界紀錄。 阿希爾·卡利格看起來與平常的小孩子沒有什麼不同(網頁截圖) 今年10歲的阿希爾是有史以來最年輕的測試者之一
  • 中國學者為 AI 系統測了測智商,Google 遙遙領先但仍不及 6 歲兒童
    幾天前,一篇上傳到康奈爾大學網站上的論文吸引了媒體的注意,這篇題為《人工智慧的智商評測與智能等級研究》的論文由 3 位中國學者所著,出自中國科學院虛擬經濟與數據科學研究中心,研究者們在論文中分析了 Google、微軟必應、百度和蘋果 Siri 等系統,並且為人工智慧系統劃分了 7 個智能等級。
  • 智商測試的「致命」誤差
    說到測智商(IQ),人們會想到春晚舞臺上,趙本山利用智商測試題,向範偉「營銷」一系列商品的成功案例。在現實生活中,智商測試是事關人命的大事。在美國一些地方,如果死刑犯智商測試得分低於70分,可以保命。這是智商測試對人們生活影響的一種極致體現。但這種測試的準確性,真的能承擔起如此「重任」嗎?英國一位心理學家的研究顯示,智商測試題並非那麼靠譜。
  • 重慶小米熊兒童醫院:智商多少算正常
    核心提示:重慶小米熊兒童醫院是一家由多位三甲兒科專家聯合發起的國家二級現代化兒童專科醫院,也是重慶中外合資兒童醫院,市醫保定點單位.諮詢熱線 023-62611212 每個年齡段對於智商的標準其實是不一樣的,因為智商主要是針對人在年齡階段的認知能力進行一系列的測試
  • 英11歲男孩智商測試162分,超過阿爾伯特·愛因斯坦,稱:愛讀書和拼圖
    當地時間2月25日《每日鏡報》報導,英國一名11歲男孩在他的智商測試中得到了162分,超過了阿爾伯特·愛因斯坦。 這位來自沃特福德的小天才雅利安·凱薩帕爾曾就讀於巴奈特的伊莉莎白女王學校,曾在五、六年的國家小學數學挑戰賽中分別獲得金銀證書。
  • 英國心理學家:IQ測試存大誤差 得分「看心情」
    說到測智商(IQ),人們會想到春晚舞臺上,趙本山利用智商測試題,向範偉「營銷」一系列商品的成功案例。  在現實生活中,智商測試是事關人命的大事。在美國一些地方,如果死刑犯智商測試得分低於70分,可以保命。這是智商測試對人們生活影響的一種極致體現。
  • 智商測試:現代人的偏見
    「英國13歲女童智商160,堪比愛因斯坦」,類似標題屢見不鮮。但這種對比的說服力極低,智商測試不是通考。市面上最為流行的韋氏、斯坦福-比奈、瑞文測試各有評分標準,兒童與成人的試題也不相同。更重要的是,愛因斯坦生前並沒有接受過智商測試,雖保留了大腦,也無法用此估算屬於心理學概念的智商——除非大腦復活,親自做一次智商測試。
  • 兒童智力測試題目 9歲兒童智力測試題目
    兒童智商測試標準題想要開發寶寶的大腦,這當然離不開寶媽們在日常生活中的努力。我們要幫助寶寶,鍛鍊寶寶智力的開發,才能夠有助於寶寶智力的發育。那麼,22個月寶寶智力發育標準是怎樣的?22個月寶寶智力發育能夠自如自在地跑步,跑跑停停,並學會了奔跑。
  • 爸爸嫌9歲兒子數學考80分 覺其智商低要做測試
    「不適合學數學,難道是智商低?」他說,最後只好帶著樂樂去西安市兒童醫院做智力測試,樂樂「畫了一些圖,填了一些詞,分了一些類,答了一堆題」以後,兒童保健科的醫生告訴王志,依照他們的評測方法,得分90-110算正常,樂樂的智商有110,「智商算高的」。  直到昨日,王志也很納悶:「那他為什麼學不好呢?」
  • 英12歲女孩參加門薩智商測試 得分高過愛因斯坦
    資料圖片:12歲女孩莉迪亞·塞巴斯蒂安在門薩智商測試中取得了162分的高分。中新網9月10日電據外媒報導,近日,一名來自英國的12歲女孩莉迪亞·塞巴斯蒂安在門薩智商測試中取得了162分的高分,比愛因斯坦和霍金還高兩分。她表示,測試之前自己並沒有做過多準備,但試題並沒有想像中那麼難。智商高過愛因斯坦和霍金是一種怎樣的體驗?
  • 智商測試,基本不靠譜
    □記者 劉坤        暑假,是家長們給孩子測試智商的高峰期。有兩個極端,有些孩子成績不佳,家長想測試是不是「智力有問題」;還有一部分家長是懷著「發現神童」的目的來的。然而,專家指出,現在通行的智商測試方法是1986年的標準,而我國兒童20年間智商普遍增長了12.84分,所以測出的值是不準確的。
  • 兒童智商測試 兒童智商測試題國際標準60題
    兒童智商測試其實你想找些適合5歲的智商測試題的話,你可以到書店去找找啊,那裡應會有很多這樣的書啊。找些適合小孩的就可以的了。那麼,我現在就介紹一本給你吧。它的書名叫《5歲寶寶智力測驗》,你可以買帶給你小孩看啊。
  • 愛因斯坦「智商200」?專家:都是假的!家長不必在意孩子智商測試結果
    如果得分得到了115分,意味著這是一個標準差,也就是說有84%的人智力不如他,只有16%的人比他聰明。115是一個標準差,一個標準差是15,兩個標準差就是30,當你智商是145,也就是3個標準差的時候,就意味著有99.7%的人智力不如他,只有不到千份之三的人比他聰明。
  • 英10歲女孩智商高達162分超過愛因斯坦(圖)
    據英國《每日郵報》5月12日報導,英國10歲女孩妮詩·尤佳拉(Nishi Uggalle)在門薩智商測試中取得162分的頂尖成績,智商之高甚至超過著名物理學家愛因斯坦。她因此成為英國取得這項測試最高分的最年輕的測試者之一,並順利成為門薩會員。  2016年4月,妮詩在曼徹斯特參加了門薩測試,當時她是考場裡唯一的兒童。她回憶當時自己提前完成了第一部分的150道題,但是第二部分有一兩題沒有答出來。妮詩說:「我告訴朋友們我參加了門薩測試,他們都為我感到驕傲。我想成為一名科學家,因為我一直對時間的課題很感興趣。」