美國西北大學新系統在智力測試中超越75%民眾,人類的推理能力也不...

2021-01-12 雷鋒網

你聽過瑞文氏標準推理測試（Raven’s Progressive Matrices）麼？上面這張圖就是一道標準的瑞文氏測試題目，是不是很眼熟？在公務員考試、一般的智力測試中我們經常看到它。

那麼問題來了，你知道圖中這道題的答案麼？如果不知道，也用不著沮喪，因為有75%的美國人大概也不知道。但壞消息是：計算機可能知道。

近日，美國西北大學的科研團隊研發了一個全新的計算模型，在瑞文氏標準推理測試中達到或超越了75%美國普通大眾的表現。被媒體譽為人工智慧史上的又一裡程碑。

要知道，根據2016年的數據顯示，一般18歲成年人的平均智商為97，6歲兒童的平均智商為55.5，相比之下谷歌人工智慧系統的智商則為47.3，微軟小冰是24.5。人工智慧的智商還不及6歲兒童的平均水平。

團隊負責人，來自西北大學McCormick工程學院的Ken Forbus教授對此表示：「模型在智力測試中的表現優於75%的美國大眾，這意味著人工智慧的邏輯推理能力已經高於人類的平均水平，起碼在測試題中如此。另外，由於對人來說很難的題目對模型來說通常也很難，這表示該模型已經可以表現出一些人類認知系統中特有的重要屬性。」

Ken Forbus教授

實力這麼強，這個模型到底是如何工作的呢？

據悉，該模型建立在一個名為CogSketch的「草圖」（sketch）理解系統之上，該系統同樣是Ken Forbus團隊的研究成果。這裡「草圖」是指人們在思考問題或表達觀點時自然而然在紙上畫下來的說明性圖樣，特別是面對有關空間理解和地理學的相關問題時，尤其必要。CogSketch系統可以基於草圖進行空間建模和邏輯推理，再配合此次最新研發的計算模型，因而能夠在瑞文氏標準推理測試中脫穎而出。

Ken Forbus教授認為類比推理是解決視覺問題的核心，團隊正是在這一核心思想的指導下研發了最新的計算模型。所謂類比推理即結構映射的過程，是在不同對象之間通過逐個匹配，尋找它們在結構上的相似點，從而通過圖式歸納（即關係結構表徵）把源問題中元素之間的關係要素提取出來，用於靶問題的解決。也就是說，先要形成基於源問題的圖式歸納，再基於源問題和靶問題之間的結構映射將圖式歸納應用到靶問題的解決。在新的計算模型中，團隊成員利用了結構映射理論來對比不同的圖像，通過標記兩張圖像中發現的相同結構，識別出其中的相同點和不同點。值得一提的是，結構映射是由心理學家Dedre Gentner於1983年提出的一個理論，他也是西北大學的教授。

針對西北大學的這項研究，雷鋒網隨機採訪了兩位相關專業的在讀研究生，他們表達了自己的看法。

鍾超傑是來自北京林業大學的碩士在讀生，曾參與車載攝像頭的行人檢測項目。他認為，雖然模型的智力測試成績超過了75%的人類，但這並不能說明計算機的智力真的就超過了人類。因為除了推理之外，智力的含義應該更複雜，比如還包括學習能力、數學計算能力等。而且他覺得如果模型建的好，經過一定數據量的訓練，計算機處理這類問題的能力一般是可以超過人類的，但超出這類問題的範疇應該就不行了。

周志敏是來自浙江大學的研二在讀生，了解機器學習領域的各種算法，包括svm、神經網絡等。他認為這是人工智慧針對特定任務的又一項成功應用，跟人類的類比、推理能力並不一樣。西北大學的模型之所以表現出超過75%普通民眾的推理能力，是因為它經過了大量的類似數據的訓練，如果讓它做圖形之外的工作應該就不行了。

當前，人工智慧系統對圖像和語音的識別能力已經相當出色，但對於語義和圖像含義的理解、推理能力仍有待提高。西北大學的團隊表示，在許多場景中除了對源數據進行識別之外，對其含義的推理和解釋也至關重要，這也是他們研發全新的計算模型並對其展開瑞文氏標準推理測試的原因。他們希望這項研究成果可以為計算機視覺領域今後的發展提供一些技術參考。雷鋒網

PS. 你覺得文章開頭的那道測試題應該選哪個？不妨留言告訴我們吧

來源：tomshardware，雷鋒網(公眾號：雷鋒網)編譯

雷鋒網版權文章，未經授權禁止轉載。詳情見轉載須知。

相關焦點

擊敗水哥王昱珩還不算最強,有個人工智慧已經通過人類的智商測試了…

最近，美國西北大學的一個團隊研發了一個新的人工智慧計算模型，這套系統在智商測試中，已經表現出人類的水準。這項工作的重要意義在於，推動了人工智慧更好的看到和理解這個世界，就像每一個普普通通的人那樣。「這個人工智慧在智商測試中的表現，超過了大部分的美國成年人」，西北大學人工智慧博士Ken Forbus說，「大家面對的是同樣的難題」。
瑞文標準智力測驗結果及分析,你的推理能力有多強?丨多元智能測試

瑞文標準推理測驗（SPM），是由英國心理學家瑞文1938年編制的非言語智力測驗。它的主要任務是要求被試根據一個大圖形中的符號或圖案的規律，將某個適當的圖案填入大圖形的空缺中。瑞文標準智力測驗測量的是智力的G因素（一般能力因素），尤其是與人的問題解決、清晰知覺、思維，發現和利用自己所需信息以及有效地適應社會生活的能力有關。一般認為該測驗測量的是卡特爾提出的「液體智力」，即智力結構中最一般的因素，一種先天的能力。
瑞文高級智力測驗專業版:你具備超常的推理能力嗎?

而後，在人類歷史的發展過程中，總會有一些智者以超強的洞察力和抽象的邏輯思維能力將世界帶向新的時代。其實天才也好、高智力人士也好，他們中的大多數人一開始都只是擁有較好天賦的普通人，從較好水平到卓越離不開興趣推動下的深入訓練。
美國研究稱人類的智力水平或正不斷下降(全文)

這也有學者研究的支持，紐西蘭奧塔哥大學的教授詹姆斯·R·弗林在28年前就得出一個觀點，人類的智力水平一直在不斷增長，又在2012年的新書中堅持了這一觀點。但是，美國史丹福大學的研究人員卻從遺傳學角度，駁斥了這一觀點，認為優越的生活，阻止了人類智力水平的提高，我們可能會越來越笨。
智力測試:20秒,解答這道邏輯推理題,據說答對的人智商130以上

所謂智力，就是指人類適應環境和學習的能力。大致包括思維能力、觀察能力、想像能力和記憶能力等。而所謂的智力測試就是對以上能力的一種科學測試。一般來說智力越高的人，學習能力越強，適應社會的環境能力也就越強，將來的成就可能就會越大。
微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類

當SuperGLUE剛被推出時，排行榜上表現最佳的模式和人類表現之間有近20個百分點的差距。但截至1月初，有兩個模型：微軟的DeBERTa和谷歌的T5 + Meena——已經成為第一個超越人類基線的模型。
當AI「智力爆炸」成為超級智能，普通智力人類是螻蟻/寵物？

實際上，這種連鎖反應不局限於物理界，而是廣泛存在於各個科學領域。而今天，科學家們都在討論一個全新的、會產生連鎖反應的領域——AI。許多人提出，AI 的智力就像多米諾骨牌一樣，一旦打開某個開關，它就會不斷地自我補充，形成 AI 「智力爆炸」，甚至最終可能超越人類智力。
AI 如果「智力爆炸」成為超級智能只有普通智力的人類是螻蟻...

實際上，這種連鎖反應不局限於物理界，而是廣泛存在於各個科學領域。而今天，科學家們都在討論一個全新的、會產生連鎖反應的領域——AI。許多人提出， AI 的智力就像多米諾骨牌一樣，一旦打開某個開關，它就會不斷地自我補充，形成 AI 「智力爆炸」，甚至最終可能超越人類智力。
狗狗怎麼測試智商?試試這6個智力測試任務

狗的智力重要不重要？你喜歡經常拆家的狗呢，還是喜歡回家時可以送上拖鞋的狗？這時你可能會覺得狗還是聰明一些好吧。那你有沒想過給狗狗來個智商測試？狗的智力測試可以讓你了解它的可訓練性和解決問題的能力。關於狗智商的科學研究雖然你狗狗的智商不會影響你們之間的感情，但對於那些想要養條新狗的人來說，狗智力測試可以幫助你了解狗的性格和可訓練性。
瑞文標準智力測試免費版,國際標準推理測驗,你的智商高人一等嗎?丨艾森克人格測試

SPM主要通過圖形的辨別，組合，系列關係等測量智力組成中的一般性因素，即完成所有智力活動都需要的能力，該因素與人們問題解決，清晰知覺和思維，發現和利用自己所需信息，以及有效地適應社會生活的能力有關。適用範圍：5歲半至70歲，因為是圖形測驗，不受文化、種族、語言的限制。
AI 如果「智力爆炸」成為超級智能，只有普通智力的人類是螻蟻還是寵物？

實際上，這種連鎖反應不局限於物理界，而是廣泛存在於各個科學領域。而今天，科學家們都在討論一個全新的、會產生連鎖反應的領域——AI。許多人提出，AI 的智力就像多米諾骨牌一樣，一旦打開某個開關，它就會不斷地自我補充，形成 AI 「智力爆炸」，甚至最終可能超越人類智力。
流體智力和晶體智力

這種智力幾乎可以轉換到一切要求智力練習的活動中，所以稱為流體智力。晶體智力則是指在特定文化情景情境中就有恰當的方法解決問題的能力，主要是後天獲得的，受文化背景影響很大，與知識經驗的積累有關，是流體智力運用在不同文化環境中的產物，例如，詞彙、、理解、語言表達、數字等方面的能力，它包括大量的知識和技能，與學習能力密切聯繫著。這種智力表現為來自經驗的結晶，所以稱為晶體智力。
IQ每年上漲0.3,人類不斷突破智力極限?

瑞文推理測試（Raven’s Progressive Matrices，由英國心理學家J·C·瑞文於1938年創製）同樣是分析IQ發展趨勢的重要測試，它要求學生根據一組圖片推測下一張圖片是什麼。基於其他國家的數據，我保守估計：人類IQ每10年會上升3分。為什麼即使親緣關係較近的先輩也與我們有這麼大的智力差距？
人腦的IQ值每年上漲0.3,人類不斷突破智力極限?

類同測試測量人們察覺事物共性的能力；詞彙測試檢測日常詞彙的積累情況；常識檢測人們的基本信息儲備量；算術測試檢驗人們解決數學問題的能力……如果在某項測試中，一個人的得分高於平均值，那麼他往往會在所有測試項目中都表現出色。
IQ測試 - 智商測試 - 智力測試

這些人能創造出卓越的科學、文化成就，或是能在極複雜的世界格局中指引一個國家的政治、經濟走向。他們的智商問題該如何解釋？還有些人在待人辦事上都很精明，他們能很輕鬆地打理好自己的生活，還經常幫別人排憂解難，他們很聰明，但是他們小時候學習不好，如今也沒有什麼成就。他們的智商又該如何評價呢？
哪些生物與人類智力相當?黑猩猩、海豚和細菌上榜

蘇珊娜·埃爾庫拉諾·烏澤爾美國範德堡大學心理學副教授《人類優勢：對大腦如何變得超凡卓越的新理解》作者「許多動物擁有和人類相似的能力，至少在直接解決問題、視覺記憶、分層規劃等方面答案是肯定的，日本一隻名叫Ayumu的人工飼養黑猩猩被認為是世界上最聰明的動物，它的學習能力較強，能夠輕易地完成一系列記憶測試，它甚至會玩電子遊戲，在電子競技遊戲中能擊敗大學生。這意味著如果對黑猩猩提供一個公平的機會，讓它們擁有和人類相同長的學習時間，它們的學習能力並不亞於人類。
【重磅】耶魯神經科學掃描大腦判斷人類智力,區分準確率達99%

耶魯大學的研究人員通過一系列不同的測試來評估參與者的記憶力、智力、運動能力和抽象思維能力。他們發現，每個人的連接體都是獨一無二的，就如指紋一樣。根據大腦的掃描成像，研究者能區分每一個參與者，準確率達到 99%。你覺得你在某方面非常有天分嗎？比如非常擅長某種樂器、某類運動，或某個科目，例如數學？這些「天分」可能跟你的大腦的連接方式有關。
IBM沃森超級計算機CTO:計算機智力將會超過人類

美國西北大學(Northwester University)教授保羅·瑞伯（Paul Reber）認為，人的大腦只能存儲2.5P數據。未來3年，每天生成的數據將會增加至4ZB，1Z相當於1024E。IBM沃森首席技術官（CTO）兼副總裁羅伯·海伊（Rob High）最近參加會議時表示：「生成的信息數量太大，遠遠超過我們的消費能力和利用能力。
兒童智力測試量表兒童智力測試量表的數值

兒童智力測試量表根據你的情況來看，你最好還是帶小孩到正規的醫院做檢查。因為韋氏智力量表必須是在醫院在醫生的指導下測試，每一個測試智商的量表根據不同的地區還需要進行修正。你自己在家裡進行，你測出的結果不一定是準確的，這個你需要多注意啊。
人類智力:進化未終結

近日，《每日郵報》記者鮑勃·霍姆斯在英國《新科學家》雜誌上發布報告稱，對丹麥男性進行的入伍智商測試顯示，自1998年以來測試分數下降了1.5分。而在英國和澳大利亞進行的測試也顯示出了類似的趨勢。這不禁令人疑惑，下降趨勢的出現，是否標誌人類已達到智力的頂峰？　　這並不是第一次人類質疑自己的智力達到極限。

美國西北大學新系統在智力測試中超越75%民眾,人類的推理能力也不...

相關焦點

擊敗水哥王昱珩還不算最強,有個人工智慧已經通過人類的智商測試了…

瑞文標準智力測驗結果及分析,你的推理能力有多強?丨多元智能測試

瑞文高級智力測驗專業版:你具備超常的推理能力嗎?

美國研究稱人類的智力水平或正不斷下降(全文)

智力測試:20秒,解答這道邏輯推理題,據說答對的人智商130以上

微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類

當AI「智力爆炸」成為超級智能，普通智力人類是螻蟻/寵物？

AI 如果 「智力爆炸」 成為超級智能 只有普通智力的人類是螻蟻...

狗狗怎麼測試智商?試試這6個智力測試任務

瑞文標準智力測試免費版,國際標準推理測驗,你的智商高人一等嗎?丨艾森克人格測試

AI 如果 「智力爆炸」 成為超級智能，只有普通智力的人類是螻蟻還是寵物？

流體智力和晶體智力

IQ每年上漲0.3,人類不斷突破智力極限?

人腦的IQ值每年上漲0.3,人類不斷突破智力極限?

IQ測試 - 智商測試 - 智力測試

哪些生物與人類智力相當?黑猩猩、海豚和細菌上榜

【重磅】耶魯神經科學掃描大腦判斷人類智力,區分準確率達99%

IBM沃森超級計算機CTO:計算機智力將會超過人類

兒童智力測試量表 兒童智力測試量表的數值

人類智力:進化未終結

AI 如果「智力爆炸」成為超級智能只有普通智力的人類是螻蟻...

AI 如果「智力爆炸」成為超級智能，只有普通智力的人類是螻蟻還是寵物？

兒童智力測試量表兒童智力測試量表的數值