智商測試:現代人的偏見

2021-01-08 大象公會

文/大象公會

塑造神童的人總喜歡拿愛因斯坦作標杆,或許因為他的名字已成為「天才」的代名詞。「英國13歲女童智商160,堪比愛因斯坦」,類似標題屢見不鮮。

但這種對比的說服力極低,智商測試不是通考。市面上最為流行的韋氏、斯坦福-比奈、瑞文測試各有評分標準,兒童與成人的試題也不相同。

更重要的是,愛因斯坦生前並沒有接受過智商測試,雖保留了大腦,也無法用此估算屬於心理學概念的智商——除非大腦復活,親自做一次智商測試。

實際上,愛因斯坦的智商值來源於1926年凱薩琳·考克斯和路易斯·特曼所做的300位歷史天才早年智力的估算。對這些智商測試發明前的人物,考克斯的研究方法相當粗暴:閱讀傳記細節,替他們做當時流行的斯坦福-比奈(Stanfor-Binet)智力測試題。

考克斯的結果或許令喜歡拿它對比的神童們失望:愛因斯坦的智商只排在中遊,遠低於斯圖亞特·密爾的190、笛卡爾和伽利略的180,只與詩人艾略特持平。唯一超過200的人叫弗朗西斯•高爾頓,他並沒有前幾人的名望,但他有特殊的身份:智力測量的先行者,考克斯和特曼的學術偶像。

尤為值得一提的是,在智商測試的改進過程中,無論其注重考察何種能力,它始終是一個為現代社會標準而設置的遊戲。在某種意義上,它很難擺脫現代人的偏見。

【智力測試的進化】

長期以來,智力高低都是仁者見仁,沒有精準、抽象的標準。工業革命後,驚嘆於科學定理效力的人們,開始將目光轉向以往含混不清的領域,智力就是其中之一。

「200分先生」高爾頓是這方面的先行者。1859年,閱讀了他表哥達爾文的《物種起源》,高爾頓深受刺激,決定測量人類的智力,用精確的數據證明他的優生學設想:人的智力由遺傳決定。

高爾頓很快開工了。他試圖在聽力、手的靈敏度、中指長度、頭顱大小等要素間,找到與智力高低的相關關係。結果令人失望,這些因素完全無法解釋智力的差異。不過,這些失敗的舉措開啟了量化智力的嘗試。

法蘭西斯·高爾頓

1881年,法國開始推廣義務教育。為區分普通兒童和有缺陷兒童,教育部門急需合適的檢測工具,以便因材施教。需求刺激下,法國的阿爾弗雷德·比奈和西蒙在1905年製作了第一份智力測量表,並在1908年的修訂中,創造性地按不同的年齡段設計了試題,提出了心理年齡概念。相比較後人,比奈沒有宏偉的野心,他清楚地強調他的測驗只能測量部分智力,對預測有學習困難的兒童可能有效。

接下來,改進智力測試的交接棒傳到了美國。20世紀初,這個生機勃勃的國家裡,徵兵、移民、教育,都急速擴展,成千上萬的學歷不明,各式背景的移民蜂擁而入,迫切需要更有效率的區分方法,在混亂中整理出秩序。

同時,應用心理學正在美國快速的發展,人們相信,心理學家可以搞定一切:婚姻失和,工作不滿,推銷保險。於是被法國人漠視的比奈測試在這裡大放異彩。戰爭的爆發催化了狂熱需求,智商測試就在這個背景下大踏步地走入美國人的生活。

1916年,路易斯·特曼,就是給歷史名人估算智商的考克斯的導師,修改了比奈-西蒙測量表,將新版本命名為斯坦福-比奈智力測試。特曼吸收了1911年德國人威廉·斯特恩提出的智力商數(IQ)概念,根據不同年齡兒童做測試的分數均值,設為「智力年齡」標準,每個兒童的個人智力數值,取決於心理年齡與生理年齡的比率。這種測試方法被稱為比率智商,公式如下:

所以,高爾頓智商被測為200,是考克斯和特曼認為他3歲就能完成達到正常兒童6歲的斯坦福-比奈智商測試水平,同理,愛因斯坦的傳記等材料被認為只能體現1.6倍的心理年齡/生理年齡比。

此後,智商測試不斷進化。1949年,韋克斯勒編制了不同於比奈系列的新測試表,稱為韋氏智商測試,影響至今。韋氏測試分為成人、兒童、幼兒三版,採用離差智商計算,將同一組的智商平均值設為100,標準差設為15,整組的數據呈正態分布。與比率智商不同,離差智商不計算不同年齡的成績比率,而將挑選出來的同年齡人作常模參考,表示個人在同年齡組的相對位置。

這種新的參照方法也影響了斯坦福·比奈智商測試。在1960年第三次修訂時,它也採用了離差智商,但其標準差為16。這意味著高智商的分數,在韋氏測試應為130,在斯坦福·比奈測試則為132。

所以,即使考克斯的傳記估算法合理,媒體上介紹可與愛因斯坦媲美的聰明的少年時,也該先確定幾個問題:你使用哪種測試?成人組還是少兒組?標準差多少?參考的常模又是哪些?

【什麼是智力】

智商測試首先取決於對「智力」的理解。早期智商測試的短板在於:應用先行,缺乏理論。此後,智力理論層出不窮,但是最核心的問題:什麼是智力,智力的結構,遺傳和後天因素對智力的影響,依舊充滿爭議。

最初,對智力本質的探討來自英國心理學家斯皮爾曼,1904年他提出了常規智力和特殊智力之分。常規智力被稱為g因素,它被認為是智力的關鍵。斯坦福·比奈測試就主要集中於g因素的測量——反應速度、記憶力、語言能力、計算能力。

這種解讀的方法,將智力解析為各種能力。但只關注靜態能力,容易落入窮舉的泥潭。到1980年代時,它已細分到了240種因素。

認知心理學興起後,學者提出了信息加工理論,不再斤斤計較於靜態的劃分,更注意智力處理現實問題的能力。按此類理論,人腦被理解為信息處理系統,智力體現於為了一定目的,加工處理信息的表現。

於是,將因素和信息加工調和在一起的智力層面理論出現了——既劃分了不同因素,又注重因素在信息加工中的表現。在這種視角下,一些心理學家將以往不被重視的能力納入視野,不局限於傳統的狹隘定義。

哈佛大學的加德納在1983年提出「多元智能」概念,一改以往強調抽象思維的智力觀念,將人際關係、音樂、肢體動作等加入智力範疇。著名的情商概念也在此時提出。1991年,薩洛維提出的情緒智力(EI)概念,認為認知、控制情緒的能力,是一種長久以來被忽視的智力。經過戈爾曼的傳播,情緒智力廣為人知,逐漸被傳播為情商(EQ),和智商並列。

智力理論的發展,影響了智商測試的項目,斯坦福-比奈量表的測試能力,從最初的g因素,到後期的8種,其測試結構在數量和內容也發生變化。

斯坦福-比奈智商測試五次修訂的內容變化

認知神經科學的發展,又給智力理論提供了新的支撐。目前,學界傾向於認為大腦突觸更多的人,智力表現更好,大腦皮質的厚度也與智力相關。除了從腦部構造角度探討,認知神經科學還在確定人腦的信息加工速度、知覺速度、神經速度等功能與智力的關係。

不過,這些神經科學角度的嘗試也受到「智力」概念的困擾,對人腦哪一部分的掃描?都只能夠確定相關關係進行推論,更進一步的探討,則都需要理論標準。

未來智商理論會有什麼發展,技術上能否用腦部掃描等手段取代智商測試,抑或證明智商測試的合理性,仍是未知數。理論的發展推動人們更理性的看待智商測試,因為人類曾有濫用測試的深刻歷史教訓。

【智商測試的濫用】

1927年,美國最高法院以8:1的投票結果,判處維吉尼亞州對一名「弱智」婦女實施絕育手術。著名的霍姆斯大法官曾對此評論道:「三代弱智已足夠」。此後,美國12個州通過了對智力缺陷人群實施絕育手術的立法,27個州實施強制絕育計劃。最熱衷於此的加利福尼亞一共實施了2萬多例手術。

登峰造極的是納粹德國,近40萬人被判定智力缺陷,強制絕育。還有十餘萬人被殺害。

更早的時候,美國醫生在移民到達的地點,僅憑交談和觀察,就評估他們的智商分數,弱智者將因此被遣返。1924年,受智商檢測結果的影響,美國國會出臺了更嚴格的移民控制法案。

這種濫用智商測試的現象引起了人們的警覺,最著名的反對者是李普曼 (Walter Lippmann)。1922年,他在《新共和》雜誌上與特曼打了一場筆戰,李普曼抓住當時智商測試的弱點,批評其簡單粗暴的對待覆雜的人類智力,總是偏重某些能力,只能得出偏見,容易給個人貼上永久的標籤。

當時智商測試值得詬病處甚多。比如早期的斯坦福-比奈測試中,女孩的分數在每個年齡段都高於男孩,這讓路易斯·特曼很焦慮,1937年,新版本的測試量表刪除了男性得分差的項目,輕輕一動,男孩就和女孩一樣聰明了。

1960年代的美國,民權運動風起雲湧,智商測試被認為是種族主義的方法,受到活動家的衝擊,紐約、華盛頓特區、洛杉磯等市禁止對小學生智商測試,不過隨著民眾熱情的消退,這種激進的禁令很快被取消了。

隨後,智商測試不斷完善,早期的很多問題已經解決。但接下來,它又面臨更大的麻煩:弗林效應。

這是由美國人詹姆斯·弗林命名的現象,它顯示,在1930年到1980年間,發達國家的智商測試初始分數一直在上升,比如1932年至1978年,美國年輕人的IQ平均指數提高了14點。弗林效應也出現在發展中國家。1994—1998年間,肯亞6—8歲農村兒童的分數增加了11分,這讓人懷疑智商測試的穩定性,也與智商測試體現先天智力的觀念不符——基因的變化不可能這麼快。

目前,多數心理學家將此解釋為隨著社會進步,教育和營養水平提高,影響了抽象能力的發展,而對於弗林效應本身引起的智商測試有效性討論,則莫衷一是。

【中國人的智商】

儘管多數中國人1980年代以後才接觸智商概念,但智力測試方法早在1917年就傳入中國。1917年京師教育報上,翻譯了日本學者佐藤禮雲關於比奈-西蒙智力測試的介紹文章,並附上部分測試題目。

當時智力測試的介紹以翻譯為主。中國最早的智力測驗嘗試,是1918年瓦爾克特用斯坦福-比奈智力量表測驗清華的學生。兩年後,南京高等師範開設心理測驗課程,正規的智商測驗出現。隨後,比奈量表、美國陸軍智商測試表等被翻譯過來,在20年代風靡一時,報刊雜誌經常出現「智力小測驗」的題目。

很快,中國部分學校也各自開始智力測試。1921年,安徽第二師範附屬小學對學生進行了智力測試,試題選自比奈-西蒙測試表。1926年,廈門集美學校對女小學部的一次智力測驗,並將結果發布在《集美周刊》上。

《集美周刊》截圖。T分數為特曼(斯坦福-比奈)測試,B分數為比奈-西蒙測試。

此時的智商測試只是在一些學校出現,分布很散。報刊上雖然時常出些智力小測驗,但正規的智商測試遠沒有普及。1931年,中國測驗學會成立,一項主要任務就是協調各地的智商測試。

但這種勢頭很快被打斷。1949年後,中國心理學界開始接受辯證唯物主義和蘇聯心理學改造,「反右」期間,智商測試因為是「資產階級方向心理學」遭全面中止。1965年,姚文元在《光明日報》撰文,批判心理學為「資產階級偽科學」,雖然同一時期,資產階級的美國青年也在嚴厲指責心理學為「種族主義」幫兇。

高考恢復後,為研究中國科大等「少年班」的神童現象,學界重啟了智商測驗。1980年代初,韋氏成人智力量表和斯坦福-比奈測驗表的中國版制定出來,成規模的智商測試變為可能。

對民眾來說,對智商的了解更多的來自於大眾傳媒。1980年代中期開始,報刊和電視上「智商」概念不斷提及,人們將智商作為智力的同義詞,用以表示「聰明」,「機智」。

不過,中國人對智商測試始終不曾狂熱過。中國人所熟悉的愛迪生的名言是「天才是百分之九十九的汗水加上百分之一的靈感。」而愛因斯坦一連做了三個小板凳的故事,也曾進入小學的教科書,以此告訴學生們勤能補拙。

而情商概念一經傳入中國,就迅速替代智商,成為解釋成功者的最重要特質。雖然上世紀80年代以來,人口開始自由流動,但傳統熟人社會中的背景和關係仍是當下的典型話語,人脈網絡被視為是改變命運的最主要途徑。與西方國家不同,中國式的英雄主義也不建立在超眾的個人能力之上,而更強調個人為集體所作的犧牲。

相關焦點

  • 智商測試真的靠譜嗎?多少分才是正常?
    智商的測試標準其實並不統一,完整的智力測試多以邏輯推理、數字敏感、空間思維、詞彙量、創造能力、記憶能力等多方面進行考核。權威智商測試標準大都由淺入深,測試人的判斷理解及邏輯等能力。很多國家從兒童時期起就開始進行測試,通過測試可以找出智力低下者,比奈-西蒙智力測量表是20世紀最流行的測試題。下面我們就來聊聊關於智商和智商測試的那些事:智商測試滿分是多少?智商測試滿分是150分,也就是我們常說的天才。
  • 你朋友圈曬的智商測試有多不靠譜?
    在90年代的美國,殺了人可以免於罪刑——只要兇手的智商夠低。1996年,一名叫達裡爾·阿特金斯的人殺害了一名空軍士兵,將被判死刑。但是,因為他的智商測試結果是59,低於死刑最低智商標準———70,僥倖保命。讓人疑惑的是,2005年,阿特金斯再次測試,結果卻顯示,他變聰明了,智商達到了74-76。這就很尷尬了,智商真的可以被測量嗎?這些年風生水起的智商測試,到底靠譜嗎?
  • 心理測試:選擇你喜愛的一片沙灘,測你的戀愛智商是怎麼樣的
    心理測試:選擇你喜愛的一片沙灘,測你的戀愛智商是怎麼樣的現今當代的這個時候,已經是有著越來越多數量的人喜歡出去旅遊了,如此這樣以來既是可以放鬆自己的一個壓力感,同樣的又是可以體驗一下不一樣的一個獨到的魅力感覺。
  • 劇說《偏見的本質》:那個孬兵!
    這或許就是「偏見」的力量吧。看不慣許三多,是因為他不屬於高連長心目中好兵的標準。這就是高連長的偏見,對於好兵標準要求必須符合自己的標準的偏見,對於許三多這個人的由外觀表現看不起造成心底對他不報希望的偏見。02. 《偏見的本質》那麼,偏見的本質到底什麼呢?
  • 哈士奇在智商測試中合格通過,另外一隻狗子把主人笑哭!
    很多人說哈士奇除了長得好看一無是處,而且智商還低,這裡小編要跟大家科普下,我們平時去定義狗狗的智商高低一般是狗狗的服從性與學習能力,然而哈士奇是一種很有個性的狗狗,它本性就是不服從,一種我行我素的態度。所以一直說想訓練哈士奇是件很難的事情,其實它的智商並沒有大家傳說的那麼低。
  • 運氣測試:假如迷路了,你選下面哪一條路?測你的智商有多高?
    運氣測試:假如迷路了,你選下面哪一條路?測你的智商有多高? A、 ,對將來有明確的規劃,不會因為意外的危險,就徹底失去方向,作為一個睿智的人,將來的日子會越來越好,享受美好人生,事業也做得很大,什麼都不缺,你的智商決定了你的人生高度,在未來會越過越好,享受美好未來!
  • 2016世界人工智慧智商測試結果公布
    並且公布了根據研究成果對2014年,2016年對3個不同年齡階段的人群和世界50多人工智慧系統進行測試的結果,結果如下:會上,劉鋒老師表示,人工智慧智商的評測沒有一個明確的參考準則是引起「人工智慧是否會超越人類的爭議」的重要原因。  人工智慧的智商評定需要得出一個被量化的結果,才能給人工智慧智商的評測提供一個具體的可參考數據。
  • IQ測試:2道數學智力題,據說智商125+的人只需3分鐘,你呢?
    所謂IQ就是指智商,它是衡量一個人智力高低的標準,這個概念最早是由美國史丹福大學心理學家推孟教授提出的。雖然說智商的概念看上去非常簡單,然而至今為止,還很真沒有任何一家機構或者單位能夠準確測量出一個人的智商。
  • 中國人是智商最高的人種?
    在統計了世界各國智商調查的結果之後,他得出結論說,歐洲人的平均智商剛好不多不少是100,而東亞人(包括中國、日本和朝鮮人)的平均智商最高,達105。  林恩謙虛地把自己所屬種族的智商放在第二位的用意倒不是為了討好東亞人,而是為了給自己歧視黑人的種族主義主張打掩護。根據林恩的統計,非洲黑人的智商低得不可思議,平均還不到70,而非洲叢林人和俾格米人更是只有54。
  • Running Man搞笑智商測試,倒數第一競爭激烈,Gary最經典專輯!
    重點在於要進行智商測試,嘉賓智商都很高就不解釋了,不過想想成員們可能...最後結果一開始也沒有公布,只是說成員中智商最高的是劉在石,不愧是我劉大神啊,本以為會是宋智孝這樣的美女,確實有點出乎意料!劉大神榮獲第一測試完智商後,因為要去無人島的緣故,所以成員們也上了船。
  • 平均智商高為啥科技水平比平均智商低的國家落後?
    智商測試排名如下:東亞人(包括中國人、日本人、朝鮮人)的平均智商最高,平均值為106歐洲人100愛斯基摩人91東南亞人87美洲本土印第安人87太平洋諸島土著居民85南亞及北非人84撒哈拉非洲人67澳大利亞原著民62南非沙漠高原的叢林人和剛果雨林地區的俾格米人,平均智商為
  • 全球智商分布圖:中國人、日本人、朝鮮人智商最高
    原標題:全球智商分布圖:中國人、日本人、朝鮮人智商最高 圖1 全球智商分布圖 (顏色越紅表示這個國家人口的平均智商越高) 據北京科技報報導,在收集研究了130個國家的智商測試後,最近,英國一位研究人種智商的學者得出了一個令亞洲人感到既驚訝又高興的結論
  • 心理測試:你拿筷子的姿勢,直接暴露出你是情商高還是智商高!
    心理測試:你拿筷子的姿勢,直接暴露出你是情商高還是智商高! C: A:如果你是這種拿筷子的姿勢,說明你是情商高,智商低
  • 東亞人平均智商排第一
    東亞人平均智商排第一 這一地圖由英國阿爾斯特大學教授理察?林恩繪製,他在《不同種族的智力差異:進化分析》一書中,將世界分為不同地區,並分別分析了每個地區人種的平均智商。 他的研究顯示,東亞人(中國人、朝鮮人、日本人)的平均智商最高,達到105。歐洲人緊接其後,平均智商為99。
  • 鏟屎官搭建迷宮測試貓咪智商,卻被機智破解,主人感嘆貓咪高智商
    我們想一想,狗狗的智商排名是哪裡來的?還不就是那些科學家對狗狗的智力進行了檢測之後才得出的結論嗎?那麼貓咪的智商排行存在嗎?很多科學家想要測試貓咪的智商,但是很多時候貓咪都不配合,這樣的貓咪,你說它聰明吧?貓咪有時候很聰明!你說貓咪笨吧?
  • 是要比智商的節奏嗎?
    今天就更奇葩——開始比智商!說實話,我還真沒想過這個方面,人的智商和他的經歷、學歷都有關係,只是相對來說,中國的教育走的徹底,文盲率低,在這個方面來說,可能中國人的平均智商要高一點,當然這和人種沒關係!中國人自信,但不盲目,這種自信是骨子裡來的!中國人勤勞,這是流在血液裡的!
  • 《馬戛爾尼使團使華觀感》——現代人的大清穿越旅行團
    首先,時間點上不同,馬嘎爾尼更多的會提到韃靼人與中國人的區別與關係,而且馬嘎爾尼經歷了啟蒙運動以及法國大革命,更接近現代人的思想與價值。區分現代人的,應當是價值觀而不是民族與血緣。比起當時的清國人,顯然馬嘎爾尼勳爵與現代讀者屬於一類人。馬嘎爾尼的記錄與評價,完全就如同一個穿越回去的現代人。我相信,一個心智健全的現代人,面對裹腳等等事物時,透露出的應當是反感與噁心,而不是僅僅因為它是中國的,便非要捍衛不可,或是非得找出對方身上的陋規來逞口舌之快。成熟的現代人應當具備面對與承認的勇氣。
  • 「人種決定智商」?DNA之父屢屢禍從口出終跌落神壇
    1月2日,在美國公共電視臺(PBS)播放的一部名為「美國大師:揭秘沃森(American Masters: Decoding Watson)」的紀錄片中,沃森對採訪者表示,導致白人和黑人在智商測試上有不同表現的主要原因是遺傳因子。這句充滿了種族主義歧視色彩的話讓這位學界「大神」瞬間淪為眾矢之的。
  • 三點水加個「去」字念什麼,路人的智商讓人堪憂,網友:智商是硬傷
    三點水加個「去」字念什麼, 路人的智商讓人堪憂, 網友: 智商是硬傷今天,隨著網際網路的飛速發展,人們越來越依賴網際網路,尤其是移動網際網路。現在,只要有手機,他們基本上可以做任何事情。今天說的就是這樣一個測試,法律的「法」字並不是生僻字,是三千五百常用字之一,可以說這是最好的識別詞,但在這個測試中,有很多人不知道,一些網民直接看後稱「智商是硬傷啊!」
  • 定型化效應:不做刻板、偏見的人
    在一項關於偏見的研究中,科研人員向美國白人學齡兒童展示憤怒和高興的表情圖片,並讓他們塗上自己喜歡的顏色,結果,大部分兒童將憤怒表情塗成黑色,高興的表情塗成白色,這表明這些兒童潛意識裡是有種族偏見的。類似的偏見還有很多,例如猶太人和美國人的形象,在中東沙烏地阿拉伯和伊朗的電視節目中常常被醜化,這種現象已經持續了很多年,即使到今天也無法改變。