身為留學黨的一枚,單詞對於我們來說是雅思託福等考試的基礎,背單詞也成了我們出國的第一步,然而我們需要多少詞彙量來做閱讀,生存或者在國外學習呢?來和主頁君一起看看大神是怎麼分析這個事情的吧~
文|魏劍鋒
From 英文悅讀
微信號:read_the_economist
相信你肯定聽過這樣的說法:學英語不用記那麼多單詞,學好常用的那幾千個就足夠了,老外常用的單詞也就那麼幾個而已。事實真的是如此嗎?究竟多少詞彙量才夠用?
在繼續討論這個話題之前,我們需要了解一個概念:詞彙覆蓋率。
詞彙覆蓋率是指文本中有多大比例的詞彙出自於特定詞表。因為這些詞表都是根據詞彙量水平按照詞頻分布而成,所以詞彙覆蓋率與詞彙量水平密切相關。詞彙覆蓋率與閱讀理解的水平也有直接聯繫。
國外語言學家 Laufer [1]在1997年的研究表明二語讀者需要掌握文章中所有詞彙的95%,才能對文章獲得大致的理解。即,如果要獨立完成閱讀任務,必須要做到平均每20個詞中只有一個詞不認識。如果要做到充分理解,則需要掌握文章中所有詞彙的98%及以上。另一位研究者 Carver [2]指出,對於英語母語者,詞彙覆蓋率也要達到98%-99%才能充分理解文本。也就是說,如果要實現有效閱讀,詞彙覆蓋率至少要達到95%。
回到前面的問題,只掌握常見的幾千個單詞是否夠用呢?這裡我給「夠用」下一個定義:能看懂《經濟學人》,《時代周刊》,《紐約時報》等外刊,能聽得懂BBC,VOA等新聞以及英語演講。
為了驗證這個說法是否靠譜,我做了一些統計。
這裡以讀懂《經濟學人》所需詞彙量為例,介紹一下統計過程。
統計需要用到的工具和材料:
AntConc 是由在日本早稻田大學執教的英國學者 Laurence Anthony 研發的一款語料庫檢索軟體。它可以應用於中小規模的詞頻統計、語料檢索,信息篩選等。我在之前曾經介紹過該軟體的用法。軟體的下載地址是:http://www.laurenceanthony.net
BNC 是英國國家語料庫 (The British National Corpus) 的簡稱,該語料庫是目前網絡上可直接使用的最大語料庫之一,也是目前世界上最具代表性的當代英語語料庫之一。英國國家語料庫針對英語詞頻統計給出了一個BNC 15000 詞表。這份詞表覆蓋了英國本土出版物語料中最常使用的15000個單詞。這份 BNC 詞表的下載地址是:http://www.audiencedialogue.net/susteng.html
《經濟學人》是英國經濟學人集團發行的一本政經老牌雜誌,其文章用詞風格和難度可以作為外刊的典型代表。這次統計我隨機選取了2016年的四期雜誌,總詞數為367992。為了保證分析統計結果的準確性,對其中不影響閱讀的1327個專有名詞以及簡寫進行了刪除,因此總詞數為366665。
本次統計我從BNC詞表中按照詞頻分別選取了前6000,前8000,前10000,前12000以及前15000個單詞,利用 AntConc 軟體的詞表篩選功能,統計出366665詞的《經濟學人》文本中,有多少詞落在各個詞表的範圍。得到的統計結果如下:
從統計圖中可以看出,《經濟學人》的36萬多詞文本中,只有 92.57% 的單詞落在BNC詞表中前8000詞區間中。也就是說,假如你的詞彙量是8000,那麼你只能讀懂《經濟學人》文本的92.57%,按照上面的詞彙覆蓋率標準,這樣的覆蓋率並不能保證順利理解文本。
如果你的詞彙量達到了10000,那麼你大概可以讀懂 95.05%的《經濟學人》,基本可以理解文本內容。如果詞彙量達到了15000,你的詞彙覆蓋率會上升到97.92%,基本達到了充分理解的程度。
由此看來,「掌握幾千個單詞就夠用」這種說法在閱讀中並不靠譜。即使你詞彙量達到8000,讀起野生外刊仍然會捉襟見肘。如果想要比較舒服地讀懂外刊,那麼你的詞彙量最好不要低於12000。
那麼,熟練掌握幾千個單詞對聽力夠用嗎?答案也是否定的。認真聽過BBC以及VOA的同學應該會留意到,這些聽力材料的難度並不比原版外刊低多少,要聽懂它們仍然需要10000以上的詞彙量。
關於詞彙量與聽力的關係,這裡還有一個例子可以佐證。
下面是馬丁·路德·金的著名演講 I have a dream 演講稿片段。由於當時面對的聽眾是廣大受教育程度不高的黑人底層民眾,演講稿會相對比較「平易近人」,以確保每個人都能夠聽懂。但這樣的演講稿仍然出現了不少「超綱詞」。
Five score years ago, a great American, in whose symbolic shadow we stand today, signed the Emancipation Proclamation. This momentous decree came as a great beacon light of hope to millions of Negro slaves who had been seared in the flames of withering injustice. It came as a joyous daybreak to end the long night of their captivity.
But one hundred years later, the Negro still is not free. One hundred years later, the life of the Negro is still sadly crippled by the manacles of segregation and the chains of discrimination. One hundred years later, the Negro lives on a lonely island of poverty in the midst of a vast ocean of material prosperity. One hundred years later, the Negro is still languished in the corners of American society and finds himself an exile in his own land. And so we've come here today to dramatize a shameful condition.
上面加粗的大部分單詞詞頻都落在前10000詞以外,換句話說,如果你的詞彙量不過萬,那麼你會有很大機率聽不懂馬丁·路德·金的演講。
因此,僅僅掌握幾千個單詞並不足夠。我們需要的,是更大的詞彙量。那麼,多大的詞彙量才算「夠用」呢?
下面是詞彙量測試網站 http://www.testyourvocab.com 統計出的英語母語人士詞彙量分布表:
可以看出,24歲左右的成年人詞彙量中位數接近25000,考慮到詞彙測試的誤差,這一數字應該落在20000到25000區間。
因此,真正夠用的詞彙量應該儘可能接近或達到英語成年母語者的中位數水平,即在兩萬到兩萬五左右。當然,詞彙積累並不是一件一勞永逸的事情,每個人的詞彙量會隨著英語學習時間的增加而不斷增長,這是一個持續一生的過程。
附:詞彙量測試網站:http://www.testyourvocab.com
參考文獻:
[1] Laufer, B. How much lexis is necessary for reading comprehension? [J]. In P. Arnaud and H. Bejoint (ed.). 1992, 13: 126-132.
[2] Read, J. Assessing Vocabulary [M]. Cambridge: Cambridge University Press
本文系授權發布,From 英文悅讀,By 魏劍鋒,微信號 read_the_economist,歡迎分享到朋友圈,未經許可不得轉載,INSIGHT CHINA 誠意推薦