不是「work」(工作),不是「home」(家),這個詞的意義要大得多。
假設有一個人把網上所有的文本都下載下來,包括每一封郵件、每一條新發布的Facebook、每一本電子書、科學報告、雜誌文章,還有流水帳似的留言板。然後,他把這些內容都整合在一起,在這無數個句子中,你覺得最常見的會是哪個詞呢?
信不信由你,真的有一群痴迷文字的技術大神研究了這個問題。來見識一下牛津英語語料庫(Oxford English Corpus)吧,這裡面收錄了一系列牛津詞典,專注於搭建一個不斷擴容的資料庫。語料庫現有詞條超過25億,涵蓋了當今使用的各種英語詞彙,取材於世界各地。工作人員花了一年時間,把網上發表的文字收集在一起(也有一小部分來自學術期刊等出版刊物),將小說、博客、新聞報導、電子郵件、發布在社交媒體上的狀態全部編入資料庫。
run:用3個字母表達645種含義
作人員可以先睹為快,從整體上研究這些日常生活中用到的英語詞彙,了解單詞是怎樣變得流行或者過時的、短語是如何在英語國家中傳播的,以及原本早已存在的詞是如何被賦予新意義的。比如「run」(跑步)這個單詞,已經成為了英語中最複雜的詞。除此之外,他們絕對也能告訴我們,書面英語中最常用的單詞有哪些。
首先,讓我們從一個驚人的數據說起:在整個語料庫中,最常用的100個英語單詞出現頻率為50%,也就是說它們總共出現了12.5億次。光是「the」、 「be」、 「to」、 「of」、 「and」、 「a」、 「in」、 「that」、 「have」 和「I」這十大最常用的單詞就佔到了我們日常用語的25%。看到隨處可見的冠詞和介詞位居榜首,你可能並不驚訝。不過,細分到名詞、動詞、形容詞這樣的獨立詞類時,事情就變得有趣了。
比方說,用英文寫作的人似乎都非常正能量——最常用的形容詞是「good」(好的);「bad」(壞的)這個單詞只排到了第23位,前面是「public」(公共的)、「few」(很少的)和「important」(重要的)。此外,我們還特別關注生命的有限性——最常用的動詞是「be」(存在);最常用的名詞呢?是「time」(時間)。
「Time」(時間),是鐘錶的本質,時刻的量化,是拖延症患者的噩夢。儘管在所有詞類中僅位列第55,但在名詞類別下它卻拿下了第一位——「person」(人)、 「year」(年)、 「way」(方式)和「day」(天)都排在它後面。顯然,比起探討「man」(人類,名詞中排名第7)、「women」(女性,排名第14)和「child」(兒童,排名第12),我們更加苦惱於時光的流逝。
考慮到語料庫中詞彙的來源,這個排名就容易理解了。在核定計劃、製作進度表、排列任務優先級的時候,「time」(時間)這個詞在人際溝通中很能派上用場。如果再算上口語中常說的「just in time」(非常及時) 、「right on time」(來得剛好)、 「time off」(時間到)和「out of time」(沒時間了),「time」的可用語境就更多了。
講故事的時候也是一樣。所有的故事,不論是一個遭遇家庭不幸的人受到救助繼而改變了命運,還是關於噴嚏到底能噴多遠的無釐頭研究,都是按照時間順序一步一步展開的。不論你怎麼切分,時間就是一天的脈絡。因此,我們在語言使用中花如此多的筆墨來定義我們與時間的關係,也就不足為奇了。
原文選自:讀者文摘
譯者:王心怡
編輯:欽君
閱讀更多文章,請關注「文談」公眾號:cdwentan