詞典編纂者伯納黛特·帕頓正在為《牛津英語詞典》起草一個全新的單詞條目「snowflake」。這個最早出現在1983年英文文本「每個人都是一片雪花,沒有任何兩個人一模一樣」、意為「雪花」的單詞一度用來被指代「千禧一代」,而在2016年它成了一個意指「具有玻璃心的90後年輕人」的熱詞。像「snowflake」這類帕頓和同事們需要為《牛津英語詞典》更新或是新建的單詞條目目前總共有大約3萬個,並且每年以7000個的速度在增長。
一年修正一個單詞
編纂堅持嚴謹態度
儘管身處在一個「以快為美」的網絡時代,但在牛津大學出版社辦公室裡《牛津英語詞典》的編纂者們顯得「格格不入」,甚至有人花費一整年的時間來修正「go」這個英文單詞的釋義。「每個人都覺得我們太慢了,但實際上,這樣的處理速度已經是相當快的了。」帕頓說。
「低效」的紙質《牛津英語詞典》出版物該不該叫停?它應當如何適應數字時代並生存下去?
對於使用者來說,詞典是一份人們使用或曾經使用過的單詞清單,可以說明這些單詞曾經或者現在的意義。對於編纂者來說,沒有比詞典更複雜的了,誰使用了這些單詞?何時何地?你是如何得知的?哪些詞語被收錄過,依據是什麼?你又如何將這一含義區別於另一個含義?追根溯源,這個單詞的詞根是什麼……
為了要修正《牛津英語詞典》中「go」這個單詞的解釋,帕頓和同事們不僅需要收集這個由兩個字母組成的、最古老的英文動詞之一的詞義變化,甚至還要抓取最近十多年裡人們在社交媒體上的口舌之爭中使用「go」的痕跡。經過他們的考證,在數千年裡「go」出現了多達537種不同的語義,而這耗費了他們12個月的時間。但對於《牛津英語詞典》的編纂者來說,他們編纂這樣一部詞典的目的就是要賦予這些英文單詞應有的莊嚴。
總共花費71年心血
完成世界最大詞典
然而,這樣費神費力的英語詞典編纂工作在16世紀「啟動」之初僅僅只是零碎單詞的羅列,由古老的盎格魯-日耳曼語、挪威語、拉丁語和希臘語雜糅而成。但隨著16世紀中期的政治動蕩和伴隨殖民貿易而來的新移民潮,英語這個語言開始充斥著混亂的拼寫和詞義使用,毫無規範可言。而科學與醫學的發展更是「火上澆油」,製造了更多的混亂。1582年,英國歷史上一個著名的中學校長理察·馬爾卡斯特呼籲,把「我們在英語中使用的所有詞語彙集成一本詞典」,明確英語詞彙的「正確使用」規則。
1857年,在倫敦語言學會的呼籲下,《牛津英語詞典》的前身《新英語詞典》的編纂工作開始了,但誰也不會料到它會成為「時間殺手」。1876年,蘇格蘭教師和文學家詹姆斯·莫裡接手主編工作。為了能加快進度,莫裡印發了一份倡議書,希望找到志願者能夠協助從報紙和圖書館的書籍中摘抄例句,提供給編纂者用來說明某個單詞隨著時間發生的變化。
莫裡的「人海戰術」得到了來自世界各地各行各業2000多名志願者的響應,他們收集了大約500萬條例句。儘管如此,在這個項目正式實施5年之後,編纂團隊的工作進度條依然只覆蓋了一半A打頭的單詞。1879年,牛津大學出版社經過商議同意承擔出版工作。5年後,《新英語詞典》開始定期結冊出版,直到1928年第十卷出版,這部詞典涵蓋了約41.48萬個詞條和短語,每個條目都有注釋、寫明了詞源,此外還有180萬條例句。它也被後人視為第一版的《牛津英語詞典》。
儘管「遲到」了太久,出版商對這個「世界最大」的英語辭典的宣傳語是「最高權威,沒有競爭對手」。而為了慶祝這個花費71年心血最終編纂完成的辭典,英國人更是為之舉辦了一場晚宴以示慶祝。
遭遇數字時代挑戰
紙質詞典舉步維艱
但在內行人看來,這個大部頭的《新英語詞典》的缺陷是顯而易見的。1928年第一版完成時,A至C的詞彙是在將近50年前編纂的,早就不符合當時英語語言發展的最新趨勢。其他條目依託的科技知識也落伍了。唯一的解決方案就是修訂。
1933年,《新英語詞典》第一次增補版出版,同時它也有了新名字《牛津英語詞典》。1972年至1986年,第二次增補分四卷出版,新增了共計6.93萬多項新詞條。1989年,匯集了初版和增補本、20卷的第二版《牛津英語詞典》問世。現如今,第三版的修訂工作仍在進行過程中。
然而,編纂英語詞典是一項永遠不可能完成的工作。除了將英語作為第一語言的人口,世界上近四分之一的人口使用英語作為第二語言。從西印度洋群島到東非,再到威爾斯英語、印度英語、中式英語……英語已經成了一門一直處於變化之中的「混合語言」。網際網路的發展,尤其是社交網絡的流行更加速了這門語言的變化,就像「snowflake」這樣一個簡單的單詞也開始「涉足」更多的領域,甚至你根本無法看出「千禧一代」這個意思與「snowflake」有什麼直接的聯繫。在不同地區、不同媒介中使用的英語正在以越來越快的速度彼此交織,每年都會有大約7000個新單詞出現。因此,當1989年3月《牛津英語詞典》第二版出版時,有人抱怨說它根本不是什麼「新版」詞典,只是一個換了排版方式的、早就落伍的舊版詞典。
而現在,當人們需要查詢某個單詞的意思或者使用方法,紙質版的詞典或許已經不再是首選,更別提大部頭的《牛津英語詞典》了。打開電腦,登錄谷歌或者維基百科之類的搜尋引擎,一查便可知曉;有時你甚至只需要衝著蘋果手機上的Siri或者智能音箱大喊一聲,便能得到答案。紙質詞典的銷售瀕臨崩潰,實體書的出版商紛紛合併或走到了盡頭。對於用戶來說,如果完全可以通過操作智慧型手機來查找詞義,那為什麼還要拿起一本書呢?
科技帶來全新工具
內容修訂走出紙面
如何讓這個90歲高齡的《牛津英語詞典》在數字時代重獲生機,編纂者必須做點什麼。
數字時代給辭典編纂者帶來了壓力,也帶來了新的工具——語料庫語言學出現了。在過去,傳統的辭典編纂模式通過整理並依據已知的單詞及其注釋,尋找證據證實編纂者認為的詞義。但如今,以計算機為主導的語料庫語言學要求編纂者通過數位技術批量獲取人們真實使用著的語言,比如社交網絡用語等,並以此為依據來編纂辭典。
牛津大學出版社的一名主管興奮地說,辭典編纂與語料庫語言學資源結合,「可以實現一些不一般的事」,這種說法一點也不誇張。目前為辭典提供原材料的語料庫所包含的詞彙遠遠超出編纂者最瘋狂的想像。整理包含特定詞語的短語,可以讓編纂者「解開」這個詞不同的涵義,觀察一個詞如何被「誤用」,可以發現它的詞意重心正在變化。在俚語專家、《牛津英語詞典》顧問喬納森·格林看來,長期以來俚語詞典編纂者追蹤詞彙的不同使用形式的夢想如今終於通過即時交流軟體和語料庫實現了,甚至他們幾乎可以在新詞被創造出來的那一刻就及時跟上進度,將其編入詞典中。
從與技術「聯手」發現新詞起,《牛津英語詞典》的編纂就走上了一條數位化道路。編纂團隊也逐漸意識到,隨著更多線上詞典競爭對手的出現,《牛津英語詞典》的出版也不能再依賴於「慢一步」的紙張印刷,只有藉助網絡才能實現詞典的時時更新。從2000年起,《牛津英語詞典》的全部內容修訂走出紙面,開始以在線形式呈現,按季度更新,每次更新包含數千個修訂過的詞條以及數百個新詞。
但即時在線更新並不意味著所有新詞都會被收錄,仍然希望確保自己權威地位的《牛津英語詞典》並不願意被潮流牽著鼻子走,在他們看來,即便在數字時代收錄一個新詞依然是一件十分嚴肅的事情。作為規定,一個新詞依然需要「存活」5年時間才會被收錄進在線版的《牛津英語詞典》,因為一旦它被收錄進了詞典,就不會被刪除。
牛津大學出版社全球業務總裁及詞典部總裁卡斯珀·格萊斯沃爾已經在牛津大學出版社工作超過20年。從紙質圖書印刷到現在的在線詞典,他親眼見證了牛津大學出版社的歷史,也見證了整個科技演變的過程及其對行業帶來的影響。「我們並不是想要把紙質的字典變成電子的詞典,不是一個簡單的重複過程,而是希望詞典的內容和使用,能夠融合在語言學習的過程當中。」格萊斯沃爾說。團隊也開始與美國矽谷的一些科技公司合作,將團隊搜集到的所有語料交由科技公司轉換為智能語言數據,並開發成各種應用程式,為英語學習者提供數字產品和服務。
步入數字時代的《牛津英語詞典》依然沒有放棄印刷版的想法。「我們會完成的。」《牛津英語詞典》現任總編輯麥可·普羅菲特堅持道,再版這個大部頭的「高齡」詞典可能要等到2037年。