在線更新適應數字時代 90歲《牛津詞典》「變」中求生

2021-01-07 中國財富網官方

詞典編纂者伯納黛特·帕頓正在為《牛津英語詞典》起草一個全新的單詞條目「snowflake」。這個最早出現在1983年英文文本「每個人都是一片雪花,沒有任何兩個人一模一樣」、意為「雪花」的單詞一度用來被指代「千禧一代」,而在2016年它成了一個意指「具有玻璃心的90後年輕人」的熱詞。像「snowflake」這類帕頓和同事們需要為《牛津英語詞典》更新或是新建的單詞條目目前總共有大約3萬個,並且每年以7000個的速度在增長。

一年修正一個單詞

編纂堅持嚴謹態度

儘管身處在一個「以快為美」的網絡時代,但在牛津大學出版社辦公室裡《牛津英語詞典》的編纂者們顯得「格格不入」,甚至有人花費一整年的時間來修正「go」這個英文單詞的釋義。「每個人都覺得我們太慢了,但實際上,這樣的處理速度已經是相當快的了。」帕頓說。

「低效」的紙質《牛津英語詞典》出版物該不該叫停?它應當如何適應數字時代並生存下去?

對於使用者來說,詞典是一份人們使用或曾經使用過的單詞清單,可以說明這些單詞曾經或者現在的意義。對於編纂者來說,沒有比詞典更複雜的了,誰使用了這些單詞?何時何地?你是如何得知的?哪些詞語被收錄過,依據是什麼?你又如何將這一含義區別於另一個含義?追根溯源,這個單詞的詞根是什麼……

為了要修正《牛津英語詞典》中「go」這個單詞的解釋,帕頓和同事們不僅需要收集這個由兩個字母組成的、最古老的英文動詞之一的詞義變化,甚至還要抓取最近十多年裡人們在社交媒體上的口舌之爭中使用「go」的痕跡。經過他們的考證,在數千年裡「go」出現了多達537種不同的語義,而這耗費了他們12個月的時間。但對於《牛津英語詞典》的編纂者來說,他們編纂這樣一部詞典的目的就是要賦予這些英文單詞應有的莊嚴。

總共花費71年心血

完成世界最大詞典

然而,這樣費神費力的英語詞典編纂工作在16世紀「啟動」之初僅僅只是零碎單詞的羅列,由古老的盎格魯-日耳曼語、挪威語、拉丁語和希臘語雜糅而成。但隨著16世紀中期的政治動蕩和伴隨殖民貿易而來的新移民潮,英語這個語言開始充斥著混亂的拼寫和詞義使用,毫無規範可言。而科學與醫學的發展更是「火上澆油」,製造了更多的混亂。1582年,英國歷史上一個著名的中學校長理察·馬爾卡斯特呼籲,把「我們在英語中使用的所有詞語彙集成一本詞典」,明確英語詞彙的「正確使用」規則。

1857年,在倫敦語言學會的呼籲下,《牛津英語詞典》的前身《新英語詞典》的編纂工作開始了,但誰也不會料到它會成為「時間殺手」。1876年,蘇格蘭教師和文學家詹姆斯·莫裡接手主編工作。為了能加快進度,莫裡印發了一份倡議書,希望找到志願者能夠協助從報紙和圖書館的書籍中摘抄例句,提供給編纂者用來說明某個單詞隨著時間發生的變化。

莫裡的「人海戰術」得到了來自世界各地各行各業2000多名志願者的響應,他們收集了大約500萬條例句。儘管如此,在這個項目正式實施5年之後,編纂團隊的工作進度條依然只覆蓋了一半A打頭的單詞。1879年,牛津大學出版社經過商議同意承擔出版工作。5年後,《新英語詞典》開始定期結冊出版,直到1928年第十卷出版,這部詞典涵蓋了約41.48萬個詞條和短語,每個條目都有注釋、寫明了詞源,此外還有180萬條例句。它也被後人視為第一版的《牛津英語詞典》。

儘管「遲到」了太久,出版商對這個「世界最大」的英語辭典的宣傳語是「最高權威,沒有競爭對手」。而為了慶祝這個花費71年心血最終編纂完成的辭典,英國人更是為之舉辦了一場晚宴以示慶祝。

遭遇數字時代挑戰

紙質詞典舉步維艱

但在內行人看來,這個大部頭的《新英語詞典》的缺陷是顯而易見的。1928年第一版完成時,A至C的詞彙是在將近50年前編纂的,早就不符合當時英語語言發展的最新趨勢。其他條目依託的科技知識也落伍了。唯一的解決方案就是修訂。

1933年,《新英語詞典》第一次增補版出版,同時它也有了新名字《牛津英語詞典》。1972年至1986年,第二次增補分四卷出版,新增了共計6.93萬多項新詞條。1989年,匯集了初版和增補本、20卷的第二版《牛津英語詞典》問世。現如今,第三版的修訂工作仍在進行過程中。

然而,編纂英語詞典是一項永遠不可能完成的工作。除了將英語作為第一語言的人口,世界上近四分之一的人口使用英語作為第二語言。從西印度洋群島到東非,再到威爾斯英語、印度英語、中式英語……英語已經成了一門一直處於變化之中的「混合語言」。網際網路的發展,尤其是社交網絡的流行更加速了這門語言的變化,就像「snowflake」這樣一個簡單的單詞也開始「涉足」更多的領域,甚至你根本無法看出「千禧一代」這個意思與「snowflake」有什麼直接的聯繫。在不同地區、不同媒介中使用的英語正在以越來越快的速度彼此交織,每年都會有大約7000個新單詞出現。因此,當1989年3月《牛津英語詞典》第二版出版時,有人抱怨說它根本不是什麼「新版」詞典,只是一個換了排版方式的、早就落伍的舊版詞典。

而現在,當人們需要查詢某個單詞的意思或者使用方法,紙質版的詞典或許已經不再是首選,更別提大部頭的《牛津英語詞典》了。打開電腦,登錄谷歌或者維基百科之類的搜尋引擎,一查便可知曉;有時你甚至只需要衝著蘋果手機上的Siri或者智能音箱大喊一聲,便能得到答案。紙質詞典的銷售瀕臨崩潰,實體書的出版商紛紛合併或走到了盡頭。對於用戶來說,如果完全可以通過操作智慧型手機來查找詞義,那為什麼還要拿起一本書呢?

科技帶來全新工具

內容修訂走出紙面

如何讓這個90歲高齡的《牛津英語詞典》在數字時代重獲生機,編纂者必須做點什麼。

數字時代給辭典編纂者帶來了壓力,也帶來了新的工具——語料庫語言學出現了。在過去,傳統的辭典編纂模式通過整理並依據已知的單詞及其注釋,尋找證據證實編纂者認為的詞義。但如今,以計算機為主導的語料庫語言學要求編纂者通過數位技術批量獲取人們真實使用著的語言,比如社交網絡用語等,並以此為依據來編纂辭典。

牛津大學出版社的一名主管興奮地說,辭典編纂與語料庫語言學資源結合,「可以實現一些不一般的事」,這種說法一點也不誇張。目前為辭典提供原材料的語料庫所包含的詞彙遠遠超出編纂者最瘋狂的想像。整理包含特定詞語的短語,可以讓編纂者「解開」這個詞不同的涵義,觀察一個詞如何被「誤用」,可以發現它的詞意重心正在變化。在俚語專家、《牛津英語詞典》顧問喬納森·格林看來,長期以來俚語詞典編纂者追蹤詞彙的不同使用形式的夢想如今終於通過即時交流軟體和語料庫實現了,甚至他們幾乎可以在新詞被創造出來的那一刻就及時跟上進度,將其編入詞典中。

從與技術「聯手」發現新詞起,《牛津英語詞典》的編纂就走上了一條數位化道路。編纂團隊也逐漸意識到,隨著更多線上詞典競爭對手的出現,《牛津英語詞典》的出版也不能再依賴於「慢一步」的紙張印刷,只有藉助網絡才能實現詞典的時時更新。從2000年起,《牛津英語詞典》的全部內容修訂走出紙面,開始以在線形式呈現,按季度更新,每次更新包含數千個修訂過的詞條以及數百個新詞。

但即時在線更新並不意味著所有新詞都會被收錄,仍然希望確保自己權威地位的《牛津英語詞典》並不願意被潮流牽著鼻子走,在他們看來,即便在數字時代收錄一個新詞依然是一件十分嚴肅的事情。作為規定,一個新詞依然需要「存活」5年時間才會被收錄進在線版的《牛津英語詞典》,因為一旦它被收錄進了詞典,就不會被刪除。

牛津大學出版社全球業務總裁及詞典部總裁卡斯珀·格萊斯沃爾已經在牛津大學出版社工作超過20年。從紙質圖書印刷到現在的在線詞典,他親眼見證了牛津大學出版社的歷史,也見證了整個科技演變的過程及其對行業帶來的影響。「我們並不是想要把紙質的字典變成電子的詞典,不是一個簡單的重複過程,而是希望詞典的內容和使用,能夠融合在語言學習的過程當中。」格萊斯沃爾說。團隊也開始與美國矽谷的一些科技公司合作,將團隊搜集到的所有語料交由科技公司轉換為智能語言數據,並開發成各種應用程式,為英語學習者提供數字產品和服務。

步入數字時代的《牛津英語詞典》依然沒有放棄印刷版的想法。「我們會完成的。」《牛津英語詞典》現任總編輯麥可·普羅菲特堅持道,再版這個大部頭的「高齡」詞典可能要等到2037年。

相關焦點

  • 90歲《牛津詞典》「變」中求生
    它應當如何適應數字時代並生存下去?  對於使用者來說,詞典是一份人們使用或曾經使用過的單詞清單,可以說明這些單詞曾經或者現在的意義。對於編纂者來說,沒有比詞典更複雜的了,誰使用了這些單詞?何時何地?你是如何得知的?哪些詞語被收錄過,依據是什麼?你又如何將這一含義區別於另一個含義?
  • 90歲牛津詞典在線更新 新詞「存活」5年才收錄
    在線更新適應數字時代 堅持不放棄紙質出版物  90歲《牛津詞典》「變」中求生  詞典編纂者伯納黛特·帕頓正在為《牛津英語詞典》起草一個全新的單詞條目「snowflake」。  「低效」的紙質《牛津英語詞典》出版物該不該叫停?它應當如何適應數字時代並生存下去?  對於使用者來說,詞典是一份人們使用或曾經使用過的單詞清單,可以說明這些單詞曾經或者現在的意義。對於編纂者來說,沒有比詞典更複雜的了,誰使用了這些單詞?何時何地?你是如何得知的?哪些詞語被收錄過,依據是什麼?你又如何將這一含義區別於另一個含義?
  • 新詞入牛津詞典? 「存活」5年才收錄
    文藝看臺  如何讓90歲高齡的《牛津英語詞典》在數字時代重獲生機?數字時代給辭典編纂者帶來了壓力,也帶來了新的工具——語料庫語言學出現了。在過去,傳統的辭典編纂模式通過整理並依據已知的單詞及其注釋,尋找證據證實編纂者認為的詞義。
  • 牛津在線詞典收錄「比特幣」「自拍」等新詞
    牛津在線詞典周三宣布收錄了bitcoin(比特幣)、emoji(表情符號)和selfie(自拍)等既時尚又有影響力的新詞。不過,需要明確的是,這些單詞並未增加到《牛津英語詞典》,只是增加到牛津詞典在線網站中。
  • 網絡熱詞"OMG"等被收入《牛津英語詞典》在線版
    最近更新的《牛津英語詞典》在線版中,OMG(英文「我的天啊」縮寫)、LOL(英文「大笑」縮寫)等在網際網路上廣為流傳的縮略詞被收錄進去,同時在《牛津英語詞典》127年的歷史上還首次收入了心形符號。
  • 牛津英語詞典更新新詞,「男人的說教」是什麼意思?
    2018 年 1 月 30 日,牛津英語詞典更新了在線詞庫,這次更新了 1100 餘個新詞、子條目和新義項,其中,與母嬰育兒相關的新詞超過了 100 個。牛津英語詞典的編撰者希望能「敏銳地捕捉到英語語言最新的變化和發展」,在增添新的專業術語時,詞典的編輯們往往會諮詢不同領域的專家的意見。這次,面對大量出現的育兒相關的新概念,編輯們向在線育兒論壇 Mumsnet 請求支援。在《衛報》的採訪中, OED 的資深編輯 Fi Mooring 提到了一些很有意思的事情。
  • 《牛津英語詞典》進行特別更新
    據《衛報》報導,4月,英語權威詞典《牛津英語詞典》專門修訂了COVID-19和與該流行病有關的詞條,將WFH(「work from home」的縮寫,即「居家工作」)、「社交距離」和「自我隔離」等詞彙進行了特別更新,將COVID-19產生的影響納入到《牛津英語詞典》對英語語言的最終記錄中去。
  • 從Twitter、Amazon學習,90歲的《牛津英語詞典》這樣擁抱數位化
    而在全球範圍內,這一群體數字將會是20億。」日前,牛津大學出版社全球業務總裁及詞典部總裁Casper Grathwohl 在接受鈦媒體專訪時說。英語的全球化普及,1928年問世的牛津大學出版社的《牛津英語詞典》(Oxford English Dictionary,OED)功不可沒。它一直被視為最全面和權威的英語詞典。
  • 《牛津英語詞典》轉型網際網路化 從傳統工具書到在線教育標配
    將近1000頁的《牛津英語詞典》被認為是學英語必備的工具書,陪伴了好幾代中國學生和老師。面世90年以後,這本詞典已經從學生的課桌、書架上走到他們的手機App、視頻直播課裡。但面對網際網路浪潮,邁入90歲的牛津詞典也開始憂慮自己的未來。紙質的《牛津英語詞典》很容易打斷學生的學習過程。Casper Grathwohl向界面新聞解釋,學生遇到不懂的單詞需要停下來查閱詞典,然後再放下詞典繼續閱讀、學習。另外,紙質詞典不能追蹤學習數據,沒有數據支持,詞典很難更深入地參與學生學習的過程。
  • 新冠病毒讓牛津英語詞典提前更新了
    據《衛報》報導,4月,英語權威詞典《牛津英語詞典》專門修訂了Covid-19和與該流行病有關的詞條,將WFH (「work from home」的縮寫,即「居家工作」)、「社交距離」和「自我隔離」等詞彙進行了特別更新,將Covid-19產生的影響納入到《牛津英語詞典》對英語語言的最終記錄中去。
  • 牛津在線詞典將添加更多流行詞彙
    【環球科技綜合報導】據英國《每日郵報》8月14日報導,在OxfordDictionaries.com最新季度的詞彙更新中,「binge-watch(狂看)」、 「humblebrag(裝逼)」、 「YOLO(You Only Live Once)」這一類的詞彙被補充到了在線詞庫中,這一補充同時也反映出了當前的語言詞彙使用和表達的趨勢。
  • 《牛津英語詞典》 時隔十年更新最後一詞
    《牛津英語詞典》每個季度更新一次,迄今為止收錄了大約82.6萬詞條。在最新一版詞典中,新增詞條「zyzzyva」成為最後一個詞條,取代了「zythum」保持了十年之久的特殊地位。 詞典編輯菲奧娜·麥克弗森說:「沒人知道zyzzyva從哪來,有人說它指的是象鼻蟲發出的噪聲。」
  • 捷豹向牛津英文詞典申請修改汽車的在線釋義!
    北京時間8月15日消息,據國外媒體報導,塔塔汽車所持有的汽車品牌捷豹向牛津英文詞典和牛津詞典網站提交正式申請,要求修改英文單詞「car」的官方在線釋義。捷豹要求對該單詞的釋義中加入電動汽車的內容。捷豹推出的電動SUV車型I-Pace榮膺2019年度車型和當年歐洲年度車型的稱號,其在一份聲明中表示:「儘管如此,嚴格意義上來說,汽車的定義中並沒有包含零排放汽車。」牛津英文詞典是歷史上英文語言中首屈一指的詞典,其在在線釋義中將「car」一詞解釋為「由引擎(通常是內燃引擎)驅動的、旨在運送司機和少數乘客、通常情況下具有兩個前輪和兩個後輪、主要適用於私人、商用及休閒領域的路上車輛。」
  • 破例|《牛津英語詞典》因疫情更新
    近日,《牛津英語詞典》在官網更新了《2020年4月新詞列表》,針對與疫情相關的語言進行了語料庫數據分析,剖析了疫情衝擊給人類社會帶來的語言影響。破例,《牛津英語詞典》因疫情更新①隨著「WFH」(work from home,在家辦公)、「保持社交距離」和「自我隔離」等詞彙成為常用詞,《牛津英語詞典》進行了一次非常規更新,將新冠肺炎疫情相關詞彙納入其中。
  • 「add oil(加油)」納入牛津詞典 已被收錄的還有很多……
    參考消息網11月22日報導外媒稱,不久前,英國牛津大學出版社旗下的《牛津英語詞典》又再收錄一條中式英語詞彙「add oil」(加油),引發不少中西方媒體關注。據新加坡《聯合早報》網站11月21日報導,牛津大學出版社(中國)詞典總編輯劉浩賢向新華社記者介紹,牛津詞典有幾種途徑用於追蹤和提取新詞。比如,有個專為語言學研究設計的電子語料庫,裡面匯集了不同類型的書面語和口語。根據這些語言的使用情況,語料庫會「推薦」備選詞。
  • 《牛津詞典》前主編眼中最好的十部詞典
    現如今,絕大部分詞典都是嚴肅而冷靜的文件資料,容不得一星半點的惡搞。但語言和詞彙卻永遠那般趣味橫生。我所撰寫的《詞語偵探》(The Word Detective)一書就講述了這樣一個故事:一個天生厭惡老派學術的英語文學專業學生,在1976年擔任起了《牛津英語詞典》的編輯工作,逐漸對身邊的人、友誼、環境、詞語燃起濃濃愛意,尤其對這本詞典如何適應數字時代的過程深深著迷。
  • 牛津詞典迎接挑戰
    在牛津大學出版社,帕頓正在為《牛津英語詞典》(簡稱OED)起草新詞條。OED清單中約有30000個新詞條待編,每年新增7000個。「人們覺得我們很慢,其實已經很快了。」帕頓說。「雖然一位同事確實花了一年時間修訂『go』的含義。」
  • 「add oil」進牛津詞典!這些「中式英語」原來詞典裡都有……
    原標題:從中式英語「add oil」收錄進牛津詞典看中國文化的影響新華社倫敦11月18日電 (記者 張代蕾)不久前,又一條中式英語詞彙add oil(加油)被英國牛津大學出版社旗下的《牛津英語詞典》收錄,引發不少中西方媒體關注。
  • 中式英語「add oil」被收錄進牛津詞典
    新華社倫敦11月18日電(記者張代蕾)不久前,又一條中式英語詞彙add oil(加油)被英國牛津大學出版社旗下的《牛津英語詞典》收錄,引發不少中西方媒體關注。作為全球權威的英語詞典,《牛津英語詞典》收錄新詞有何標準、在其悠久歷史中吸納了多少個「中國血統」詞彙呢?
  • 《韋氏》詞典已更新 氣功烏龍茶等詞被收錄(圖)
    《韋氏大學詞典》更新今秋推出第11版 納入新詞約百個 本報連線編輯部獲悉其吸收了外來詞   英文詞典傾心 氣功「嫁」入《韋氏》  此外 中國毛冠鹿一詞新入主 《牛津英語詞典》在線版專家認為中國人足跡遍全球把文化帶到各地