當大數據遇上名作家:從納博科夫最喜歡的詞,看英美文化之異同

2020-12-12 無齋公子曰

No.1 文如其人:從文字的指紋,識別作者的風格

在大洋彼岸的美國,如果要說有哪一部著作的重要性能與華盛頓所發表的那部《美國獨立宣言》相媲美的話,那恐怕就只有美國憲法了。

1787年5月,為了對原本的聯邦條例進行修訂,根據美國聯邦國會的邀請,在喬治·華盛頓的主持下,在費城舉行了全國代表會議。經過了近三個月的秘密討論以後,與會者並沒有修訂條例,而是制定了一部全新的憲法,因此,這次會議也就成了美國歷史上著名的制憲會議。

按照規定,新憲法通過之後,要由聯邦十三個州的特別會議分別進行批准,其中至少有九個州同意,這部新憲法才能生效。然而,在各州的批准過程中,各州對這部新憲法產生了擁護和反對這兩種截然相反的意見,於是就引發了美國歷史上一場最激烈的論戰。

為推動新憲法能夠儘快獲批實施,美國的三位開國元勳,亞歷山大·漢密爾頓、約翰·傑伊、和詹姆斯·麥迪遜,共同以「普布利烏斯」作為筆名,在紐約的主要報刊上發表的一系列的論文,這些論文後來被匯總為《聯邦黨人文集》。

可以說,《聯邦黨人文集》為美國走向民主打下了堅實的基礎,是美國政治領域匯總最重要的著作之一。但是,其中有12篇文章的作者,究竟是漢密爾頓和麥迪遜這兩位開國元勳當中的哪一位,長久以來一直是個懸案,歷史學家們對此充滿好奇,他們孜孜不倦地試圖找到答案,但最終還是無功而返。

這個問題的最終答案,直到兩百多年後的1963年才被揭曉,而揭開謎團的兩位教授,其身份並非歷史學家,而是統計學家!

來自哈佛大學的莫斯特勒教授和來自芝加哥大學的華萊士教授,希望用概率方程來解決這個困擾史學界一百多年的難題——這聽起來很異想天開,但他們將詞頻和概率結合起來分析,真的找出了問題的答案。

拋開那些「階乘」、「指數」、「對數」、「T分布」等讓人頭大的統計學術語,這兩位教授所用的核心方法其實很簡單:

他們將那些確定是漢密爾頓或麥迪遜所寫的文章找出來,分別統計其中某些常用詞出現的頻率,接著,分析那12篇不能確定作者的文章中,這些常用詞出現的頻率——兩相比較之後,他們最終確定,這12篇文章的作者正是麥迪遜!

說穿了其實很簡單,我們常說「文如其人」,實際上,就像我們每個人都有獨一無二的指紋一樣,每個人在寫作時,也會有他獨一無二的「文字指紋」,或者說,是「文風」。

就拿漢密爾頓和麥迪遜的文章來說吧,在漢密爾頓的文章中,他經常會使用「while」這個單詞,但他從來不用「whilst」這個詞,而麥迪遜則恰恰相反。另外,麥迪遜使用「also」這個單詞的頻率是漢密爾頓的兩倍之多,而漢密爾頓則更多地使用「according」這個單詞。

這就是文字指紋的魔力,它向我們揭示出:每位作家都會有自己的文字風格,並且這種風格是可以進行預測的!

那麼問題來了——男性作家和女性作家在寫作方式上會有所不同嗎?作家們自己會遵循他們給別人提出的那些寫作建議嗎?從納博科夫到E.L.詹姆斯,這些著名作家在文章中最喜歡用的字眼是什麼?我們能僅從文字風格當中,把英國作家和美國作家區分出來嗎?

要回答這些問題,就需要藉助「文字指紋」的力量。

美國專欄作家本·布拉特對大數據非常感興趣,他曾經用大數據分析方法「計算」了自己經歷過的一段瘋狂棒球公路之旅——不搭乘飛機、在30天內造訪30座棒球場、觀賞30場棒球比賽、全程2萬英裡!

在《納博科夫最喜歡的詞》這本書中,布拉特用充滿趣味性的語言,向我們揭示了:當那些最經典的文學作品遇到大數據,會發生哪些奇妙的化學反應?又會帶給我們哪些全新的發現和體驗?

可以肯定地說:在大數據的慧眼之下,過去深埋於文字之下的一切,從此都將無所遁形!

No.2 英美文化探幽:本是同根生,文化大不同

蕭伯納曾經說過這樣一句話:「英國和美國是被同一門語言分開的兩個國家。

1620年,一艘名為「五月花號」的船隻,載有包括男、女及兒童在內的102名清教徒,由英國普利茅斯出發,最終抵達北美,並在那裡建立了第一塊英屬殖民地,而這件事也被視為是美國歷史的開端。

很多人總以為,既然英國和美國系出同門,那在文化、風俗上應當非常接近才對,但事實上,這兩個國家之間的差異之處,遠多過相似之處!

如果我們要分析國家之間的文化差異,那語言就是一道繞不過去的關口。美國著名翻譯家奈達曾說過這樣一句話:「語言永遠是文化的一個組成部分,任何文章所表達的意思,都直接或間接地與所屬文化相關聯。歸根結底,離開了相關文化,詞彙就失去了意義。文化的不同自然意味著語言的不同。

由此可見,語言差異是文化差異當中非常重要的一部分。

英式英語和美式英語當然並不是兩種獨立的語言,畢竟美式英語也是被那些乘坐五月花號移民美國的英國人帶去的。但在英國和美國之間,隔著廣闊的大西洋,於是,在幾百年的漫長時間裡,英式英語和美式英語各自獨立發展,最終形成了很多肉眼可見的顯著差異,而這些差異主要體現在發音、拼寫、詞彙等方面。

中國有一句老話叫「十裡不同音、百裡不同俗」,正如每個地方都有自己獨特的方言一樣,英美兩國地理位置相距甚遠,其發音規律也各不相同,因此,我們往往把英語的發音方式分為英音和美音兩類。

英式發音非常正統,所以才會有「英國皇家英音」這樣的說法,也就是Received Pronunciation,也有人管這種很有腔調的口音叫做「牛津口音」或「女皇口音」。另外,英國人說話的時候,語速普遍較快,整體的風格聽起來非常高冷、性感。

而美式發音就更加趨向於多元化了,畢竟美音是由很多不同的語言匯集形成的,更加自由、包容和開放。另外,很多情況下美國人講話的發音會稍顯誇張一點,這也體現出他們愛好自由、不拘小節的特徵。

除了語言上的差異之外,無論是處事態度還是生活習慣,英美文化之間也有著很大的不同。從很多的生活小細節中,你也能一眼區分出高冷的英國人,和不拘小節的美國人。

例如,在需要進行溝通交流的場合中,英國人往往表現得比較高冷和含蓄,對自己的想法更為保守一些。他們不喜歡讓人際關係快速升溫,更喜歡慢慢地建立人際關係,另外,英國人在交流中很少採用開門見山的方式,而是委婉地試探別人——不得不說,在這一點上,英國人和中國人倒是很像,難怪有人把英國人叫做「歐洲的中國人」呢。

而美國人就直爽多了,他們在溝通交流的時候,喜歡直截了當地把自己的立場和目標說清楚,如果他們覺得,沒必要再跟你繼續溝通下去,他們也會明確地表示出來,而很少顧忌到對方的感受。

英美文化之間的差異,取決於民族的精神內核。

作為傳統的老牌發達資本主義國家,英國從工業革命時期,就在世界歷史上佔據了非常重要的地位,維多利亞時期,站在巔峰的大不列顛帝國,被世界尊稱為「日不落帝國」。因為有過光輝的歷史,所以對於自己的文化,英國人有著很強烈的自我優越感。

簡而言之,在英國人身上所秉承的,是源於維多利亞時代那傳統的、貴族的、優雅的文化。

而美國的發展歷程則大不相同。數百年前,當那些窮苦的英國清教徒乘坐著五月花號來到這片土地上定居時,呈現在他們眼前的,只有大片大片的荒野,所有生存所必需的一切,都是靠著那些饑寒交迫的清教徒們辛勤勞作,才一點一滴積攢起來的。

正是這樣的歷史特性,才造就了美國人「自己動手、豐衣足食」的民族精神。因此在美國文化當中,很少宣揚那些依靠家族世襲的貴族們,而更加尊重那些靠自己辛苦努力而取得成功的人。

換言之,美國文化所提倡的,是強烈的進取心和競爭意識,是「付出就能有回報」的樂觀主義精神!

相關焦點

  • 納博科夫喜歡的詞:隱藏在暢銷書中的黃金寫作法則
    納博科夫最喜歡的詞本書的作者是美國的本·布拉特(Ben Blatt),他是雜誌撰稿作家,在《華爾街日報》、《波士頓環球報》以及《哈佛諷刺家》等媒體上發表過作品。布拉特是數據分析的重度愛好者,他不僅用數據分析來研究文學作品,還將之應用到音樂、影視劇以及綜藝節目等領域。這本《納博科夫最喜歡的詞》是布拉特用數字寫成的文字書。在書中,他充分利用現代技術手段,從統計學的角度,來研究文學作品,揭開了許多困擾人的文學難題。
  • 納博科夫《獨抒己見》,「偶爾為之的英語文選」
    其中,納博科夫被問得最多的,自然是他的小說《洛麗塔》。在一九六七年和《巴黎評論》的訪談中,納博科夫說,「我將因《洛麗塔》和我對《葉甫蓋尼·奧涅金》的翻譯而青史留名」。不難發現,納博科夫是一個極具個性的作家,他的言談偶爾難免會給人傲慢甚至自命不凡、目空一切之感(當然,以他的學識和才華,他是具有這個資格的),特別是體現在他對其他作家的點評上,可以說是「愛憎分明」的,不憚臧否人物(在《文學講稿》、《俄羅斯文學講稿》中,我們也可以看到他的喜惡)。
  • 「洛麗塔」代表英語,「亨伯特」代表俄語,納博科夫在中間
    以及,麥克尤恩這次在北京專門講到,納博科夫本是他喜愛並試圖模仿的作家哦:「我喜歡納博科夫是比較晚的事情了,在我的寫作時期中屬於很晚的階段,我喜歡和模仿是正常的,但是過一段時間就必須放下,然後發展出自己的想法。
  • 納博科夫在美國 | 戰亂中的「世界公民」(連載二)
    納博科夫在美國度過了創作力最旺盛的時期。這20年塑造了納博科夫的後半生,造就了如今被世界所熟知的納博科夫。以下為《納博科夫在美國》([美]羅伯特·羅珀 著)部分內容選讀。1916年,他曾從他舅舅盧卡那裡繼承了一座兩千英畝之大的莊園,加上六百二十五萬美元(如在2014年,這筆錢價值一億四千萬)的遺產;一年之間年紀輕輕就成為富豪,但天意弄人,十月革命爆發後,他與其他許許多多他熟知的人一起,命中注定成了生活緊緊巴巴的「僑民」,而直到20世紀30年代末為止,「緊緊巴巴」這個詞也許對他的窘境而言還是溢美之詞。
  • 《納博科夫最喜歡的詞》:大數據和文字結合,會有什麼有趣發現?
    大數據技術帶給我們很多便利,比如各種證件的「一網通辦」,也讓我們「宛如透明人」,在網上搜索了什麼,電商平臺立馬就能捕捉到數據,把相關的推薦給你。但我一直覺得理性冰冷的數據和抒情寫意的文字沒什麼關係,不過看了《納博科夫最喜歡的詞》後,發現並非如此,文字和數字結合在一起,也能玩得風生水起。
  • 《納博科夫最喜歡的詞》:一本用數字寫成的書,是怎樣的?
    如果你以為這是一本寫作秘籍之書,以為通過這本書能找到寫作的捷徑,你就錯了!這是一本關於「文字」的書,但卻是用「數字」寫成的。這本書帶給人極具啟發性和趣味性的閱讀體驗,是一部基於數據的文學評論。它帶給我們一個研究偉大作家作品的新穎視角:大數據。
  • 納博科夫:《洛麗塔》是最難寫的小說,不得不虛構美國
    小說在美國出版已掀起軒然大波,1962 年斯坦利·庫布裡克指導的同名電影更是讓洛麗塔的形象深入身心,由此引申而來的「蘿莉」一詞至今已經作為一種次文化而獨立存在了。 納博科夫認為,《洛麗塔》是自己所有作品中最難寫的一部,「我不認識任何一個十二歲的美國女孩,我也不了解美國;我不得不虛構美國和洛麗塔,」 1963 年,他在接受《花花公子》雜誌採訪時提到,「我曾花了四十年來虛構俄國和西歐,現在,我得面對類似的任務,但我可利用的時間卻並不多了。」
  • 獨家|布賴恩·博伊德:納博科夫夫人為何讓我撰寫納博科夫傳
    這部傳記,不僅得到了薇拉·納博科娃的高度認可,更得到了納博科夫愛好者及歐美文學評論家們的一致認可,認為這部傳記是「納博科夫作品所能有的最優秀的導讀」,它「既是一絲不苟的學術研究的範例,也是想像力豐富的文學批評的典型」。
  • 為什麼納博科夫筆下的絞刑架必須是藍色的?
    原標題:為什麼納博科夫筆下的絞刑架必須是藍色的?文/迪米特裡·納博科夫譯/徐漪編輯/小莊都來自於擁有不少第一手研究資料的神經科學實驗室,對數據的掌握實在充分,乃至於我讀著讀著,就產生了一種讀到普魯斯特浩瀚文字的頭暈,十分特別。為了給大家好好介紹這本新書,特地選了迪米特裡·納博科夫所撰寫的本書後記,在此呈上,沒錯,他就是著名作家、《洛麗塔》作者納博科夫的兒子,據說,他們全家都是聯覺者。
  • 納博科夫首部英語小說推出中文版
    這是納博科夫用英語寫作的第一部小說,被認為是一部被忽視的偉大之作。在著名學者、評論家止庵看來,這部小說與作者納博科夫自己最相關,它講述了一個作家是如何被人誤讀的。這部「帶有不合理的魔幻色彩的文學偵探小說」以華麗而簡潔的方式探討了時間、愛、死亡、藝術等永恆主題。主人公塞巴斯蒂安·奈特是一個虛構的俄裔英籍作家,他行蹤隱秘、特立獨行,以擅長寫「研究小說」著名,但不幸英年早逝。
  • 納博科夫給妻子薇拉的書信集《致薇拉》春節後即將出版
    他在一封給薇拉的信中期待這種感情,那時他們有戀愛關係還不足一年:「你我如此特別;這些奇妙之處,除了我們,無人知曉,也無人像我們這樣相愛。」納博科夫後來將他的婚姻形容為「晴朗」。他甚至在給伊琳娜·瓜達尼尼的信中也這麼說,他1937年與她墜入情網。那年是納博科夫婚姻生活中最困難和最痛苦的一年,也是一個例外,下文的書信就是佐證。
  • 納博科夫:我愛你,我是個怪物,但我愛你
    :我愛你,我是個怪物,但我愛你納博科夫的固執己見,文學尤甚。1945年的某月某日,是納博科夫又一次戒菸的節點。男人們對煙的感情,總有點發小廝混的意味。屢屢的激情並不妨礙他與妻子薇拉的情感溫吞悠長,「他們的親密關係幾乎是與世隔絕的。
  • 納博科夫、卡佛、村上春樹和他們的「虛假天空」
    翻來覆去依然不得其解,於是徒手將美國俄裔作家弗拉基米爾·納博科夫的《微暗的火》中最精華的999行詩原文抄一遍。適才發現,真正能夠讓自己靜心的,唯有一字一句地寫,認真地書寫;一字一句地讀,大聲地朗讀。唯此才能讓自己靜下心來,真正走進文字,雖然這非常耗時,也相當耗費心神,但必有收穫。
  • 海明威站著寫,納博科夫泡在浴缸裡寫,大師們為啥都有寫作怪癖?
    有幾位名作家,出於這一或那一原因,不得不放下筆頭,口授他們的作品。在失明之後,彌爾頓求助身邊的人給他充當抄錄員。他的史詩《失樂園》便是通過向各種人——包括朋友、家人和學生——口授完成的。詩人會讓訪客給他記錄詩節, 不論是存於記憶中的,還是當場而作的。薩克雷向長女安妮口授散文。然而她回憶到,每次父親「到了一個關鍵點,會把他的秘書打發走,自己來寫」。
  • 從英語看英美文化差異
    不記得是哪個名人說的了,但從這句名人名言就可以看出儘管英美兩國都是以英語為母語的國家,但文化差異還是很大。即使是同一種語言,卻有很多不同之處。下面小編就來給大家分享一下從英語反觀英美文化的愛恨情仇吧!1. 最正宗傳統的文化,到底是誰的?
  • 中國茶文化,與英美茶文化之間的異同,你了解多少
    中國茶文化,與英美茶文化之間的異同,你了解多少經濟全球化帶動了文化全球化,茶文化作為中國民族傳統文化的代表,不僅對亞洲文化影響頗深,而且在英美一些國家中產生了深遠影響,尤其是在文化全球化的背景下,中國茶文化不斷輸出,
  • 英語學習基礎篇|英美文化
    這個問題的答案有很多,其中一個答案便是:    「英美文化有什麼好了解的?」,其實單說「了解英美文化」是有些籠統,但不乏一些好的原因,其中最重要的一點就是——避開它們文化中出現的缺點,從它們的文化中汲取優點,並將這些優點整合進我們的文化當中,形成一種新的現代文化。聽起來好像有點好高騖遠,但是很多人現在正在實現這種想法。
  • 英語文化:英美對同一事物的不同用詞
    新東方網>英語>英語學習>英語閱讀>英美文化>正文英語文化:英美對同一事物的不同用詞   places   詞語 English American   公寓 flat apartment
  • 關於忘年戀的小說這麼多,為什麼《洛麗塔》最出名?
    一閱讀納博科夫是驚心動魄的事情。臺上老師念著PPT,臺下的我假裝看課本,悄悄拿出《洛麗塔》,想像著穿棉袍的少女,雙腿慵懶地蜷曲著,溼漉漉的嘴唇,喚起亨伯特壓抑的欲望。那時候,我把《洛麗塔》當黃書看,《金瓶梅》《黃金時代》,還有這本《洛麗塔》,都成為課餘時間的獵奇讀物。