中文是一部「迷信機器」嗎?同音歧義是如何創造出獨特禁忌的

2021-01-14 造就

每年春節,全世界有超過十億人加入慶祝的行列,並展開一場微妙的文字遊戲。它很像一組求愛儀式——為了招來好運,人們會用喜慶字樣的剪紙來裝點住宅與門戶。要理「發」的,年前趕緊理完,誰想在新年伊始削去財運,哪怕只是稍事修剪?年夜飯的菜餚裡通常有魚,因為人們希望「年年有餘」;有的地方還時興吃一種名為髮菜的藻類,因為諧音「發財」;或有「橙」,寓意為「成」。

在英語中,巧妙的雙關也被人們津津樂道,諧音也是廣告中常用的招數。但漢語將雙關推到了新的高度——它深植於文化深處,人們堅持說吉祥話、做吉利事,以期招來好運;同時忌諱不吉利的話語和行為,以免倒黴。由於跟「死」諧音,數字「4」沾染了不好的含義。很多中國人絕不會購買地址或門牌號含「4」的房子。因為分別諧音「餘」和「福」,魚和蝙蝠常常出現在一些視覺設計中。中國的送禮習俗中也充斥著諧音禁忌:蘋果可送,取「平安」之意;但梨不可送,因忌諱「分離」。你要是問一個中國人,為什麼特定的物件、數字會跟吉利與否聯繫起來,對方常會不假思索地回答,因為它跟某個字或詞同音。

北京廠甸廟會一景。魚是財富的象徵,因為它與「餘」同音。

為什麼諧音與中國的傳統及符號象徵如此密不可分,而西方就沒有這種現象呢?在所有語言中,歧義和諧音都是常有的事,以至於很少進入人們的意識層面。1978年,語言心理學家布魯斯·布裡頓(Bruce Britton)梳理了共計一百萬單詞的英語文本語料庫,並作出保守估計:至少32%的英語單詞是多義詞。在最常用的100個單詞中,多義詞佔到93%,有的甚至有30個義項。語言學博客作者傑夫·普勒姆(Geoff Pullum)的一個提問巧妙地捕捉到了這種一詞多義的現象:「支柱、職位、電池端子、軍營、博文、耳釘的釘身、貿易站和郵寄信件,這些詞跟廣告牌、記帳、保釋及指派外交官有何共通之處?你可能要沉思片刻才能反應過來:以上事物都指向同一個英語單詞:「post」。

在英語中,人們對諧音比較隨意,很少去澄清意義,哪怕語境允許多種不同的解釋。維克多·費雷拉(Victor Ferreira)做過這樣一項研究:設置視覺場景,其中同時有一根棒球球棒(英語單詞為bat)和一隻飛行的蝙蝠(英語單詞也為bat),然後讓受試者描述其中的物體。在某些條件下,63%的人都只說是「the bat」了事,而沒有澄清究竟是球棒還是蝙蝠。

「語言酷愛歧義。它們熱烈地追求著歧義。」

但在中文語境下,人們對同音歧義似乎更為敏感。語言心理學家麥可·葉(Michael Yip;音)和伊愛玲(Eiling Yee;音)提到這樣一種印象:說中文的人更傾向于澄清潛在的歧義,哪怕根據上下文,其所指已經非常明顯。伊愛玲舉了個例子:「我的房貸該續籤了,所以約了銀行(英語單詞為bank)——就那金融機構,不是說河岸(英語單詞也為bank)。」這種對同音歧義的敏感若是中文使用者的共性,那麼,它必然也契合諧音在中文中的顯著地位。

語言、思維和文化的聯繫是一片開放的研究領域,其中大部分仍有待科學家的探索。不過,就眼下中國文化而言,諧音與「口彩」的互動令人不禁想問:不同的語言是否會強化不同的主觀體驗?特定文化概念——比如吉利與否——會不會在相應的語言中留下印記?

普勒姆認為,語言絕不會企圖繞過歧義,相反,「語言酷愛歧義。它們熱烈地追求著歧義,就像小狗一樣,在歧義的草地上打著滾。」羅徹斯特大學語言心理學家史蒂夫·皮安塔多西(Steve Piantadosi)對此表示認同。他和同事們論稱,歧義非但不是語言的漏洞,還是一種有用的語言特徵。通過重複利用某些最普遍、最順口的發音組合,最終形成豐富的詞彙。沒有歧義,我們就得創造更長的單詞,用以區分不同的意義,或者發明一個龐大的語音集合;在發音和區分不同的語音方面,我們也得更加嫻熟才行。

如果說所有語言都青睞歧義,那麼中文對歧義可謂是情有獨鍾。歧義率不太適合在不同語言間進行橫向比較,因為即便在同一種語言之內,不同的字典對字詞的義項數量也存在分歧。但無論從哪個角度來看,中文的諧音數量著實豐富。

跟其他很多語言一樣,英語語素(最基本的語義單位)通常是多音節的,比如hippopotamus(河馬)、president(總統)、fastidious(挑剔的)。但在粵語和普通話中,語素一般都是單音節的。這些單音節不一定自成一詞,因為大多數中文詞語都由兩個或以上的語素構成,每個語素就是一個字。儘管如此,聽者必須找對每個音節的含義,才能理解整個詞的意思。而且,中文用到的元音和輔音都比英語少得多,這就好比在一塊面積有限的地皮上蓋高樓,有限的語音組合就好比地皮,而那些豐富的詞語含義就只有層層往上累積了。

語言如何用詞語來捕捉現實,以及反過來,我們繼承的母語詞彙又會如何塑造我們對現實的看法。

由於在粵語和普通話中,不同的意義通常由不同的字來表達,正字法(將口語轉化為書寫形式)便成為追蹤同音異義數量的有效手段。研究人員譚力海和查爾斯·佩爾費蒂(Charles Perfetti)分析了180萬字的中文文本,統計出的4500個字總共只映射到420個不同的音節——因此,每個字平均有11個與之同音的字。而在佩爾費蒂的英語數據集中,即便只看單音節的英語單詞——它比多音節單詞更容易出現歧義——平均下來,每個單詞的同音詞也不到一個。

奇妙之處就在於,歧義泛濫並未導致中文的交流問題——實驗表明,根據上下文排除不相關意義時,中文的效率絲毫不遜於英文,此外,不同的音調也有助於區分意義。但按照中文書寫系統,同音異義的多半不是同一個字,因此,講中文的人很難忽略語言中的歧義。

由於「橙」與「成」同音,春節的裝飾物中常常可以看見柑橘類水果的身影。

同音歧義會讓人糾結寫法,這時,它就會引起人們的注意。雖然你不太會被「post」一詞的義項所困擾,但總有那麼些時候,你會消耗一定的腦力,去辨別究竟是「their」(他們的)、「they’re」(他們是)還是「there」(那裡),以確保拼寫與你想表達的意義相符。想想每碰到一組諧音詞,你都要停下來思索一番,你就知道,做一個中文文盲是怎樣的感受。無怪乎在兒童學習中文時,同音異義字掌握不好,成為了判斷閱讀障礙等問題的有效預測指標。

這些歧義直接影響到了人們對中文的體驗,因為歧義字詞可以激活不止一種意思——有實驗為證。這類實驗用到了「語義啟動」(semantic priming)的手段,即給出其他單詞作為語境,讓受試者判斷所示內容是否為真正的單詞。通常,如果事先看到意義相關的單詞,人們會更快地識別出後續單詞——因此,在看到「醫生」之後,再識別「護士」一詞,相比於看到「桌子」之後,再識別「護士」一詞,前者要來得快。當人們聽到「bug」這樣的多義詞時,雖然語境只涉及該詞的一個義項,但人們在識別與「bug」其他義項相關的單詞時,也會明顯變快。舉個例子,在聽到「bug」(分別有蟲子和漏洞之意)一詞之後,人們不論是識別「螞蟻」還是「間諜」,都比識別毫不相關的「縫紉」(sew)一詞來得快。

一個詞的多個義項只會在思維中短暫留存——通常人們還沒有意識到,那些跟語境無關的義項就已經被壓抑。這使交流得以順暢進行,即便是在歧義叢生的中文裡。但研究人員發現,有的單詞特別能導致注意力停留。其中一種最搶風頭的詞,就是激發強烈情緒反應的詞,尤其是含義負面或犯忌諱的詞。

而那種影響了個人語言行為的文化聯想,最終會不會融入整個語言系統?

這些搶風頭的詞一旦跟其他意義的詞發生諧音時,就很難被壓抑下去。我從小在一個英法雙語區長大,記得有一次在課堂上,我要用法語做一個有關海豹的演講,而法語的「海豹」(Phoque)與英語中一句粗口(fuck)諧音,結果,我一陣陣臉紅,還引來一些同學的譏笑。雖然按照語境,它的意義非常明確,但用起來卻讓人難堪至極。而避免使用某些特定諧音,這一做法也許具有普遍性。我發現,「bit」或「fit」這樣的音節囊括了許多互不相關的意義,但「shit」就沒有不涉及粗口的含義。當然,也有單詞同時包含普通義項和情緒強烈的義項,但在表達普通含義時,它們往往被替換成近義詞,比如,說公雞用「rooster」而不用「cock」,說驢子用「donkey」而不用「ass」。

在中文裡,歧義的泛濫造成了很多尷尬的諧音。語音空間格外擁擠,一個普普通通的詞語一不小心,就會跟充斥情緒的詞語諧音。發生這種情況的機率比英語中大多了。正是中文語音空間的緊湊性,激發了中國文化對諧音的執著。

反過來,文化又影響著哪些意義更能吸引人們的注意力。中國傳統文化認為,說出口的詞語可以給生活招致好運或厄運,這一點在新年慶祝中展現得淋漓盡致。新年期間,所有關於死亡、疾病或離異的談論都變成了禁忌,人們把健康、財富和成功的祝願送給彼此。一旦說到與運氣有關的話,人們總會豎起耳朵仔細傾聽,若是遇到不吉利的字眼,更是格外警惕,這些都是中文使用者 難以忽略的。雖然到目前為止,尚無實驗直接印證這一點,但它能很好地解釋這個現象:為何在中文使用中,人們會完全基於諧音字詞所攜帶的情緒,對無辜的普通字詞產生厭惡或喜好。也許,正如我的中國同事蔡維(音)所說,在春節期間,當每個人都想著討口彩的時候,我們會盡力壓制與死亡或不幸相關的含義。

歧義在詞語的意義和使用之間,建起了一座獨特的橋梁。當很多意義都映射到同一個詞時,每一個義項被喚起的機率都會增加,從而改變我們對這個詞本身及其意義的感受。如果因為多義詞的存在,導致個體在文化聯想的指引下,由於某個詞聽著不文雅,而繞過它不用——比如英語中,人們一說到公雞,會用「rooster」替代「cock」——這些選擇也許會在詞庫中留下更廣泛的烙印。而那種影響了個人語言行為的文化聯想,最終會不會融入整個語言系統?

有沒有統計學證據表明,負面情緒詞語的歧義會被驅逐?或者,正面情緒詞語的歧義會越來越多?我就此請教了研究人員泰德·吉布森(Ted Gibson)和史蒂夫·皮安塔多西。(他們的研究表明,語言收錄歧義是有用處的。)答案是:沒有,至少現在還沒有。但兩人一致認為,我的這種假設不無可能,而且值得研究。要檢驗這一看法,語言心理學家需要驗證這樣一種假設:催生不安情緒的單詞(像「shit」或「rape」)的諧音單詞數量比預期要少,而這個預期是基於音節數,或音節構成的普遍性而得出的。也許,激發強烈正面情緒(如「rich」或「free」)的詞語的義項,會比人們預期中更多。

若這一結果得到印證,它將圍繞文化價值對語言的塑造,提供一條新的思路。在中文裡,「討口彩」的傳統在全語言範圍內都有所體現,某些語音因為聽著不吉利,會被人們刻意迴避,而有的語音則因為聽著吉利而備受青睞。中文以其充沛的歧義現象,為測試這一假設提供了肥沃的土壤。

對於語言和文化的相互作用——文化如何將其價值觀與世界觀烙印在語言中,反過來,語言又如何塑造使用者的思維——我們的好奇心是無止境的。但在探討語言和文化的關聯時,很大一部分對話都局限於那麼幾個問題。比如:日語中有專門的詞語描述好人處境不佳(英語中沒有對應的單詞),從中可以看出日本文化的什麼特性?對那些藍、綠兩色共用一個詞的語言,使用者能否輕易區分這兩種顏色?這些問題的著重點是,語言如何用詞語來捕捉現實,以及反過來,我們繼承的母語詞彙又會如何塑造我們對現實的看法。

但中文與中國文化之間,似乎呈現出更加錯綜複雜的聯繫。也許,若一種語言將大量意義塞入狹小的語音空間,使用者對歧義的感受就會強化,雙關和文字遊戲的文化意義也會更重;也許,文化上的聯繫會使某些特定的歧義具有情感色彩,重鑄說話者的語言使用模式,並最終重塑整個語言體系的詞彙格局。

「口彩」與諧音是否打開了一扇小小的門,引導我們走向這片未知的思維領域?如果是的話,對身為語言心理學家的我來說,這真是一場好運。

翻譯:雁行

校對:其奇

編輯:漢嵐

來源:nautil.us

相關焦點

  • 禁忌和迷信-中新網
    禁忌和迷信   看日本電視劇中有一情節:我最愛看的大相撲,力士角技相鬥前,必也在圓環一處的鹽盒裡,拿一大把鹽巴,使勁撒在場裡,這都是日本人的風俗迷信,認為鹽巴可清黴氣避厄運。  新加坡正宗日本餐館門外,也常見角落處擺有小碟,上面放了堆成小山狀的鹽,以避除黴運。  新加坡的禁忌和迷信也不少,如:孕婦在懷孕時不可吃黃梨,以免流產。在坐月期間又不可洗頭。
  • 某些科學家宣傳的多重宇宙論是一種迷信嗎?
    也許有人會很不服氣,馬上反駁說:「多重宇宙論怎麼可能是迷信?不少科學家都認為存在多重宇宙,難道他們也是迷信嗎?」我們在日常生活中常常會聽到「迷信」這個詞,比如說某個人很迷信。那麼在爭論多重宇宙這個話題之前,我們不妨對「迷信」這個詞下個定義。也就是說,什麼是迷信?
  • 思想實驗 | 中文房間:機器能否具有心智?
    圖靈測試被認為是判斷機器智能與否的有效充分條件。換句話說,通過圖靈測試的機器將被承認為具有智能。圖靈測試被認為是實現強人工智慧的有效標準,製造出通過圖靈測試的機器也成為強人工智慧學派專家所努力的方向。根據塞爾的設計,假設存在一個房間,房間內有一個完全不懂中文的人,而他與外界的唯一連接通道是房間的一個窗口,允許其通過遞紙條的方式與外界溝通。同時房間內還有一套中文漢字卡片和一本中文規則書,告訴房內的人如何使用和組合漢字卡片。此時屋外的人開始向屋內人傳遞紙條,上面是用中文寫的問題。
  • 專欄| 中文NLP難於英文?從語言學角度看中文NLP、NLU難在哪裡
    由於漢語的特殊性,在分詞任務中,會碰到兩種歧義現象:交叉歧義 (Cross Ambiguity) 和組合歧義 (Combination Ambiguity)。(1) 老闆有意見他。(2) 老闆對他有意見。和 (2) 的正確切分是:(1) 老闆/有意/見/他/。(2) 老闆/對/他/有/意見/。
  • 廣告用語當力避「歧義」解讀
    廣告用語當力避「歧義」解讀   從今年6月開始,為在重慶推介利川旅遊資源,利川市旅遊局在重慶做了廣告詞為「我靠重慶,涼城利川
  • 「會說話的人,一開口就贏了」——語音交互中的機器話術研究
    研究主要包含以下內容:話術設計研究:我們如何做的話術設計原則:用戶關注什麼?哪個更重要 話術設計建議:原則如何指導話術設計一、話術設計研究:我們如何做的?當下的話術研究多從研究者視角出發,原則主要源自研究者的日常觀察、哲學思辯和專業判斷。本次,我們從用戶視角出發來探討話術,研究過程如下:
  • 科學網—幫機器學會中文分詞和詞性標註
    >本報記者 鄭金武 「部分居民生活水平」這樣的中文短語,人們理解起來沒有太大困難。但把這個短語交給機器,是理解成「部分/居民/生活/水平」,還是「部/分居/民生/活水/平」,卻是個問題。 在近日於線上舉行的自然語言處理(NLP)領域學術會議ACL 2020上,創新工場大灣區人工智慧研究院的兩篇入選論文,正是針對中文自然語言處理的類似問題提出新模型,將外部知識(信息)創造性融入分詞及詞性標註模型,有效剔除了分詞「噪聲」誤導,大幅度提升了分詞及詞性標註效果。
  • 難道人類真的是外星種族創造出來的殺戮機器嗎?
    今天聊一部奇葩俄羅斯科幻大片《前哨基地》,這部電影完美展現了戰鬥民族的強悍風格。碾人如割草,硬是把一部科幻片拍出了喪屍片的感覺,那種獨特的觀感屬實讓人瞠目結舌。這究竟是一個什麼樣奇葩的故事呢?不要急,看下文。《前哨基地》的設定其實非常硬核,屬於少有的硬派科幻片。
  • 張萌發視頻道歉,表示無意打擾,打字會產生歧義和誤會
    如果自己沒整過,直接說沒有不就可以了嗎?為什麼要扯到別人身上去呢?她的確是整過容,而且在大家面前都已經公開承認過。不過她也沒比較這樣引戰吧?很多網友都覺得,她但是為了給自己的新劇做宣傳,什麼都說得出來啊。而張檬在今天早上也是對此再次回應,她表示,不知道自己哪裡得罪她了,兩人只見過一面,並沒有什麼交集。很多網友都是非常支持她的這個回應的。
  • 日本人的10個迷信,你聽過嗎?
    世界各國都有各種獨特的民間迷信,在日本也不例外,像是「打破鏡子會招來不幸」、「筷子不能直插在碗裡」等都是日本常見的都市傳說,對我們來說也不陌生。 但除此之外,日本其實還有很多相當無釐頭的民間禁忌、迷信,雖然未必都有科學根據,但了解其含義也十分有趣,來看看以下10個日本迷信,你知道幾個?
  • 新化學元素的中文名叫啥?你來定!
    化學元素名稱的漢譯,自晚清開始譯入到21世紀的今天,歷經了百年,形成了化學元素自有的中文定名原則:(1)根據儘量少造新字的原則,在元素定名需要造字時,儘量選用已有的古字。(2)選用或新造漢字應符合國家漢字規範。(3)符合以形聲字為主體的漢字書寫特點,以體現元素的性質,發音靠近國際命名。(4)避免與以前的元素名稱同音,避免用多音字。(5)使用簡化字,避免用怪異字,選用筆畫少的字。
  • 結婚禁忌三十一條,婚配觸犯禁忌化解法!
    新娘必知的結婚禁忌有哪些?在現今,雖然傳統的婚禮儀式已淡忘,但新人們對婚禮的彩頭還是很注意的,也會考慮到中國傳統婚俗的禁忌,讓自己的婚禮在愉悅中度過。大叔總結了7大結婚禁忌告訴大家,希望看了以後有所幫助! 一、 忌吃喜餅 喜餅是喜氣的象徵,分發喜餅的習俗意在分享新婚的喜悅,並將婚訊藉由喜餅傳達給每一位親友。
  • 照片容易產生「歧義」的四種情況,你中了嗎?
    文字用錯了,容易產生歧義。照片拍錯了,同樣會產生歧義。今天的《編讀往來》,就以「歧義」為主題,看看這些給旅行君投來的照片,毛病都出在了哪吧。1環境的歧義@張哲:《老外在北京》索尼a6300老外穿著老北京棉襖,走在北京的路上,還挺有意思呢。
  • 這些禁忌好多人都曉不得!
    相傳這天鬼門關大開,百鬼夜行,所以七月十四鬼節,這些禁忌你應該知道! 而且「鴨」和「壓」同音,大約也只有這一天能鎮住孤魂野鬼的意味。
  • 創造出永遠不會背叛我們的愛人:人類創造人工智慧的初衷?
    人工智慧的夢想曾經是——現在也是——創造出擁有意識的機器。人工智慧的意思是造出一個機器人類。然而這個目標,如果作為一項理性的技術企劃來看的話,其實是非常奇特的。想一想有意識的機器可能意味著什麼:一個像人類一樣思考和感受的機器,一個夢想並沉思自己的存在的「電子大腦」,陷入愛河或失戀,在月光之下寫作十四行詩,開心的時候笑,悲傷的時候哭。這種機器到底有什麼好處呢?
  • 能造出像人一樣「思考」的機器嗎?—新聞—科學網
    如今的人工智慧系統已經在不少具體問題的解決能力上超過了人類,那麼,我們究竟能否製造出像人一樣「思考」的機器?人工智慧會有一天超越人類智能嗎? 計算型智能只是人類智能的一種類型 下圍棋是人類的高級智能活動之一,過去人們認為計算機不可能超越人類的這種智能。因此,下圍棋也被視為人工智慧的「聖杯」。
  • 中科院:新元素113、115、117、118號中文名你來定
    化學元素名稱的漢譯,自晚清開始譯入到21世紀的今天,歷經了百年,形成了化學元素自有的中文定名原則:(1)根據儘量少造新字的原則,在元素定名需要造字時,儘量選用已有的古字。(2)選用或新造漢字應符合國家漢字規範。(3)符合以形聲字為主體的漢字書寫特點,以體現元素的性質,發音靠近國際命名。(4)避免與以前的元素名稱同音,避免用多音字。(5)使用簡化字,避免用怪異字,選用筆畫少的字。
  • 農村老人常說的睡眠方向禁忌,有人還說很科學,真的正確嗎?
    今天和大家分享的是:農村老人常說的睡眠方向禁忌,有人還說很科學,真的正確嗎?農村老人常說的睡眠方向禁忌,有「睡覺時不能腳朝西」這樣的說法,還真不少見,但是說的版本又不一樣,也還有人說,睡覺的時候不能頭衝西,特別是生病比較嚴重的老人,在農村都會把他改變一下睡覺的方向。類似於這樣的話,到底有沒有道理?有的是說有迷信的說法,有的是說比較科學,有地球的磁場說法。
  • 中文分詞和詞性標註:為拓展工業場景應用夯基—新聞—科學網
    但把這一短語交給機器,是理解成「部分/居民/生活/水平」,還是「部/分居/民生/活水/平」,卻著實是個問題。 「中文的分詞和詞性標註是自然語言處理的基本任務,對於後續的應用和任務處理非常重要。」兩篇論文的作者之一、創新工場大灣區人工智慧研究院執行院長宋彥告訴《中國科學報》,對於文本分類、情感分析、文本摘要、機器翻譯等,分詞和詞性標註是不可或缺的基本「元件」。
  • 科技名詞委徵集4個新元素的中文定名
    化學元素名稱的漢譯,自晚清開始譯入到21世紀的今天,歷經了百年,形成了化學元素自有的中文定名原則:(1)根據儘量少造新字的原則,在元素定名需要造字時,儘量選用已有的古字。(2)選用或新造漢字應符合國家漢字規範。(3)符合以形聲字為主體的漢字書寫特點,以體現元素的性質,發音靠近國際命名。(4)避免與以前的元素名稱同音,避免用多音字。(5)使用簡化字,避免用怪異字,選用筆畫少的字。