復旦大學外文學院資深翻譯專家陸谷孫先生,最近不幸因病醫治無效而辭世。我不是學習英語專業的,但因為關心與機器翻譯相關的人工智慧的哲學問題,故而平素也就多留意陸先生關於翻譯問題所發表的一些真知灼見。在此篇小文中,筆者借悼念先生的機會,從「如何對人類的翻譯機制進行機器模擬」的角度,重新發掘一下陸先生翻譯思想中的一些洞見。
陸先生於2015年經由「復旦外語」微信公眾號發布了一篇討論翻譯技巧的短文。先生在文中指出,翻譯要講求做到「飛躍」與「抵達」,即從源語言的表達式的文化氣場出發,飛躍源語言與目標語言之間的文化隔閡,準確抵達目標語言中相應文化氣場中的那個「著陸點」。因為不同的待譯文本具有其各自的文化氣場,因此,譯者就需要根據語境的變化機敏地選擇最恰當的「飛躍路線」,在譯文生成過程的終端實現最順當的「文化軟著落」。
陸先生舉過一個翻譯案例,來說明這種「飛躍」與「抵達」。某出版社曾諮詢陸先生,如何為一篇題目為《租界》的中文小說,翻譯一個妥帖的英文標題。直譯當然是「The Concession」,但陸先生讀完小說,發現作者說的是發生在舊上海法租界的故事,所以就譯為了「In the French Concession」,並用介詞「in」強調了租界本身只是故事發生的場所,而非小說的真正描述對象。後來,出版社又改了主意,覺得題目應當換成小說的主人公名字,即「中國排骨」。但這又怎麼譯成英文呢?陸先生發現,若直接譯為「Chinese ribs」,洋人肯定會誤認為這是菜譜,而「排骨」在漢語語境中所具有的「纖弱秀氣」的意思就全丟淨了。或許其意思更接近於「Bony Green Knight」吧,但此詞帶有中世紀色彩,放置到小資味濃濃的上海租界的語境中,就有點關公戰秦瓊的「違和感」了。翻譯為「Bony She-Man」則脂粉氣過濃,因為根據小說,那個叫「上海排骨」的男人還沒有那么娘娘腔。總之,根據陸先生自己的描述,他就像直升機一樣在作為對象語言的英語領地上空盤旋,為尋找一處最佳的著陸地點而費心煩神。
可見,面對此類高度複雜的翻譯任務,譯者需要付出極大的心智努力才有可能向讀者奉上信、達、雅的譯作,而期間的腦力付出,有時甚會至遠遠超出用母語進行思想原創之付出量。面對如此艱巨的腦力任務,做人工智慧研究的工程師或許不免會「想入非非」:倘若吾輩能夠根據陸先生的翻譯精神編制出一種程序,讓機器自動進行文本翻譯,那該有多好啊!
但凡事都是「說易行難」。現有的機器翻譯的主流思路,分為「符號進路」與「統計進路」兩種。很可惜,這兩種進路都無法忠實地落實陸先生關於「飛躍與抵達」的翻譯經驗談。
先來看「符號進路」。按此進路,在機器翻譯中我們可以先做一個巨型雙語語料庫,並憑藉現有的雙語翻譯詞典(如陸先生自己主編的《英漢大詞典》)搭架現成的源語言表達式與目標語言表達式之間的橋梁。更精細的相關建模工作甚至還要求對個別詞彙進行語義框架構建。譬如,「排骨」這詞的框架,就自帶有與諸如「豬皮」、「膏湯」、「蹄髈」之類詞彙相關的推理關係表徵。這樣,系統一旦觸發了一個特定詞彙,就會觸發與之相關的語義框架,並由此使得一些簡單的語義推理得以成為可能。
然而,對於符號進路的機器翻譯路徑的實現,需要編程員預先對大量雙語語料對應關係以及各個詞彙自身的語義框架進行建模。其工作的繁瑣度就不提了,其不靈活性更是其致命傷。具體而言,信息再完備的此類系統,也很難對前面提到的「上海排骨」這樣古怪的短語進行準確的信息解碼,因為在通常狀態下,譯者若不對整部小書有哪怕是相對粗淺的了解,此題目恐怕就只能被譯為「Chinese ribs」這樣的「菜名」。但對於現有的翻譯系統來說,對整部待譯小說進行「宏觀把握」,卻是一個幾乎不可能完成的任務。
很多業內人士認為,統計學進路的機器翻譯,似乎能夠解決符號進路的機器翻譯研究所無法解決的問題。目前最流行的統計學機器翻譯路徑,乃是由所謂「深度學習」系統來實現的。概而言之,「深度學習」是一個升級版的人工神經元網絡系統,其基本工作原理是:在亞符號層面上將語義對象解析為一個複雜的特徵簇,然後通過神經元網絡的多層次加工,從中逐層將高階語義重新構造出來。按照此進路,一個諸如像「排骨」這樣的詞彙,就應當被還原為一簇特徵的矢量表徵,其原始形態只有數學特徵,沒有語義特徵。這樣一來,源語言表達式(如「中國排骨」)與目標語言表達式(如「Bony Green Knight」)之間在語義層面上的「彼此可譯性」,就可以被定義為兩個矢量表徵在數學層面上的彼此接近性。由於深度學習網絡允許系統對語義相似關係作出模糊處理,因此,其靈活性顯然超過符號進路的系統。
不過,與陸谷孫先生的翻譯智慧相比,深度學習網絡的火候還差得遠呢。且不提此類系統的運行所需要消耗的大量計算資源,光在一個問題上它就完敗於陸先生了:它必須有大量的訓練樣本,以幫助其在一類源語言詞彙與另一類目標語言詞彙之間預先搭建起大致的相關性關係簇——然後,它才能夠依循成例,摸索出與之比較接近的「跨越方式」。像陸先生那樣超越一切翻譯成例而進行創造性「跨越」的大本領,此類系統可是學不來的。
但是,這是不是意味著陸先生的翻譯智慧,任何機器都無法模仿呢?我當然也不那麼悲觀。現有的機器翻譯進路之所以有問題,與其說是因為「超級人工智慧」這想法自身不靠譜,還不如說是因為業內人士太滿足於玩弄工程學層面上的「奇技淫巧」了,不愛琢磨學理層面上的抽象問題。翻譯畢竟是活生生的人做的活,譯者的翻譯技巧畢竟是以其作為一個完整的人的經歷為背景的。
考慮到這一點,機器翻譯就不宜作為一個單獨的研究項目而「孤軍深入」,而應當成為人工感知、類比推理機制等相關領域內的研究成果的衍生產品。而這一條新進路,在國際上一般被稱為「通用人工智慧」,以有別於主流人工智慧。或說得更通俗一點,按此新進路,人工智慧專家與其去模仿老年陸谷孫的翻譯能力,還不如先去模仿陸先生咿呀學語時的「通用智力」,然後再求日益精進。在我看來,此路徑看似滄桑曲折,實際上才是人工智慧研究之「人間正道」。
作者為復旦大學哲學學院教授
本文來源於解放日報思想周刊觀點版與復旦大學哲學學院合辦欄目《哲學的時代擔當》
本文僅代表作者個人觀點
欄目主編:王多
圖片編輯:雍凱
題圖來源:視覺中國