「空山不見人,但聞人語響,
返景入深林,復照青苔上。」
一位滿頭白髮的美國老人正手持話筒,滿臉認真地朗誦著詩人王維的五言絕句《鹿柴》。
這個看起來有些科幻的場面,發生在昨天下午騰訊研究院舉辦的一場高端沙龍上,這位老人正是大名鼎鼎的侯世達教授。他的《哥德爾、艾舍爾、巴赫:集異璧之大成》啟發了幾代人對人工智慧的思考。
註:「侯世達」這個名字,是翻譯組在翻譯《集異璧》中文版時,根據「Hofstadter」音譯取的名,Hofstadter 本人給自己起的中文名是「侯道仁」。但因「侯世達」這個名字流傳甚廣,已經和《集異璧》這本書緊緊連在一起,故下文仍以「侯世達」稱呼 Hofstadter 先生。
這場活動由湛廬文化聯合騰訊研究院、集智俱樂部、葦草智庫舉辦,邀請了侯世達教授圍繞機器能否實現「完美」翻譯這一主題展開講座。「翻譯」是檢驗人的創造力與人工智慧的一塊試金石,他以王維的五言絕句《鹿柴》、楊絳的回憶錄《我們仨》為例,通過對比谷歌翻譯與其自己翻譯的結果,生動形象地展示了當下機器翻譯離信達雅還有多遠。
翻譯:時空穿梭的旅行
侯世達教授在演講之初就問:
翻譯究竟是什麼,它可以實現什麼目的?
他拿了一首他喜歡的一首王維的《鹿柴》給大家講起:
對於這首詩,侯世達教授也說到:「我不太了解它的意思,有可能是一個住所,有可能是封閉起來包圍的空間,像一個公園一樣,但是不管怎麼樣,它是一個地點,也就是王維當時生活的一個地方。它其實跟小鹿和公園沒有什麼關係,但是這個詩就是這麼寫的,詩人在這個空曠的山裡面,沒有看到人,但是我似乎聽到一個聲音,陽光穿過洞穴,又返到我的身上,穿過了青苔。」
其實,在這前後,他看了這首詩8個英語譯本,而每一個標題的翻譯都不一樣。每個譯本都有非常多的奇思妙想,譯者也非常有趣並絞盡腦汁地結合英文詩的傳統,中文詩的傳統,還有中國的道教、佛教,王維的生平、歷史都考慮到了,每一行詩都有非常多的主觀想法以及他們自己的思維在裡面,每一個作品都有他們的偉大之處。
那麼,如果對於英文的讀者來說,當他們看了英文的詩之後,是否能夠站到王維原作的情境當中呢?
這是一個非常哲學性的翻譯問題,到底有沒有完美的翻譯,翻譯到底能不能完美到讓你讀完這個東西之後,你立刻就能夠感受到原作的所有的附加內涵呢?
機器翻譯的發展之路
翻譯,是侯世達教授始終非常關注的一個研究課題。他認為,翻譯不僅指圍繞英漢、漢英之間的翻譯,也涉及到人類理解能力與機器翻譯之間的關係。
「機器翻譯」的概念最早在1947年,由學者沃倫·韋弗提出,他有一句很有意思的話,今天仍為眾人所熟知:
當我閱讀用俄羅斯語寫的文章時,我會對自己說,「這篇文章實際上是用英語寫的,只不過被編碼成了一些奇怪的符號。現在,我要把這些符號解碼回來。」
沃倫·韋弗認為翻譯是一個解碼的過程,這個解碼的過程,有一個正確的答案。同時他認為機器翻譯能夠「理解」這個密碼所代表的意思。
從1947年到現在,又發生了什麼?其中有一篇文章就是1959年由Yehoshua寫的文章,他雖然對機器翻譯有多年研究,但最終對機器翻譯持批評的態度,不過他對於機器翻譯的可能性卻持有比較曖昧的態度。
侯世達教授在活動現場
Yehoshua這篇文章可能是關於機器翻譯最有名的一篇文章了。這篇文章的題目叫《所謂完全自動化的高質量的機器翻譯不可行的展示》,簡稱為FAHQMT,這是非常蹩腳的縮寫,但是也是非常有名的縮寫,它實際上展示了機器翻譯的不可行性。這篇文章有一段是這樣描述的:
你給機器一些指令,讓機器從一個它不理解的語言翻譯成另外一個它不理解的語言去,實際上是一個大的挑戰,如果在翻譯過程中,採取一些措施,依賴於儀器對於文本的理解,機器是沒有辦法走過這一步的,整個過程就會停滯下來。
人工智慧是1940年晚期,50年代早期在美國和英國發明的,他們當時考慮的是哲學方面的問題,比如什麼是思維,計算機能不能思考,計算機怎麼樣能有意識,這其實是非常好的一些想法。阿蘭圖靈就寫過一篇文章,是1950年寫的,機器能不能思考呢?
然後幾年之後,MIT的一個教授寫了一篇文章,是關於Eliza項目的,研究人員設計了一個被稱為「伊莉莎」的虛假的語言機器人,並把它假扮成了一個精神治療師。「伊莉莎」讓每一個與它打過交道的人產生了一種奇怪的感覺:它能夠深刻理解人們心靈深處的感受。所以當時Weizenbaum就警示大家,你不能高估計算機打出來的字所富含的意義,你不能高估這個意義。
再過了二三十年,AI的研究逐漸從大學轉到了企業部門,哲學方面目標逐漸被商業目標所替代。事實上,AI確實取得了一定的成功,但是也有一定的失敗,我們來簡單看一看它的一些成功,比如在圍棋、西洋棋當中,今天世界上的冠軍都是機器,而且它在語言識別方面也是有很大的成功,速度很快也能識別。但是它並不是一種理解。
谷歌翻譯VS侯世達翻譯
另外一個對谷歌翻譯的測試,侯世達教授把它叫做侯道仁翻譯,就是楊絳的一本書,大家可能都讀過,叫做《我們仨》,它是一個回憶錄,是關於她和她丈夫錢鍾書以及他們女兒的一個回憶錄,是一個比較悲傷的故事。侯世達教授拿這個書當中的一段話對比一下機器翻譯和人工翻譯的區別。
事定之日,晚飯後,有一位舊友特僱黃包車從城裡趕來祝賀。客去後,鍾書惶恐地對我說,「他以為我叫做南書房行走了。這件事不是好做的,不求有功,但求無過。」
——楊絳《我們仨》
這個就是我們想要翻譯的原文,我們來看一下谷歌翻譯的成果。
第一段,谷歌翻譯是這麼翻的:
我們看一下這一小段:谷歌翻譯把「客人去後」翻譯成「Guest to go」,這沒問題,但卻把 「鍾書惶恐地對我說」翻譯成了「the book of fear in the book said to me」。谷歌翻譯把「南書房行走」翻譯成了『South study walking』,誰能明白這是什麼意思?英文讀起來不知所云,所以這個問題很嚴重。
我們再看一下侯世達翻譯版本:
這個南書房行走,侯世達教授翻譯成South Study special aide,實際上他想了很長時間才想清楚怎麼翻譯,還問了一下他的夫人。侯世達教授的夫人是中國背景,教授跟他的夫人說把「行走」翻譯成「信使」可不可以,夫人說看不懂,於是他就使用谷歌搜尋引擎來進行了一下搜索,又搜索南書房行走這5個字,最後出現了一個由人寫作的網頁,這才解決了侯世達先生的一個疑問。
講完他做的這個小小的測試,侯世達教授說「我不是要炫耀我的譯法,我只是告訴大家,我真的花了很長時間才理解這個段落。最終理解這個段落之後,我選用了南書房特別顧問這樣一個譯法。」
在演講進入尾聲時,侯世達教授再次帶大家回到了王維的詩,他不僅給這首詩提供了一個英譯,還模仿了唐詩和漢字的結構寫了出來:
bleak peak no one seen
but hear snips of talk
late light spins through bosk
shines back on green bark
這幅圖裡有什麼玄機呢?
歡迎大家在留言區給湛廬君留言,答對有獎哦!
機器翻譯的極限
演講最後,侯世達教授給大家總結道:
「總結一下,為什麼讓機器進行世界級的圍棋比賽和讓機器翻譯一個非常簡單的句子,是完全不一樣的呢。不管今天的機器翻譯吹得多麼耀眼多麼深刻,它是空洞的,它並不懂這個情景後面是什麼意義,它僅僅是把這個符號玩來玩去的,它其實並不知道符號所代表的意思,這是今天的機器翻譯。
也許它反映的是企業的目標,而不是哲學的目標。機器翻譯也許會成為另外一種面貌,而且也許有一天機器翻譯會呈現完全不同的情況。但是現在這個時刻,機器翻譯不了解情景,因為它不了解詞是有意思的。
機器翻譯不懂什麼是山,什麼是聲音,什麼是綠色,什麼是青苔,機器翻譯不知道空間,不懂時間,不懂上或下,不懂大或小,不懂人,不懂物,也不懂世界,不懂任何存在,也不懂任何發生的事,基本什麼都不懂。機器並不是說稍微地在懂一些什麼東西,它根本就不了解它所工作的文本,它一點都不懂。機器翻譯是空洞的,句號。機器翻譯僅僅是機器翻譯而已,句號。」
侯世達教授對「翻譯」理解和實踐,也融入了他與Emmanuel Sander教授合著的《表象與本質》裡,他和三位中譯者仔細交流全書的翻譯,經過三年時間的打磨,湛廬文化將於今年9月推出中譯本。 這幾天侯世達夫婦的北京之行,也正是為了向大家介紹《表象與本質》。
4月17日上午,侯世達教授蒞臨湛廬思想空間,與湛廬文化創始人韓焱女士進行了愉快的交流,就此開啟了此次2018北京行的第一站旅程。在接下來的幾場活動中,韓焱女士作為侯世達新書《表象與本質》的出版人和致辭嘉賓,為大家分享了侯世達教授此次北京行背後的故事,同時闡述了她對侯世達教授兩部作品重要價值的新思考。
4月17日下午,侯世達教授在清華大學進行了此次北京行的第一場公開演講。他的演講主題是《表象、本質、類比:腦海的本質》,而表象、本質、類比正是他新書裡的三個關鍵詞。清華大學社會科學學院院長、心理學系主任彭凱平教授、清華技術創新研究中心主任、《清華管理評論》執行主編陳勁教授也與侯世達教授進行了精彩的對話。
4月18日下午,侯世達教授在騰訊研究院發表了他的第二次演講,並與集智俱樂部創始人張江、騰訊研究院助理院長程明霞、葦草智庫聯合創始人段永朝、搜狗CEO王小川、龍泉寺賢度法師等展開了精彩紛呈的圓桌對話。