話題| 機器可以「翻譯」但不能真正理解

2020-12-14 大學新聞

侯世達 (Douglas Richard Hofstadter)

註:「侯世達」這個名字,是翻譯《GEB》中文版時,根據「Hofstadter」音譯取的名,Hofstadter 本人給自己起的中文名是「侯道仁」。但因「侯世達」這個名字流傳甚廣,已經和《GEB》這本書緊緊連在一起,故下文仍以「侯世達」稱呼 Hofstadter 先生。

4月18日下午,侯世達參加了由騰訊研究院、集智俱樂部、湛廬文化、葦草智酷聯合舉辦的 AI&Society 第五期活動,這是一場定向邀請50名業內人士並在APP進行網絡直播的活動。

活動邀請到了騰訊研究院助理院長程明霞、搜狗 CEO 王小川、葦草智酷創始合伙人段永朝、龍泉寺人工智慧與信息技術中心主任賢度法師、北京師範大學系統科學學院教授張江等嘉賓進行對談。活動由集智俱樂部創始人張江教授主持。

主持人,集智俱樂部創始人張江

美國學者侯世達(DouglasRichard Hofstadter)為中國人熟知,是因為《哥德爾、艾舍爾、巴赫》(GEB)這本站在數理邏輯、認知科學、人工智慧、語言學等領域交匯點的奇書。2010-2011年,集智俱樂部就曾組織12次讀書會探討《GEB》。集智俱樂部的創始人張江,更風趣地說,米歇爾·沃爾德羅普的《複雜》一書讓他對複雜性產生研究興趣,而看了《GEB》,讓他決定為此付出畢生精力。

這次,在侯世達與法國心理學家埃馬紐埃爾·桑德合著的《表象與本質》(Surfaces and Essences)中文版即將上市之際,這位知名學者來到了北京。

侯世達教授發表了主題演講、回答觀眾提問,並與嘉賓進行圓桌討論人的創造力和人工智慧。

《表象與本質:類比作為思維的燃料與火焰》(Surfacesand Essences:Analogy as the Fuel and Fire of Thinking)預定於今年下半年出版,這將成為侯世達在中國出的第二本圖書。《表象與本質》英文原版出版於 2013年,本書的主題是,類比能力是人類認知的核心,沒有類比就沒有概念,沒有概念就沒有思想。人類通過類比學習概念,依靠概念進行思考、交流。

其實「類比」是侯世達思想中一脈相承的概念。在《GEB》中,他就發現纏結的層次結構在不同領域普遍存在,哥德爾、埃舍爾、巴赫的思路有異曲同工之妙——它們的理論/作品具有某種同構性:哥德爾是抽象的數學關係,埃舍爾是形象的畫面關係,巴赫是聲音構成的空間關係。侯世達發現了不同學科領域之間奇妙交錯的這一經歷,是對類比思維的完美示範。

湛廬文化創始人、董事長韓焱在開場致辭中介紹了她對侯世達著作的喜愛,以及侯世達教授與中國的淵源——侯世達教授學習中文十幾年,太太是出生在杭州的中國人。侯世達在17日的演講上,做了一個簡寫SEA重疊在一起的圖案,就是大海的意思,正好對應中文的「腦海」,表達了本書「類比是人類思維的燃料與火焰」的主題。

湛廬文化創始人韓焱

接著,《表象與本質》的中文版譯者、侯世達的同事與好友劉健教授,介紹了將《GEB》與《表象與本質》從美國介紹到中文世界的過程。這本《表象與本質》中文版,由劉健教授與侯世達教授的兩位博士生,歷經一年時間進行翻譯,參考了互為翻譯、相互獨立的《表象與本質》英文版和法文版。由於書中涉及專業的語言學內容,翻譯難度極高,譯者們進行了多次的打磨甚至爭吵,保證了最終的翻譯質量。

侯世達新書《表象與本質》譯者劉健

侯世達教授的演講主題是機器翻譯(MachineTranslation,MT)。

翻譯,是侯世達近年非常關注的一個研究課題。他認為,翻譯不僅指圍繞英漢、漢英之間的翻譯,也涉及到人類理解能力與機器翻譯之間的關係。

MT的概念最早在1947年,由學者WarrenWeaver提出,他認為翻譯是一個解碼(decode)的過程,翻譯就成了只有單一正確的可能性,因為解碼是個完全機械的過程。到了1959年,學者Yehoshua關於機器翻譯的文章,成為了最著名的一篇,論文提出機器翻譯的完滿狀態「FAHQMT」(FullyAutomatic High Quality Machine Translation),也指出機器翻譯的不可行性。

侯世達首先用中文朗誦了王維的著名詩歌《鹿柴》,然後展示了8個英文翻譯的版本,其中不乏加入了原詩中沒有的「我」、「我們」等主語以及其他意向,行數與音韻排列也各有千秋。這些翻譯,都包含著中文的意蘊,也有英文的傳統,更飽含每一位譯者的主觀判斷與想像。很難說哪個翻譯是最好的,也不存在「完美的」翻譯。

王維《鹿柴》

在機器翻譯被發明70多年後的2018年,侯世達在谷歌翻譯上做了一個小實驗,但結果都不盡人意,得出了許多可笑的翻譯結果。歸根結底,是由於機器翻譯無法理解語境,從而無法理解一個詞的意義。

在今天,MT意味著深度學習與大數據。AI有了很多成就,比如在圍棋,以及視覺識別、自動駕駛等領域。但在翻譯上,侯世達仍為AI的能力打上了問號。

為何AI在下圍棋和翻譯上的完成度差距這麼大?這是因為今天的MT不管多「深度」,都是空洞的。它們對語境沒有理解,也就對詞語沒有理解,MT對時空、對存在、對任何事物都沒有感知。

基於此,侯世達對翻譯的建議是:當你越不忠實於「表象」層次,就能越忠實於「本質」層面。就像廚師形容一種沒有嘗過的味道是靠類比,翻譯也是靠類比。

他展示了自己翻譯的英文版《鹿柴》,在形態上完全類比中國古詩的形式,還達到了「人」與「入」相同的對稱性,贏得了現場觀眾一片掌聲。他還用了自己把楊絳的《我們仨》翻譯為英文的經歷,說明了即使是人,對一個詞語的理解都需要漫長、深度的認知,機器不可能做到。

侯世達翻譯的《鹿柴》

他對自己兩本書的中文翻譯也是如此要求的。他希望翻譯是用類比、解釋的方式,而不是機械地在另一個語言中重複。

最後,侯世達教授總結,「機器翻譯是空洞的,句號。機器翻譯僅僅是機器翻譯而已,句號。」

文字 | 郭寶婷

編輯 | 孔德淇

相關焦點

  • B站「不靠譜」翻譯大賽:機器翻譯,還遠不能取代人工翻譯
    除了單詞和語法,我們如何理解某句話在字面意義背後的情景?機器翻譯有可能達到理解文化背景的程度嗎?如何為一個詞在另一種語言中尋找最恰當的對應表述——如果沒有的話,譯者是否可以發揮創造,以打破原句為代價去傳達語意?在《你耳朵裡有魚嗎?》
  • 機器之心獨家對話百度 NLP:先解決語義理解,再談機器翻譯取代人類
    為此,機器之心專訪百度自然語言處理部技術負責人吳華、高級總監吳甜,就神經網絡機器翻譯系統的優缺點、如何獲得高質量訓練數據及百度翻譯目前進展展開話題。同時也藉此機會了解百度自然語言處理部及其開展的 NLP 技術研發工作。以下為採訪內容整理,以饗讀者。NMT、SMT 的優與缺機器之心:能請您先介紹一下百度 NLP 部門嗎?
  • 機器翻譯與人工翻譯之爭
    認知智能是人工智慧的最高階段,自然語言理解是認知智能領域的「皇冠」。機器翻譯這一自然語言處理領域最具挑戰性的研究任務,則是自然語言處理領域「皇冠上的明珠」。近年來,機器翻譯發展十分迅猛,但對於機器翻譯與人工翻譯孰優孰劣、機器翻譯能否取代人工翻譯,一直存在爭議。
  • 機器翻譯的膚淺面-虎嗅網
    它只熟悉由字母所組成的字符串,只知道以超快的速度處理一段段文字,而不知道如何思考、想像、記憶和理解這些文字。它甚至不知道文字指涉了事物。我可以毫不猶豫地說,理論上講,電腦程式本可以理解語言的用途,可以擁有思想、記憶和經驗,可以應用它們。然而,「谷歌翻譯」卻不是為了這些目的而設計的,設計人員甚至根本沒有這樣的野心。
  • 李長栓:機器可以取代人工翻譯嗎?也許永遠沒有實現的一天
    所以,普通的用戶用不起專業翻譯,也沒有那麼多專業譯員可以滿足海量的翻譯需求。而成本低,速度快,正是機器翻譯的優勢,即使翻譯不夠準確,也能夠在一定程度上滿足用戶需求。況且,普通人最多只能熟練使用兩三門語言,而機器翻譯則不受語言的限制。所以,機器翻譯的發展可以讓普通大眾輕易獲取大量國外信息。對於專業譯員來說,可以利用機器翻譯來做初稿,然後編輯加工。
  • 李沐、劉群、劉洋、朱靖波、張民:當前機器翻譯的瓶頸
    對於第一個話題,專家們就應用和技術層面進行了討論。朱靖波教授認為機器翻譯的瓶頸主要在應用層面,李沐博士強調了瓶頸的定義問題,劉群教授指出數據稀疏是個瓶頸,劉洋教授則補充道知識獲取也是一個瓶頸。值得一提的是,針對第二個話題,朱靖波教授提出了「不存在第四代機器翻譯」的觀點,直面眾專家的反駁,張民教授在這時候加入,並表示反對。
  • 譯見||蔡基剛 李長栓:機器翻譯VS人工翻譯
    所以,普通的用戶用不起專業翻譯,也沒有那麼多專業譯員可以滿足海量的翻譯需求。而成本低,速度快,正是機器翻譯的優勢,即使翻譯不夠準確,也能夠在一定程度上滿足用戶需求。況且,普通人最多只能熟練使用兩三門語言,而機器翻譯則不受語言的限制。所以,機器翻譯的發展可以讓普通大眾輕易獲取大量國外信息。對於專業譯員來說,可以利用機器翻譯來做初稿,然後編輯加工。
  • 朱靖波:談談機器翻譯技術發展與產業化
    但是話說回來,玩一玩是可以的,但是要真正做到系統能用,其實代價還是挺高的。 大家經常會問我:如何真正做好一套好用的機器翻譯系統?我認為至少需要三個東西:一是需要掌握最新的機器翻譯技術;二是需要大規模的雙語句對庫;還有很重要的一點是要針對錯誤進行驅動打磨。打磨一個系統是需要花時間的,這就是為什麼大家用相同的數據,用相同的模型,做的系統不一樣。
  • 王維、楊絳與機器翻譯的本質
    沃倫·韋弗認為翻譯是一個解碼的過程,這個解碼的過程,有一個正確的答案。同時他認為機器翻譯能夠「理解」這個密碼所代表的意思。 從1947年到現在,又發生了什麼?其中有一篇文章就是1959年由Yehoshua寫的文章,他雖然對機器翻譯有多年研究,但最終對機器翻譯持批評的態度,不過他對於機器翻譯的可能性卻持有比較曖昧的態度。
  • 搜狗王小川:2020年 機器翻譯的某些指標可以趕上人類翻譯
    他回顧了人工智慧在語言領域取得的進展,並指出「到2020年,機器翻譯在一些指標上可以趕上人類翻譯。」  神經網絡機器翻譯技術,目前已經在搜狗的核心產品中進行應用:搜狗輸入法上線翻譯功能,用戶可在聊天場景中進行中、英、日、韓等語言的翻譯;搜狗搜索中的英文搜索頻道,可以幫助用戶用英文搜索全世界。此外,搜狗還上線了翻譯App,幫助有專業需求的用戶進行聲音、圖片和文字的翻譯。  2018年,搜狗的兩款智能硬體——旅行翻譯寶、錄音翻譯筆正式發售。
  • 有道段亦濤:人工智慧將顛覆機器翻譯
    之後我就加入了網易有道,目前主要關注機器學習領域,尤其是深度學習在機器翻譯、圖象識別、在線教育等方面的應用。  神經網絡翻譯質量提升 是過去十年總和  有道其實很早就開始做機器翻譯,我們在2008年就推出了機器翻譯的服務,應該是國內最早推出這一服務的網際網路公司。這兩年我們更關注把深度學習接入機器翻譯領域,我們研究成果是非常顯著的,我們的機器翻譯質量有非常大的提升。
  • 越來越聰明的機器「翻譯家」
    如果按轉換層面進行劃分,可以分為直接翻譯、轉換翻譯和中間語言翻譯,其中轉換翻譯又可以分為短語層、句法層、語義層等(圖2)。「中間語言法」比較好理解,首先就是建立一個標準語言作為中介,這個中介語言有點類似曾經流行過一段時間的「世界語」,當然機器翻譯的中間語言通常不會是真正的語言,而是類似邏輯表達式等(如果是以自然語言如英語作為中介,則這一中介語往往稱作「樞紐語言」)。首先將要翻譯的語言經過分析轉換成中間語言,再將生成的中間語言轉換成目標語言。
  • 能否夢見電子羊——機器翻譯能實現嗎?
    當然這是得益於機器翻譯。報導中說,機械翻譯技術日新月異,再過十年,人們就可以在數十種語言之間自由交談。「語言障礙」這個概念將會消失。因為事關我的生意,在接觸到這種話題後,就有種「可能飯碗不保」的思考迴路在運作。AI、機器人技術、語音處理技術等話題時常被報導,也常被人問,「如果翻譯學校的公開講座等實現機器翻譯的話,翻譯是不是就沒用了呢?」這樣的問題。
  • 【專欄】機器翻譯將成下一輪產業浪潮,翻譯會失業嗎?
    筆者曾與多位從事專業翻譯的朋友以機器翻譯的應用為話題做交流,五年以前得到的反饋基本上都是「唱衰」的負面觀點,認為機器翻譯根本無法與人工翻譯相提並論。但近兩年,翻譯界,尤其是翻譯公司對機器翻譯的評價發生了很大變化,逐漸開始接受機器翻譯可用性的結論,甚至還有相當一部分人害怕機器翻譯,擔心丟飯碗。
  • 黃學東: 機器翻譯離舉一反三還很遠
    對自己成績足夠自信的同時黃學東對於技術本身又表現得足夠謙遜,真正的自然語言理解還需要更長的路要走,那才是人工智慧真正的皇冠。假裝聽懂人話黃學東有一連串響噹噹的頭銜。黃學東深信「對話即平臺」,「語音交互的發展是一個自然的過程,這是因為語音交互是一個無需觸碰設備即可完成的體驗,它可以讓人擺脫設備的枷鎖。」目前,微軟已經將機器翻譯技術落地。但高計算量、噪音問題、理解力這三個問題,目前還是限制了語音交互在實際應用場景中的效果。
  • 英國女王御用翻譯林超倫:機器翻譯不能取代人工譯員
    如果我從語言上準確翻譯司儀的話,就有可能無法讓中國客人明確原話的意圖。但是如果處理成「敬請關閉手機」又可能有違司儀含蓄的意圖。我的處理是先按照原話準確翻譯,但後半句採用調侃的語氣作鋪墊,然後增加個關閉手機的動作。中國觀眾會意,紛紛關閉手機。口譯常常如同過五關斬六將。第一關就是要聽見原話。
  • 機器翻譯簡史
    不過這一類系統也並非完全一樣,還可以再細分為各種子類別。直接機器翻譯直接機器翻譯需要訓練有素的語言學家為每個詞編寫規則,輸出的語句可以說是一種譯文,但通常很詭異。這種方法現在已經淘汰了。基於轉換的機器翻譯
  • AI人工智慧翻譯會真正取代人工翻譯嗎?
    當今機器翻譯水平得益於神經網絡翻譯的發展和語料庫擴充,機器翻譯準確度大大提高。對於僅瀏覽網站、無特殊需求的網民來說,在線翻譯平臺的語言質量已經「夠好」了。儘管許多在線平臺的翻譯質量不能滿足企業需求,但人工智慧翻譯也在這些領域產生巨大影響。
  • 未來的世界:機器翻譯VS人工翻譯
    同樣,在英語defendants是翻譯成刑事語境下的「被告人」,還是翻譯成民事語境下的「被告或原告」這一問題上,李長栓擔心「這些微小差別,更不能指望機器分辨出來」。我認為,這種擔心猶如擔心機器翻譯無法解決如打球、打賞、打牌、打臉、打針,打毛衣中「打」字的歧義,這是沒有根據的。機器翻譯完全可以將其分辨出來。 自信來自筆者對機器翻譯原理和人工智慧發展前景的認識。
  • 如果人工翻譯一定會被機器翻譯替代,翻譯專業的學生現在怎麼辦?
    「替代」不是說將翻譯職業徹底消滅,而是在某些具體場景下,機器翻譯可以發揮作用,將人類解放出來。討論這個話題,不是只有「替代」和「替代不了」兩種情況,答案永遠是:有的場景可以替代,有的場景替代不了。牛津大學的學者 Michael Osborne 和 Carl Frey 給出的研究結果就是翻譯被取代的概率——33%。