谷歌翻譯又被專業翻譯diss了:那它到底有沒有用?

2021-01-14 荔枝網新聞

  新浪科技 姜軼群

  春節假期已經過去幾天了,不知道大家有沒有吃好玩好?朋友圈這幾天幾乎被美食、萌娃視頻和景點照片刷屏了,讓人好生羨慕。

朋友圈(為保護隱私,一些信息打了碼)

  不知道大家注意到沒有,上面四條朋友圈消息,有一條是在俄羅斯發出來的。實際上,在這個傳統上要回鄉團聚的日子裡,也有相當一部分人選擇全家出國旅遊。根據中國旅行研究院與攜程旅行統計,今年春節預計中國出境遊人數將達到650萬人次,中國人在春節假日出境旅遊幾乎可以「席捲全球」。

  但出國旅遊就有個問題:如何在當地交流?這可不是光學會幾句英語就能解決的問題,如果你要去不以英語為母語的國家,可能就麻煩了,不是每個當地人都會講英語。這時候,手機上的翻譯軟體就有用處。

  目前出國旅遊比較流行的是谷歌翻譯。對於中國大陸用戶來說,近期比較重要的更新是在去年的3月29日,谷歌更新後的翻譯App可以在中國大陸地區無障礙使用,經過一波宣傳,用的人越來越多。在知乎上「出國旅遊有什麼好的可攜式翻譯機或App可用?」這一問題中,得贊最多的回答首推谷歌翻譯App。

  知乎上「出國旅遊有什麼好的可攜式翻譯機或App可用?」這一問題中,得贊最多的回答

  但機器翻譯一向被專業譯員鄙視,即使谷歌為翻譯加持神經網絡技術也沒有改變很多人類譯員的看法。最近美國《大西洋月刊》上的一篇文章中,作者道格拉斯·霍夫施塔特(Douglas Hofstadter)對谷歌翻譯diss(侮辱)了一把。他通過英語、法語、德語和中文四種語言翻譯比對,論證出一個結果:谷歌翻譯即使應用人工智慧技術,也沒有真正理解語言。

  他在文章中舉了中文翻譯英文的例子,文本是楊絳的《我們仨》中的一段。

  原文:

  鍾書到清華工作一年後,調任毛選翻譯委員會的工作,住在城裡,周末回校。 他仍兼管研究生。

  毛選翻譯委員會的領導是徐永煐同志。介紹鍾書做這份工作的是清華同學喬冠華同志。

  事定之日,晚飯後,有一位舊友特僱黃包車從城裡趕來祝賀。客去後,鍾書惶恐地對我說:

  他以為我要做「南書房行走」了。這件事不是好做的,不求有功,但求無過。

  谷歌翻譯版本:

  After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends。 He is still a graduate student。

  The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian。 Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades。

  On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate。 Guest to go, the book of fear in the book said to me:

  He thought I had to do 「South study walking。」 This is not a good thing to do, not for meritorious service, but for nothing。

  作者翻譯版本:

  After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao。 He lived in the city, but each weekend he would return to school。 He also was still supervising his graduate students。

  The leader of the translation committee of Mao’s works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua。

  On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu。 After our guest had left, Zhongshu turned to me uneasily and said:

  「He thought I was going to become a 『South Study special aide。』 This kind of work is not easy。 You can’t hope for glory; all you can hope for is to do it without errors。」

  作者在這裡指出了谷歌版本不少問題:

  翻譯中一次也沒提到過人名「鍾書」,而是分別翻譯成了「he」、「the book」和「the book of fear in the book」。很明顯,谷歌翻譯沒有理解出這是個人名;

  原文是「他仍兼管研究生」,但翻譯變成了「He is still a graduate student」(他仍是個研究生);

  谷歌譯文中的「Mao Tse Translation Committee」這一短語,漏掉了毛澤東主席(Chairman Mao Tse Tung)名字的最後一個字,而且「毛選翻譯委員會」明顯也不是這麼翻譯;

  原文的「徐永煐」(Xu Yongying)被翻譯成了「Xu Yongjian」。

  「客去後」被翻譯成了「guest to go」(客人要走)。

  「南書房行走」中的「行走「被翻譯成「walking」,這也是谷歌沒有理解原詞含義。

  不光是這一段,作者從他當下看的書中選擇了好多個段落進行測試,幾乎每一段都會出現形式不一、大小各異的翻譯錯誤,其中也包括上文所述的無法理解的句子。

  為什麼谷歌翻譯在上面的例子中還是不盡如人意?在作者看來,谷歌翻譯只是類似於處理密碼一樣處理語句,而沒有像人類一樣「閱讀「語句,它處理的符號和現實世界是分開的,沒有現實體驗,也就談不上理解。

  谷歌翻譯不盡如人意,但它真的完全沒有用嗎?

  既然谷歌翻譯在前面的例子中如此糟糕,那對於出國的遊客來說,谷歌翻譯還有用嗎?

  前面diss谷歌翻譯的作者霍夫施塔特指出,谷歌翻譯目前還不能做到準確理解語句;但霍夫施塔特只分析了一類文本,那就是文學作品類。谷歌翻譯面對的可絕不僅僅是想了解文學作品的人,對於不同的需求,它的表現會不會有所變化?換句話說,對於出國遊客來說,谷歌翻譯的表現會不會更好一點?做一個簡單測試也許能看出來。

  新浪科技以百度上各類「出國英語XXX句」中隨機挑選的10個出國常見語句為樣本,輸入到iOS版谷歌翻譯App中測試(這裡的測試語句除了常見的問路類型,還有相對比較複雜的),然後將這10句原文和翻譯分成三類,分別是「有歧義」、「不常用」和「正確」類型,結果如下:

  分類結果

  這裡要注意的是,這裡分類的依據是可理解的程度,而不是語法。這就意味著只要能夠被理解且不出現歧義,即使是有明顯語法錯誤的,也可以被分到「不常用」類別,比如「How to get to the subway station」這種有語法錯誤的句子,但還能通過單詞理解,就分到「不常用」類別中。

  但即使按照這樣不太嚴格的標準來分類,可理解與有誤解的比例還是6:4,以下就來說說四個「有歧義」句子可能出現的誤解:

  「我要退這張票」翻譯成「I want to withdraw this ticket」,可能會被誤解成「我要拿走這張票」,因為「withdraw」有「拿走」的意思,而沒有「退票」的含義;

  「我想把這張50美元換開」中的「換開」不能翻譯成「swap」,因為這個英語單詞不能用於「換零錢」這個含義中;

  「能給我張退稅表嗎?」的谷歌翻譯「Can you give me a tax return?」,把「表格」(form)這個含義在翻譯中丟失了,而且「tax return」是「報稅」的意思,而不是「退稅」的意思;

  「這有免稅店嗎?」被谷歌翻譯錯譯了「Is this duty-free shop?」(這家店是免稅店嗎?),這是一個只要稍微學過英語的人都會看出來的錯誤。

  從隨機的測試結果看來,谷歌翻譯的準確度離滿足遊客的需要還是差了一些距離。

  為什麼有了人工智慧加持,谷歌翻譯還是不夠好?

  前文中說過,谷歌近期比較重要的更新是可以在中國大陸地區無障礙使用。但實際上,谷歌在前年有一次更重要的更新,那就是將翻譯系統從原來的「基於詞組的機器翻譯」(PBMT)轉變為「神經機器翻譯」(NMT),也就是將神經網絡技術引入到機器翻譯中。谷歌宣稱,經過此次更新,翻譯結果更加通順,可用性更強。

  按照百度百科的說法,神經網絡「是一種模仿動物神經網絡行為特徵,進行分布式並行信息處理的算法數學模型」。這個定義非專業人士不太好理解,沒關係,只要知道神經網絡是實現人工智慧的基礎性技術就好了。

  人工智慧是這幾年的大熱新聞關鍵詞和最流行的技術,連今年的春節晚會上都展示了人工智慧技術加持的自動駕駛汽車。但新聞中常常被講的神乎其神的人工智慧怎麼在語言翻譯這方面都做不好?前文中那個diss谷歌翻譯的作者霍夫施塔特給了我們一個解釋。

  霍夫施塔特認為,很多人其實對人工智慧的期待過高,從而「腦補過度」,這在心理學上被稱為「Eliza 效應」,大概意思是說人會過度解讀機器的結果。這裡的「Eliza」是上個世紀60年代的早期人工智慧項目,能通過腳本理解簡單的自然語言,並能進行類似於人類的互動,與它互動過的許多人都認為Eliza確實了解他們內心的感覺。在霍夫施塔特看來,即使是一些人工智慧領域的研究者,也難免落入「Eliza」效應的陷阱中。

  霍夫施塔特認為,人類的翻譯是一個「閱讀-內化-表達」的過程,人類讀到文本之後,會聯想到相關的現實場景,然後基於場景給出另一種語言對於這種場景的表達。但谷歌翻譯只是一個「解碼」過程,即使是人工智慧加持,谷歌翻譯也沒有真正理解文本,它只是將原文看成被加密的譯文,只要解碼即可翻譯。這樣的過程缺乏現實體驗,談不上理解,當然就難免出現錯誤。

  有人也許會問,神經網絡技術就不能模仿人類思維來翻譯嗎?霍夫施塔特也給出了自己的答案,他認為這類機器翻譯目前還沒有超越單詞和短語層面,這樣的人工智慧在「讀」到文本之後,只是聯想到對應語言的單詞,而不是聯想到現實場景,儘管用了複雜的統計詞語聚類算法,但這和人類的翻譯思維還是不一樣。這種技術加持下的谷歌翻譯,雖然能將原文和譯文的詞語對應起來,還有一定能力組織成句子,但還是難以理解。

  霍夫施塔特的說法在新浪科技的測試中也得到驗證。此前的出國常用語句翻譯測試,從「退票」翻譯成「withdraw ticket」和「換開」翻譯成「swap」這兩個例子中,就能看出谷歌翻譯目前還停留在詞對詞或者短語對短語的層面,而不是聯想到實際場景,即使按照正確的語法組織起來,也難以讓人理解。借用一位翻譯學教授的話:「你每一個字看得懂,但連起來就不是人說的話。」

  由此看出,谷歌翻譯距離完全無障礙的應用還有一定距離。在這種情況下,出國的遊客除了在手機裝上幾個翻譯App之外,最好還是多學點常用英語,再不濟也練一練畫圖技能,以備不時之需。當然,人工智慧的研究者還是要更深入的探究人類思維,並且開發出一款更好的翻譯App;如果真有這麼一天,專業譯員也會對機器肅然起敬了。

  最後,新浪科技祝大家春節假期快樂,不管你是在國外還是國內。

  新浪科技公眾號

  「掌」握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)

  加載中

相關焦點

  • 谷歌翻譯對《我的世界》有多大破壞力?看翻譯的內容就知道了
    但是總會有一些軟體,會對我的世界造成幹擾。這些軟體都是我們耳熟能詳的,比如說谷歌翻譯。我的世界被谷歌翻譯,其實傷害的很大。但是又由於谷歌翻譯的影響力,讓我的世界讓更多人知道。因為谷歌翻譯翻譯我的世界,這款遊戲出現非常多的么蛾子。就從這張圖片我們就可以簡單地說一下,這是我的世界中的一個食物,卻被翻譯成了加拿大季節。
  • 用谷歌翻譯二十次之後會發生什麼?
    有意思的是,衍生到後來,這波操作進化成了——用谷歌翻譯娘來 「 滾鍵盤 」 。簡單來說,就是把一段原文不斷的翻譯成其他國的語言,最後再滾回中文,在文意上會出現意想不到的結果。儘管谷歌翻譯娘的翻譯有時候會讓人摸不著頭腦,但在大多數的情況下,還是靠譜的。
  • 支持108種語言的谷歌翻譯如何用AI讓翻譯質量越來越好?
    Google之外的努力也說明了問題的難度,Masakhane項目旨在使非洲大陸上的數千種語言能夠自動翻譯,但它還沒有超出數據收集和轉錄階段。共同的聲音(雷鋒網(公眾號:雷鋒網)注,Common Voice是Mozilla發起的一個眾包項目,旨在為語音識別軟體創建免費的資料庫)自2017年6月推出以來,Mozilla為建立轉錄語音數據的開源集合所做的努力僅審查了40種聲音。
  • 硬核測評,谷歌翻譯被碾壓!全球首個翻譯引擎進化歸來,「細節狂魔...
    DeepL由於極好的準確性,也同樣引爆了Reddit,有網友指出,DeepL不是像谷歌翻譯那樣從字詞上進行翻譯,從Textractor的設置上可以看到,DeepL還支持用以前的翻譯作為上下文對翻譯結果進行改善。
  • 谷歌翻譯是如何藉助多項新興AI技術提高翻譯質量的
    網易科技訊6月6日消息,據國外媒體報導,谷歌表示,它已在提高沒有大量書面文本語料的語言的翻譯質量上取得了進展。,谷歌還升級了一個有幾十年歷史的爬蟲程序。對於資源較少的語言,谷歌在谷歌翻譯中採用了一個回譯機制,來強化並行訓練數據,即語言中的每個句子都與其譯文相配對。(機器翻譯傳統上依賴於源語言和目標語言成對句子的語料庫的統計。)在該機制中,訓練數據與合成的並行數據自動對齊,目標文本為自然語言,而源文本則由神經翻譯模型生成。結果是,谷歌翻譯充分利用更豐富的單語文本數據來訓練模型,谷歌稱這對提高翻譯流暢性特別有幫助。
  • 人工智慧翻譯大比拼 有道翻譯戰勝谷歌奪得冠軍
    比如挑戰者說:「我好像被你嫌棄了的樣子」,谷歌翻譯卻譯成了:「I really want to be your ex-wife, look.」,意思完全不對。測試有道翻譯官的素材,來自《大話西遊》的經典臺詞,「曾經有一份真摯的愛情擺在我面前,但是我沒有好好珍惜。」「等失去後我才後悔莫及,人世間最痛苦的事莫過於此。」
  • 只要一個谷歌翻譯,玩家:千萬不要用
    因為我的世界只是一款普普通通的遊戲,它並沒有具有人一樣的屬性。瘋狂這個詞其實是用在人或者說對事情的態度上。但是這個詞用在了我的世界上,想必我的世界有這方面的潛力。 這方面的潛力還需要和一個軟體相配合才可以達到。那就是谷歌翻譯。簡單囉嗦幾句,谷歌翻譯是一款專業性的翻譯軟體。它可以翻譯各種文字。中文英文日文韓文都是他的拿手好戲。包括一些非常冷門的文字,它也可以翻譯。
  • 更快更高效:谷歌翻譯應用正在開發一項音頻即時翻譯
    日前,外媒bgr記者刊文稱:谷歌的大多數移動應用都非常棒,我也曾無數次地寫過自己是有多喜歡它們。自2007年首款iPhone發布以來,我就一直是iPhone用戶,但相比較而言其使用谷歌的時間更長且在很多事情上仍舊依賴谷歌。
  • 中國有嘻哈diss是什麼意思 diss含義意思翻譯用法介紹
    diss是什麼意思 中國有嘻哈diss是什麼意思  中國有嘻哈自播出以來,就受到了很多人的關注,吳亦凡的freestyle在網上火爆,吳亦凡殺手吳上線,引起了不少人的熱議,在中國有嘻哈中吳亦凡的點評辛辣、並且含有不少的專業詞語,當然有觀看這個綜藝的觀眾海關注到了一個新的梗——diss,中國有嘻哈diss是什麼梗呢?
  • 再出現神級翻譯,谷歌翻譯效果炸裂
    但是谷歌翻譯把工作檯翻譯成了我要去警察局。那我的世界玩家誰還敢用這個工作檯?製作一個工作檯還需要去警察局,這簡直是天大的笑話。不知道這個翻譯的內容,有沒有讓你感覺到好笑?或者說讓你感覺到莫名其妙。門上的電線「熱如果要我給翻譯軟體打分的話,谷歌翻譯估計只有20分,六十分都沒有。
  • 谷歌同志是位好「翻譯」!
    它不是直接翻譯語言,而是先將文本翻譯成英文,然後轉譯到目標語言。但因為準確度的問題,谷歌翻譯曾多次受到批評和嘲笑,據測算,不同語言之間的準確度差異也很大。所以,在2016年11月,谷歌宣布,谷歌翻譯將改用神經機器翻譯引擎——谷歌神經機器翻譯(Google Neural Machine Translation,GNMT),它可以「一次翻譯整句,而不是逐句翻譯」,使之更像人類說話時的正確語法。
  • 我的世界:亮瞎眼的谷歌翻譯,簡直比出BUG還可怕,MC完蛋了嗎?
    我的世界的玩法到底有多神奇,我的世界的玩法可以和寵物小精靈結合在一起,你相信嗎?我不知道大家有沒有看過寵物小精靈這部動畫片。每當結尾的時候都會有一個猜猜我是誰的節目。 主要的內容就是和圖片中展示的一樣。用漆黑來抹蓋原來的面貌。但是大概能從外形看出來,這是什麼物品?
  • 谷歌翻譯功能逆天?小別勝新婚而已,來看中國翻譯軟體實力在哪裡 | 餘亮
    而且如果一味強調本地段子翻譯準,就好比問對方茴香豆的「茴」字有幾種說法,沒什麼實際價值。巴別塔的典故傳了不知道多少遍,可見翻譯應該是個普世的工作。相比段子,我更想把技術人的想法「翻譯」出來,談談國內各巨頭到底在和谷歌比拼什麼。
  • 谷歌翻譯接地氣程度測試
    這個直接翻譯伺服器出錯當然這是過去的機翻。近些年來機器翻譯一直在進步。目前不只是詞彙和短語,連長句和整篇文章的翻譯水平都在不斷提高。假以時日,機器的翻譯水平沒準能超過用劣質字幕蹂躪電影觀眾的那幾位老師。
  • 還在用谷歌翻譯PDF?這些更好的文獻翻譯工具別錯過了
    國內的很多同學寫論文,經常為寫英文摘要和文獻翻譯操碎的心。特別是對於很多留學生朋友來說,每天都有趕不完的due以及看不完的realing。硬看吧,看得慢;找翻譯吧,太麻煩,效果也太差。話不多說,今天給大家推薦幾款大大提升效率堪稱神器的翻譯工具。
  • 谷歌喊你定製自己的機器翻譯引擎
    今年早些時候谷歌Cloud AutoML驚豔問世,任何人皆可利用它的強大機器學習模型,定製符合特定領域需求的解決方案,而無需機器學習或編程專業知識
  • 「苟富貴勿相忘」翻譯後,谷歌:沒錢的人總會被遺忘
    既然如此,我們為何不考考它,看看在AI眼中,《陳涉世家》到底是個什麼故事。 最近,B站上一位叫做「鷹目大人」的阿婆主就用谷歌翻譯對AI進行了一次隨堂測驗,只不過它的表現嘛,就見仁見智了。 比如,AI就把這句著名的「苟富貴,勿相忘」就翻譯成了「沒有錢的人,總是會被遺忘」。
  • 谷歌翻譯核心技術 Seq2Seq
    因為這個無人駕駛這個領域的競爭比賽已經進入下半場了,上半場的任務是搶奪領先地位,而下半場的任務就是把競爭對手幹掉,所以百度一開源,很多競爭企業都沒了,這就是百度的基本戰略設想。第三個,Google Translate(谷歌翻譯),自然語言翻譯,中文翻英文,英文翻中文,中文翻法文等功能投入商用了。為什麼 Google Translate 是突破性進展?
  • 我的世界:谷歌翻譯有「超自然」力量?MC玩家差點笑成「豬頭」
    我的世界和谷歌翻譯不可能扯上關係,這是沒有錯的。但是谷歌翻譯卻把我的世界戲弄了一遍。我們可以從接下來的內容發現谷歌翻譯在遊戲翻譯上多麼不靠譜。當然,我們玩一款遊戲首先要有中文版本,因為我們對中文比較敏感。
  • 谷歌翻譯,你為何忽悠中國人?
    幾天前,有人在用谷歌翻譯器時,就發現了有奇怪的現象。我們對比一下下邊兩張圖片。包括上邊的視頻,都可以看出,同樣一句話。just lost election 只不過一個是Donald Trump, 一個是Joe Biden。這正是美國總統的兩位候選人。為何同樣是輸掉選舉的話,川普就是輸掉選舉,而拜登這句卻翻譯成拜登當選!