多家翻譯軟體大型翻車現場?機器翻譯到底有哪些不確定性

2020-12-20 手機鳳凰網

作者 | 蔣寶尚

自然語言處理果真是人工智慧皇冠上的明珠,在走向摘取顆果實的路上,人類恐怕還只是走了一半。

具體表現是,在機器翻譯的世界裡,一直無法賦予機器足夠的「靈性」。例如,林則徐虎門銷煙被某度軟體翻譯成了「Lin Zexu sells cigarettes in Humen」 。

圖註:筆者後續對百度進行測試時,發現已經是正確翻譯:「Lin Zexu destructed opium at Humen」

顯然,機器把「銷」等同於「銷售」。其實,這種等同,對於其他人,在沒有上下文語境的情況下是完全可行的,例如,小李虎門銷煙=小李虎門賣(銷售)煙、小明虎門銷煙=小明虎門賣(銷售)煙。但是,對於林則徐,是無論如何不能做這種混淆,因為,這句話本身就包含了上下文語境。虎門銷煙是中國近代史上的重要事件,對於人工譯員來說,這是非常重要的背景知識,銷毀(銷)的是鴉片(煙),目前機器翻譯系統明顯缺乏對這種知識的理解能力,這也可能是導致翻譯錯誤的一個重要原因

對此,AI科技評論還專門測試了其他幾個著名的翻譯軟體。其表現如下:

顯然,谷歌翻譯也沒能經受的得住考驗。

金山翻譯,仍然是sells,這動詞還用的是第三人稱單數!

有道翻譯:「銷煙=煙」。有道的整體翻譯,總感覺怪怪的,如果把smoke看成動詞「吸菸」也不怎麼通順!難道它把「林則徐虎門」看成了一個人?

騰訊翻譯爭氣了很多,「Lin Zexu destroys opium in Humen」點燃了希望之光~

我們試了試在日本大火的DeepL:譯文的內容相對完整一些,但也沒有正確翻譯「煙=鴉片」,譯文中包含一些多餘的單詞。

數據和算法雙重問題下的翻譯BUG

那麼,只是簡單的一句缺乏上下文語境就能解釋這麼多家翻譯軟體為什麼都出現BUG麼?為此,AI科技評論專門諮詢了東北大學自然語言處理實驗室主任肖桐老師,他解釋道: 「主要還是訓練數據的覆蓋度問題,數據中「銷」很多的時候被當作sell,對生僻一些的用法機器翻譯現在還無法處理。說到底,機器翻譯現在還是在「背」,沒見過的情況,不會像人一樣推理,缺乏對句子的真正理解能力。」

小牛翻譯創始人、東北大學朱靖波老師將這種譯文與原文本意不同的現象,稱之為「跑飛」現象,他解釋到: 「出現這種現象的原因是神經機器翻譯技術本質上沒有對句子進行真正的理解,所以有些時候無法保證譯文的忠實度。早期神經機器翻譯中這個問題比較嚴重,現在這個問題得到了緩解,偶爾會出現,但不常見。」

對於機器翻譯的這些BUG,2018年也有一篇論文詳細闡述了這些現象。這篇論文的第一作者是來自FAIR的Myle Ott,他在論文的引言部分就提到:當前大多數機器翻譯的模型都是基於神經網絡(NMT),而神經網絡機器翻譯明顯沒有給予生詞(rare words)足夠的重視,最明顯的表現是曝光誤差(exposure bias),簡單來講 是因為文本生成在訓練和推斷時的不一致造成的。

在論文中,作者對於包括但不限於「生詞」的機器翻譯現象給予了一個總結:所有的機器翻譯問題的基本主題都是不確定性,即學習任務的一對多性質,換句話說給定一個句子,有多種翻譯結果。

然後,針對這種不確定性,作者分了兩類解釋原因,一類是數據的不確定性,另一類是模型解讀(搜索)信息的不確定性。

數據的不確定性來源與兩個方面:內在和外在。

內在不確定性的表現是: 一句話會有幾種等價的翻譯 。因為在翻譯的過程中或多或少是可以直譯的,即使字面上有很多表達相同意思的方法。句子的表達可以是主動的,也可以是被動的,對於某些語言來說,類似於「the」,「of」,或「their」也是可選擇的。除了一句話可以多種翻譯這種情況外,規範性不足同樣是翻譯不確定的來源。

另外,如果沒有背景輸入,模型通常無法預測翻譯語言的時態或數字,因此,簡化或增加相關背景也是翻譯不確定性的來源。

外在的不確定性表現在: 使用低質量的網絡數據進行高質量的人工翻譯 。這一過程容易出錯,並導致數據分配中出現其他的不確定性。目標句可能只是源句的部分翻譯,或者目標句裡面有源句中沒有的信息。

對模型輸出中的不確定性量化,作者在論文中先比較了集束搜索(Beam Search)和採樣兩種搜索策略,然後研究了數據中特定種類的外部不確定性對集束搜索的影響。得出的結論是集束搜索非常高效,而更大的波束寬度在尋找更高的似然輸出方面也更加高效,而外部不確定性通過影響波束寬度從而影響搜索的效果。

在論文的最後,作者採用更全面的觀點,將估計分布與真實數據分布進行比較。結論是與數據分布相比,模型在假設空間中傳播的概率過大,往往低估了個別假設的實際概率。換句話說,模型根據概率輸出翻譯結果,有時候會出現不靠譜的情況。

機器翻譯:如何讓機器不再死記硬背?

回顧機器翻譯技術的發展歷程,第一代是基於規則的機器翻譯技術RBMT,主要通過專家手工書寫翻譯規則來實現;第二代是統計機器翻譯技術SMT,第三代是目前主流的神經機器翻譯技術NMT。

第二代SMT和第三代NMT採用機器學習方法,數據驅動,基於大規模雙語句對來訓練構建機器翻譯系統。由於人工書寫規則的代價很高,構建大規模雙語句對的代價也非常高,很多語言對難以收集大規模的雙語句對,在上述例子中機器將「虎門銷煙」中的「銷」作為「銷售」處理,也正是因為 語料稀缺所致

朱靖波老師在去年9月AI Time的一場活動中曾經提到過當前的機器翻譯與我們在外語學習機制上的差異:我們學習外語的方法並不是通過閱讀大量雙語文章,而是背背單詞,學學語法,以及大量閱讀外文單語文章,在不知不覺中掌握了外語。但機器學習外語的方式就大不一樣,不管是上一代的統計機器翻譯,還是目前主流的神經機器翻譯,都是基於大量的雙語句對訓練構建機器翻譯系統。 從這個角度上說,要緩解神經機器翻譯技術在稀缺用語上「翻車」的現狀,則需要引入新的學習機制,例如往人類學習外語的新範式方向發展,擺脫對大規模雙語句對的依賴。 這就好像AlphaGo最初根據人類棋譜來學習,之後的AlphaGo Zero引入新的學習方式,不依賴於人類棋譜來學習,下棋水平反而更高一樣。

不過,要讓機器像人類一樣學習外語,當中有一個急需解決的問題:翻譯人員對於自己的母語具有非常強的語法,能夠準確判斷母語譯文是否符合母語說法,甚至人類的大腦對於不符合母語說法的錯誤會進行自動糾正,例如下面這句:

「研表究明,漢字序順並不定一影閱響讀。比如當你看完這句話後,才發這現裡的字全是都亂的。」

同樣,在翻譯的過程中,例如在英翻中的任務中,為了構建表達一個具體含義的中文句子,只要從英文原文句子中得到幾個中文譯文單詞。例如用「我 北京 去 明天」,我們也可以容易構建一個合法中文句子「明天我去北京」或者「我明天去北京」,不會說「我北京明天去」和「我去明天北京」等不合法的中文句子,在構建過程不需要過多依賴英文原文。這一能力被研究者稱為「生成能力」,如何讓機器具有可以與人媲美的「生成能力」,則是實現類似人類學習方式的「單語學習」第四代機器翻譯的關鍵。

據AI科技評論了解,這一工作的瓶頸在於有些源語言的句法語義分析技術還處於起步階段,相關研究成果如張嶽、朱靖波、劉群等人合作研究並在2014年EMNLP發表的論文《Syntactic SMT Using a Discriminative Text Generation Model》,論文先分析源語言的句法成分和語義成分,再根據部分翻譯的基本單元生成目標語言,近期類似工作也得到了一定的關注。

毋庸置疑,目前的機器翻譯在對那些任務重複性較大、翻譯難度較低的低端翻譯上已經取得了一定的成績, 但在實現翻譯「信、達、雅」的終極目標上還需時日。 一個可喜的變化是,近年來機器翻譯和人工翻譯兩個領域的合作與交流日趨頻繁,機器翻譯技術目前正處在一個量變到質變的積累時期,下一代的機器翻譯技術也將更多的從模仿人類的學習機制、開展人機協作上開展研究,而且這個質變或許已經為時不遠。

OMT:微信、谷歌翻車小集錦

這種「生詞」處理不當,其實機器翻譯出現問題的一個方面, 前段時間火邊B站的「谷歌翻譯20遍」,恰恰反映了把句子機翻成英文再翻回來之後譯文不一致的情況。以少年閏土為例,原文與翻譯二十遍之後的譯文為:

原文:深藍的天空中掛著一輪金黃的圓月,下面是海邊的沙地,都種著一望無際的碧綠的西瓜。其間有一個十一二歲的少年,項帶銀圈,手捏一柄鋼叉,向一匹猹用力地刺去。那猹卻將身一扭,反從他的胯下逃走了。

譯文:在綠色天空中幾乎到處都是無盡的金色月亮,沙灘上滿是沙子。那時,這個11歲的男孩儘可能地用金屬皮帶系住他的手,並將其放在金屬把手上。叔叔關上身體,逃離叔叔。

......看到這裡,怕是魯迅大叔的棺材板都壓不住了吧!

除了谷歌,【微信翻譯】之前也出現過誤翻情況 , 原因是無法有效應對沒經過訓練的非正式英文詞彙, 不過,現在微信翻譯團隊已經通過添加特殊詞的copy機制初步解決了這個問題。當時的截圖如下:

相關焦點

  • 翻譯公司和翻譯軟體之間的區別有什麼不同呢?
    其實翻譯公司和翻譯軟體並沒有什麼可比性,特別是在不同的翻譯領域當中,最早其實都是人工翻譯的,可是後來隨著計算機的不斷普及,智能翻譯軟體現在越來越多。雖然說現在這些翻譯軟體能夠方便我們日常所需,但是一些專業的文章還是需要通過人去翻譯,因為軟體畢竟缺乏一種邏輯,那麼這裡面的差異究竟有哪些呢。
  • 小語種翻譯人才稀缺 機器翻譯發揮空間較大
    由於機器翻譯具備成本低、翻譯速度快等優點,未來發展前景較好。隨著網際網路大數據的不斷完善,以及經濟全球化,機器翻譯在政治、經濟、文化交流等多方面起到重要作用,因此市場需求持續攀升,行業未來發展潛力巨大。從產業鏈角度來看,機器翻譯上遊為人工智慧晶片、機器翻譯算法以及數據等;中遊為機器翻譯軟體、硬體等產品。
  • 「苟富貴勿相忘」翻譯後,谷歌:沒錢的人總會被遺忘
    其實不管是語種互譯,還是古文翻譯,都是機器翻譯的類別之一。 但是,如果機器翻譯翻車的情況持續發生,我們還能相信它嗎? 先別急,我們從NMT(neural machine translation,神經網絡機器翻譯)的誕生開始講起,看看機器翻譯到底是個什麼東西。
  • 讀了20次「苟富貴勿相忘」後,谷歌翻譯:沒錢的人總會被遺忘
    但是,如果機器翻譯翻車的情況持續發生,我們還能相信它嗎?先別急,我們從NMT(neural machine translation,神經網絡機器翻譯)的誕生開始講起,看看機器翻譯到底是個什麼東西。2013年,Nal Kalchbrenner和Phil Blunsom提出了一種用於機器翻譯的新型端到端編碼器-解碼器結構。
  • 流量小鮮肉的名字被翻譯成了傻蛋,AI翻譯到底靠不靠譜?
    在翻譯方言和專有名詞時,「翻車」機率大不大?昨天,快報記者作了個測評。杭州學院路的頤高數碼廣場2樓有售賣人工智慧翻譯機的攤位,攤位老闆娘介紹,售價499元的飛利浦人工智慧翻譯機可以支持中英文雙譯。「只要你說的普通話和對方說的英語發音都標準,翻譯出來沒問題的。」
  • 親測|Google翻譯內核升級:大型數據集神經機器翻譯加持 稱誤差再降...
    Google使用的神經機器翻譯(GNMT:Google Neural Machine Translation)系統使用了當前最先進的訓練技術,因而提升了機器翻譯水平,將翻譯誤差再降低了55%-85%。Google展示的翻譯模型質量十多年前,Google發布了Google翻譯,早年基於短語的統計機器翻譯,會將輸入句子分解成詞和短語,然後對它們進行獨立翻譯。
  • B站「不靠譜」翻譯大賽:機器翻譯,還遠不能取代人工翻譯
    類似的翻譯問題只能通過閱讀原文來解決。但還有另一類翻譯災難則純屬技術性災難——因為譯者在翻譯過程中,幾乎只是做了辭典的工作,導致翻譯出來的東西既無語感,又沒有語境。我們都期待著有一天,能有最理性的人工智慧翻譯軟體幫助我們解決語言的障礙,從而做到無礙的全球化交流。不過機器翻譯究竟能做到什麼地步,永遠是讓人質疑的。起碼就今天的技術水平來看,機翻幾乎是最不靠譜的選項。
  • 四六級翻譯大型翻車現場 網友:DIY單詞大賽比腦洞時間到了!
    新東方網>英語>英語學習>語法詞彙>詞彙指導>正文四六級翻譯大型翻車現場 網友:DIY單詞大賽比腦洞時間到了! 2019-12-17 09:42 來源:新東方網 作者:HYY      看看網友放飛自我,天馬行空的神翻譯~   1、盛開時open 凋落是close 出淤泥而不染
  • 搜狗翻譯網頁版在線翻譯 搜狗翻譯app有哪些功能
    搜狗翻譯作為國內一款比較受歡迎的翻譯工具,有著不少的用戶人群,與其他的翻譯軟體相比,搜狗翻譯有哪些獨特的功能呢,以下我們來看下搜狗翻譯的幾個特色功能介紹。
  • 怎麼翻譯pdf文檔?可以翻譯pdf的軟體有哪些?
    怎麼翻譯pdf文檔?與外國合作夥伴打交道時,小夥伴們需要翻譯pdf格式文件中文為相應外文。這個時候,大家可以嘗試使用下迅捷PDF轉換器,它可以把pdf簡體中文譯為英文、繁體中文以及日語等。下面有方法步驟,你們可以接著尋找答案哦。
  • 微信翻譯鬧笑話蔡徐坤躺槍,AI翻譯為何總「翻車」?
    網友的評論區重點也是有點跑偏,儼然變成大型「反黑」現場,大量粉絲蜂擁而來表示「搬走」自家愛豆,眾網友則是看熱鬧不嫌事大。機器翻譯的原理可以看作是如下這張圖:其中翻譯機器在正式工作之前可以利用已有的語料庫(Corpora)來進行學習和訓練。所謂的神經網絡機器翻譯就是利用神經網絡來實現上述的黑箱翻譯機器。它的架構如下圖所示:
  • 法語翻譯有哪些翻譯諮詢_譯邦達翻譯品質保證
    法語翻譯有哪些翻譯諮詢,譯邦達翻譯品質保證,北京譯邦達翻譯有限公司成立於2007年,經過12年的快速發展與兼併,我們已成長為一家高效成熟的語言翻譯服務BPO供應商——翻譯質量控制體系和高效智能的快譯點輔助翻譯雲平臺。
  • 2020國際機器翻譯大賽:火山翻譯力奪五項冠軍
    每個參賽系統首先由多名經驗豐富的語言學家進行評估,然後對最終分數進行標準化加權,最後進行排名。整個評估過程歷時四個月,評價結果有非常高的置信度。語言專家評估得分第一 火山翻譯拿下「中文-英語」語向冠軍歷年比賽中,「中文-英語」語向的翻譯任務都是參賽隊伍最多、競爭最為激烈的機器翻譯任務之一,今年更勝往年。
  • 谷歌翻譯功能逆天?小別勝新婚而已,來看中國翻譯軟體實力在哪裡
    抱歉抱歉,這篇文章昨日首發在「虎嗅」時,標題是叫《除了葷段子翻譯傳神,中國翻譯軟體到底能和谷歌競爭什麼?》,很嚴肅專業的感覺有沒有?
  • 語音翻譯軟體有哪些?旅遊達人推薦:錄音轉文字助手APP
    語音翻譯軟體有哪些?很多到國外旅遊的小夥伴們,都有過這樣的尷尬時刻:用餐時,想要一杯飲料,卻只能對服務生擠出一個「WATER」的英文單詞;迷路時,除了依靠工具設備,連與外國人問個路都只能是「雞同鴨講」……想要擺脫這樣的尷尬時刻,可以試試這款旅遊達人推薦的國外旅遊必備手機軟體——「錄音轉文字助手」APP。「錄音轉文字助手」可以完成語音轉文字、文字轉語音與多國語言文本翻譯,還可以利用「語音翻譯」學習外語。
  • 「震撼我媽一整年」——盤點遊戲漢化中的爆笑翻譯錯誤
    在越來越多的海外遊戲被引入中國的過程中,出現了越來越多關於漢化的事故,其中多半是由於過分依賴翻譯軟體和錯誤的亂碼BUG造成的。其中也不乏一些令人啼笑皆非的"翻車"事件,下面就為大家帶來一些近年來著名的翻車實錄。
  • 可以翻譯PPT的軟體有哪些?迅捷PDF轉換器還有這個特色功能!
    可以翻譯PPT的軟體有哪些?說到PPT,大家想到的可能是各種發布會上出現的炫酷演示稿,老師祖傳的教學PPT等等,如果大家想要對PPT進行翻譯,想到的也是通過各種翻譯工具,然後進行複製粘貼。今天小編教大家一個輕鬆翻譯PPT的方法,首先,找到一款能夠進行PPT翻譯的軟體,不是通過複製粘貼操作進行,而是能夠直接導入PPT文件就能進行翻譯的軟體,如果大家不知道該選擇哪款軟體的話,就使用小編強烈推薦的這款「迅捷PDF轉換器」吧。
  • 人人譯視界:針對影視劇字幕組推出「視頻翻譯黑科技」,提高80%翻譯...
    【獵雲網北京】5月30日報導(文/呂夢)從谷歌推出神經網絡機器翻譯(NMT)、搜狗AI進擊、到博鰲同傳機器人,人工智慧在翻譯領域一直在持續不斷的嘗試。與其說我們想看看人工智慧究竟能做到哪一步,不如說是我們想知道人工智慧能對翻譯行業帶來哪些推動性的進步、是否能夠真正提升翻譯效率。
  • Skype翻譯的迷失
    Skype Translator能對超過40種語言的文字聊天進行即時翻譯,但它最大的特色是能進行英語和西班牙語之間的實時口語互譯。(對於軟體計劃整合哪些其他語言以及何時整合其他語言,Skype的所有人微軟公司未發表意見。)和星際迷航中虛構的翻譯器不同的是,Skype Translator旨在模仿作為兩位主發言人之間橋梁的人類口譯員。
  • 成都創客:精通38種語言翻譯 這家翻譯公司卻沒有翻譯員
    譯訊科技成立於2015年,公司專注於智能翻譯。經過前期3年的打磨,公司於2018年推出了一款智能翻譯軟體——雲譯通。數據挖掘、多語言文字識別、自然語言理解、神經網絡機器翻譯、文本分析、知識圖譜等技術,讓翻譯變得更加便捷、高效。