BAT、谷歌、Facebook都在搞的神經機器翻譯,真的就地表最強了嗎?

2020-12-06 中關村在線

2014年到2016年,機器翻譯領域可以說是翻天覆地。


這期間發生的大事,是以神經網絡作為基礎的機器翻譯,開始在全面超越此前以統計模型為基礎的統計機器翻譯,並快速成為在線翻譯系統的主流標配。


在這場革命之後,機器翻譯徹底進入了Neural Machine Translation,即NWT神經機器翻譯時代。


很多人為此歡欣鼓舞。回想去年,谷歌在中英翻譯系統上部署了GNWT——谷歌神經機器翻譯之後,當時網上有一句廣為流傳的話:「作為翻譯,看到這個新聞的時候,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。」


怎麼樣?是不是感受到了深深的絕望?


但是先讓咱們的小情緒平靜一下。時過一年,市面上的NWT系統越來越多,國內的BAT、搜狗,國外的谷歌、Facebook、微軟等都在布局。雖然翻譯質量確有提高,但遠沒到上述引文中描繪的發生「質變」的程度。這到底是為什麼?


於是,我們選取了目前最有代表性的谷歌GNWT和屢獲大獎的搜狗的SogouNWT,來摸索一下今天神經網絡機器翻譯的真實水平和進化空間。


應用效果測試


考慮到要求連貫性、語句準確的在線翻譯技術,其應用場景無非兩種:一是海外旅遊、購物為代表的實時溝通場景;二是垂直領域的專業內容翻譯(畢竟日常翻譯需求查單詞就夠了),所以這裡選取了一些旅遊用語和專業論文,來檢測一下SogouNMT和GNMT的翻譯實力。


此外,今年6月搜狗在發布翻譯APP時表示SogouNMT的獨門秘籍之一是翻譯古詩詞,所以我們也找來了古詩詞與文言文來折磨兩個「小傢伙」。


首先是來看一句基本的旅遊用語:


英譯漢:What is the possibility of my getting a seat if I wait?

谷歌答案:如果我等待,我可以得到座位的可能性?

搜狗答案:如果我等待的話,我有座位的可能性是多少?

漢譯英:如果我等下去的話有多大機率有座位?

谷歌答案:What is the chance of having a seat if I wait?

搜狗答案:How often do I have a seat if I wait?


從中可以看出,英譯漢的語序調整大體正確,搜狗對漢語的語法理解更準確。但漢譯英卻沒有那麼樂觀,對於表述比較口語化的「機率」,兩個系統都沒有表現出對上下文的理解能力。


我們來找點論文裡的長句子虐一下。


英譯漢:

It seems anachronistic to talk about intertextuality in the beginning of the Twenty First Century, almost forty years since the term first appeared with Julia Kristeva’s introduction of Mikhail Bakhtin to the Western world. 


谷歌答案:

在二十一世紀初談論互文性似乎不合時宜,自從Julia Kristeva將Mikhail Bakhtin引入西方世界以來,已經有四十年了。


搜狗答案:

在二十世紀初開始談論互文性似乎是不合時宜的,近四十年來,從Julia kristeva引進米哈伊爾·巴赫金到西方世界第一次出現。


漢譯英:

自四十年前朱麗婭·克裡斯蒂娃在介紹巴赫金思想時首次將"互文性"概念引進西方世界以來,到21世紀初的今天再針對「互文性」進行討論已經顯得有些不合時宜。


谷歌答案:

Since the introduction of the "intertextuality" concept for the first time in the introduction of Bakhtin's thought forty years ago, the discussion of "intertextuality" at the beginning of the 21st century has become somewhat outdated.


搜狗答案:

Since Julia Christie introduced the concept of " intertextuality" to the western world for the first time 40 years ago, it has become an anachronism to discuss the " intertextuality" in the early 21st century.


從長句子的翻譯上看,中英之間的語序調整還是大問題。而且語序引發的意義差別會影響整個翻譯的結果。另外漢譯英中,谷歌表現稍微好一點,搜狗出現了很嚴重的漏譯。值得肯定的是,二者對專有名詞的翻譯都比較準確,但是人名庫顯然還不夠大。


我們再來一點有意思的,杜甫的《石壕吏》:

暮投石壕村,有吏夜捉人。老翁逾牆走,老婦出門看。 吏呼一何怒!婦啼一何苦!


谷歌翻譯版:

Twilight cast stone trench village, there are officials to catch the night.

The old man went over the wall and the old woman went out to see.

Official call an anger! Women cry one bitter!


搜狗翻譯版:

Twilight lapidation the village, there are officials and night catchers. 

The old man went over the wall and the old woman went out to see.

The guards cried so fiercely  The old lady cried so sad.


參考巴頓·華茲生公認比較權威的譯文:

At evening I put up at Stone Moat Village;
that night an official came to round up people.
The old man at the inn scaled the wall and ran away; the old woman came to open the gate.
The official, how fiercely he shouted!
The old woman, how pitiful her cries!


可以看出谷歌對古詩詞的理解確實不如搜狗,比如婦啼一何苦搜狗翻譯長了「old women」應該是對應上了前文。再比如「夜捉人」變成了「catch the night」似乎不如搜狗的貼邊。當然了,兩邊對於「逾牆走」這類表達都無法準確理解,另外搜狗完全漏了石壕村。


另外還有一種情況,翻譯過程中根據詞的表面意義直翻的現象比較嚴重,並且應該是在算法的加持下強行組成句子。而這種翻譯模式下,漏翻現象會很嚴重。


從以上測試可以得出以下兩個問題:



當然以上只是根據我們的實驗得到的特徵,不一定全面和準確,但似乎確實說明了神經機器翻譯沒有那麼神,甚至有一些技術迭代後出現的新問題。


找鑰匙,搶鑰匙


目前來看,神經網絡機器翻譯未來很長時間都會處在主要位置。並且可能會短時間內不斷突破。而針對上面分析到的問題,有一些解決方案可以作為比較高效的補充,也許這些會成為神經網絡翻譯企業接下來的重點戰場。


這裡探討的是以其他技術力量完善神經網絡機器翻譯的方式,說不定其中某項會成為促進真人翻譯進一步失業的「鑰匙」:


一、引進NMT以外的人工智慧技術:巧合的是,近兩年關於機器翻譯的技術突破往往來自其他人工智慧領域。比如注意力模型,是來自Deepmind在機器視覺領域的技術構想。主動引入其他領域的算法和模型,或許在翻譯領域有神奇的效果。


二、建立機器學習使用的用戶資料庫,激發互動:在機器學習的原理當中,對錯誤樣本糾錯往往是最好的學習途徑,但翻譯上的糾錯行為顯然是企業難以完成的。調動用戶主動糾錯翻譯結果,並以之建立資料庫,或許是非常便捷的辦法。


三、嘗試優質訓練資料下的弱監督學習:目前的NMT體系,歸根結底是個有監督學習過程,很多所謂「莫名其妙」的翻譯結果都來自翻譯機制無法優化。嘗試一些深度學習架構讓翻譯系統自我優化,也許是個解決方案。


四、垂直領域語料資料庫&數據抽調系統:解決具體的專業領域,甚至文言文的中英互譯(當然也包括英文的詩歌和文學文本),其實也沒什麼特別的辦法,擁有強大的垂直領域資料庫是硬實力,當然好的數據抽調模型會事半功倍。


神經網絡機器學習,還是個標準的新生事物。業界願意選擇它只是因為它比此前的方案更優化,也更有發展潛力。絕不是因為它一出手就秒殺眾生,達到了取代人類同行的地步。


翻譯依舊是一個非常安全的工作,至少今天還是。

相關焦點

  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。
  • 重磅| Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍...
    選自code.facebook作者:Jonas Gehring、Michael Auli、David Grangier、Denis Yarats、Yann N. Dauphin機器之心編譯參與:吳攀、微胖、蔣思源去年穀歌在機器翻譯上取得了連續不斷的突破,谷歌的方法用到了文本處理慣用的循環神經網絡。
  • 人工智慧利用神經網絡來控制機器
    人工智慧利用神經網絡來控制機器,或者是人工智慧根據預定的規則來控制機器.人工智慧可以用於搜索,診斷,預測,監控和機器人等諸多方面.人工智慧為人類提供了創造性解決方案,這個解決方案不僅能創造出改變,同時還能控制它們.世界對於人工智慧抱有非常樂觀的態度,因為它們讓人類工作變得更加高效.然而,智能的出現時間還很短暫,遠沒有到大眾普遍接受的階段.那麼,人工智慧未來的發展方向到底是什麼
  • 重磅| 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot...
    》,介紹了谷歌的神經機器翻譯系統(GNMT),該系統實現了機器翻譯領域的重大突破,參見報導《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》。這家搜索巨頭表示現在已經將神經機器翻譯(neural machine translation)集成到了其網頁版和移動版的翻譯應用之中,這意味著它可以一次性翻譯一整段句子,而不只是像之前一樣只能一個詞一個詞地翻譯。谷歌在其產品博客中表示,其產品的翻譯結果現在變得更加自然,能夠實現更好的句法和語法。
  • 谷歌神經網絡機器翻譯已支持英語與其他8種語言的互譯
    經過10年的發展, 谷歌翻譯已成為一個連接世界的重要工具,谷歌翻譯支持的語言已達到了103種。
  • 谷歌機器翻譯取得顛覆性突破 到底幾分真假?
    ,然後對它們的大部分進行獨立翻譯,而神經機器翻譯則將整個輸入句子視作翻譯的基本單元。所以重大突破並不僅僅是上了深度神經網絡,而是以句子為單元。最近,做機器翻譯的同志們一打開朋友圈,猛然發現好像飯碗沒了,谷歌爸爸大力出奇蹟,提高了機器翻譯87%的水平。結果打開人家原文一看,原來虛驚一場,只是現有工作的整合,一篇完美的工程論文,並沒有新的模型提出。不禁長舒一口氣,呼~飯碗還在。
  • 將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」
    變革性的神經機器翻譯去年,谷歌提出了GNMT,神經機器翻譯(NMT: Neural Machine Translation)是一種用於自動翻譯的端到端的學習方法,該方法有望克服傳統的基於短語的翻譯系統的缺點。但 NMT 系統的訓練和翻譯推理的計算成本非常高,同時也難以應對罕見詞,這些問題阻礙了 NMT 在實際部署和服務中的應用,因為在實際應用中,準確度和速度都很關鍵。
  • 深度| 逐層剖析,谷歌機器翻譯突破背後的神經網絡架構是怎樣的?
    選自SMERITY機器之心編譯谷歌神經機器翻譯(GNMT)論文《Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》描述了一種將深度學習融入產品的有趣方法。該論文和架構是不標準的,在很多情況下偏離學術論文中的架構。
  • 谷歌正式推出神經翻譯 翻譯水平遠超過去十年
    用谷歌翻譯常出錯,譬如......完全不懂怎麼會這樣,雖然我大天朝的文字遊戲的確複雜。 谷歌的工程師面臨很大的麻煩,畢竟它需要覆蓋100中語言,相互間排列組合能達到上萬種。Google也一直在研究更準確的翻譯方式,最近Google正式啟用「神經網絡機器翻譯系統」。
  • 重磅| 谷歌大腦養成記:從識別貓到突破性機器翻譯
    選自NYT機器之心編譯谷歌如何使用人工智慧來改進谷歌翻譯等許多谷歌服務?《紐約時報》雜誌今日發布了一篇重磅長篇《The Great A.I. Awakening》全面解讀谷歌利用機器學習重塑自身的戰略。機器之心編譯時進行了適當的刪減。
  • 有道nmt神經網絡_有道神經網絡翻譯(nmt) - CSDN
    理論上講,對於那些要想出國旅遊的人來說,這未嘗不是一件好事,因為有了它們就不需要擔心因為語言不通而造成的囧途尷尬了,從心理學的角度上來講,智能翻譯的出現帶來的是身處異國他鄉也能感受到的安全感。但是,翻譯機真的能解決很多人英語不夠用的困境嗎?面對商業應用,針對需要大量專業術語的國際會議,這些智能的機器翻譯是否還會奏效?
  • 谷歌推出神經網絡翻譯 中譯英水平匹敵真人?
    輸入中文,翻譯系統給出的答案往往是「慘不忍睹」,簡單的機械翻譯對於那些谷歌翻譯的依賴者來說已遠遠不夠。谷歌公司稱,相較之前的算法,谷歌神經機器翻譯能減少80%的錯誤,與通過標準測試的真人翻譯所差無幾。 在之前的一項西班牙語譯為英語的測試中,設定滿分為6分,谷歌舊的翻譯系統得到3.6分,人類普遍得分為5.1分,而谷歌的新系統得到了5分的好成績。
  • 巨頭扎堆的小市場:不學外語,機器翻譯搞定一切?
    理論上講,對於那些要想出國旅遊的人來說,這未嘗不是一件好事,因為有了它們就不需要擔心因為語言不通而造成的囧途尷尬了,從心理學的角度上來講,智能翻譯的出現帶來的是身處異國他鄉也能感受到的安全感。但是,翻譯機真的能解決很多人英語不夠用的困境嗎?面對商業應用,針對需要大量專業術語的國際會議,這些智能的機器翻譯是否還會奏效?
  • 如何評價Google神經機器翻譯(GNMT)系統?
    Google最新宣布發布穀歌神經機器翻譯聽上去十分令人激動,不是嗎?有從事翻譯職業的網友甚至這樣形容:作為翻譯,看到這個新聞的時候,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。真有這麼可怕嗎?讓我們先來回顧下Google Translate的發展歷程。
  • 谷歌開放GNMT教程:如何使用TensorFlow構建自己的神經機器翻譯系統
    選自谷歌機器之心編譯參與:機器之心編輯部近日,谷歌官方在 Github 開放了一份神經機器翻譯教程,該教程從基本概念實現開始,首先搭建了一個簡單的NMT模型,隨後更進一步引進注意力機制和多層 LSTM 加強系統的性能,最後谷歌根據 GNMT 提供了更進一步改進的技巧和細節,這些技巧能令該NMT系統達到極其高的精度。
  • 機器翻譯七十年:百度領跑神經網絡翻譯時代
    TechWeb報導 機器翻譯距今已有70年的發展歷史。自上世紀40年代起,基於規則、實例以及統計的機器翻譯方法漸次登場,各領風騷。
  • ACL 2019 論文:谷歌提出增強神經網絡機器翻譯魯棒性的新方法
    儘管近年來利用 Transformer 模型進行神經機器翻譯(NMT)取得了巨大成功,但是 NMT 模型對輸入的微小幹擾仍然很敏感,從而導致各種不同的錯誤。Robust Neural Machine Translation with Doubly Adversarial Inputs近年來,利用 Transformer 模型進行神經機器翻譯(NMT)取得了巨大的成功。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    Sogou NMT 的模型主體採用了業界主流的神經機器翻譯模型:基於循環神經網絡(recurrent neural network, RNN)的多層編碼器-解碼器(encoder-decoder)結構,並帶有注意力(attention)模塊。
  • Transformer新型神經網絡在機器翻譯中的應用|公開課筆記
    大家可以看到我PPT下面的幾個 LOGO,我們翻譯團隊是屬於阿里巴巴機器智能技術實驗室,中間是阿里翻譯的 Logo和我們的口號「Translate and Beyond」。這次分享的題目是「Transformer新型神經網絡在機器翻譯中的應用」。
  • 神經結構搜索在機器翻譯中的應用
    ,研究方向包括神經網絡結構搜索、機器翻譯。    今天和大家介紹谷歌將結構搜索應用到機器翻譯的一項工作—The evolved transformer(ET)[1]。The evolved transformer 這項工作的出發點是將結構搜索應用到機器翻譯中,基於Transformer結構選出更好的候選。