谷歌發布神經機器翻譯,翻譯質量接近筆譯人員

2021-01-20 雷鋒網

據外媒報導，谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中，谷歌翻譯會採用全新的神經機器翻譯機制，而這個App每天要進行一千八百萬次這樣的翻譯。此外，谷歌針對這個神經機器翻譯系統的運作原理，專門發表了一篇學術論文。

早前，谷歌就曾表示過，他們在谷歌翻譯中運用了神經網絡技術，但只限於實時視覺翻譯這個功能。前段時間，谷歌一名叫Jeff Dean的高級員工曾經告訴VentureBeat，谷歌已經在嘗試把越來越多的深度學習功能和機制融入到谷歌翻譯中。除此之外，谷歌的一位發言人在郵件中告訴VentureBeat，最新的神經機器翻譯是他們努力研發深度學習功能和機制的成果。

實際上，谷歌一直以來都在致力於將深度神經網絡融入它旗下越來越多的應用軟體中，其中包括Google Allo和Inbox by Gmail。這個功能可以幫助谷歌更加快捷、更加有效地處理它們獲取到的數據。

谷歌的神經機器翻譯（GNMT）對八層長的短時記憶遞歸神經網絡（LSTM-RNNs）的依賴性很強。「通過層間殘留聯繫可以加強梯度流。」谷歌的科學家在他們發表的學術論文中寫道。在圖像處理器的幫助下，神經網絡一旦變得足夠成熟，谷歌就可以依靠它尚未發布的張量處理單元進行數據處理。

雖然神經機器翻譯並不永遠是最佳之選，但是從谷歌的各種嘗試中我們不難發現，在某些情況下，神經機器翻譯還是有其過人之處的。

「人們對這個翻譯系統的評價顯示，與之前那個基於短語的翻譯系統相比，在翻譯多種語言時，神經學習翻譯系統的錯誤率已經降低了60%左右，其中包括英法互譯，英西互譯以及英漢互譯。附加實驗的結果顯示，翻譯系統的質量將和筆譯人員平均水準更加接近。」

在谷歌昨天發表的一篇博文中，Google Brain Team的研發科學家Quoc Le 和Mike Schuster提到，有了雙語評分員的幫助，在翻譯Wikipedia上的多語種樣句時，谷歌神經機器翻譯的錯誤率實際上已經降低了55%到85%。

儘管如此，這個系統還是不完美的。「神經機器翻譯還是會犯一些筆譯人員永遠都不可能犯的錯誤，比如遺漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯、對文章的語境缺乏整體把控等等。所以，我們還是有很大的進步空間。但不可否認的是，神經機器翻譯真的具有裡程碑意義。」

感興趣的讀者們可以猛戳谷歌論文原文和原博了解詳情哦。

via venturebeat

雷鋒網原創文章，未經授權禁止轉載。詳情見轉載須知。

相關焦點

谷歌正式推出神經翻譯翻譯水平遠超過去十年

用谷歌翻譯常出錯，譬如......完全不懂怎麼會這樣，雖然我大天朝的文字遊戲的確複雜。谷歌的工程師面臨很大的麻煩，畢竟它需要覆蓋100中語言，相互間排列組合能達到上萬種。Google也一直在研究更準確的翻譯方式，最近Google正式啟用「神經網絡機器翻譯系統」。
谷歌神經網絡機器翻譯已支持英語與其他8種語言的互譯

經過10年的發展，谷歌翻譯已成為一個連接世界的重要工具，谷歌翻譯支持的語言已達到了103種。
重磅| 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot...

》，介紹了谷歌的神經機器翻譯系統（GNMT），該系統實現了機器翻譯領域的重大突破，參見報導《重磅 | 谷歌翻譯整合神經網絡：機器翻譯實現顛覆性突破》。這些語言的母語總人口佔到了世界總人口的三分之一，覆蓋了谷歌翻譯 35% 以上的請求。通過這一次更新，谷歌翻譯一次性提升的性能超過了過去十年進步的總和。但這只是一個開始。儘管我們目前在谷歌搜索、谷歌翻譯應用和網站上只有 8 種語言，但我們的目標是將神經機器翻譯擴展到所有 103 種語言，並讓你能隨時隨地都能接入到谷歌翻譯。
機器翻譯七十年:百度領跑神經網絡翻譯時代

近兩年，神經網絡機器翻譯（Neural Machine Translation, NMT）技術異軍突起，取得了翻譯質量的大幅躍升。12月21日，在百度機器翻譯技術開放日上，百度技術委員會聯席主席、自然語言技術負責人吳華博士表示，基於領先的人工智慧、神經網絡以及自然語言處理技術，百度早在1年多以前就率先發布了世界上首個網際網路NMT系統，引領機器翻譯進入神經網絡翻譯時代。
谷歌機器翻譯取得顛覆性突破到底幾分真假?

，然後對它們的大部分進行獨立翻譯，而神經機器翻譯則將整個輸入句子視作翻譯的基本單元。谷歌的論文價值谷歌在本周發布了谷歌翻譯的實現論文Google’s Neural Machine Translation System: Bridging the Gapbetween Human and Machine Translation 這篇論文有非常強的工程性價值，融合了已有機器翻譯的幾大技術 Seq2Seq + Attention + Sentence loss
BAT、谷歌、Facebook都在搞的神經機器翻譯,真的就地表最強了嗎?

這期間發生的大事，是以神經網絡作為基礎的機器翻譯，開始在全面超越此前以統計模型為基礎的統計機器翻譯，並快速成為在線翻譯系統的主流標配。在這場革命之後，機器翻譯徹底進入了Neural Machine Translation，即NWT神經機器翻譯時代。很多人為此歡欣鼓舞。
機器翻譯三大核心技術原理 | AI知識科普

，基於語料庫的方法開始盛行；2003年，愛丁堡大學的Koehn提出短語翻譯模型，使機器翻譯效果顯著提升，推動了工業應用；2005年，David Chang進一步提出了層次短語模型，同時基於語法樹的翻譯模型方面研究也取得了長足的進步；繁榮階段：2013年和14年，牛津大學、谷歌、蒙特婁大學研究人員提出端到端的神經機器翻譯，開創了深度學習翻譯新時代
將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」

哈佛大學自然語言處理研究組（Harvard NLP）宣布開源了其研發的神經機器翻譯系統 OpenNMT，該系統已經達到生產可用的水平；來自愛丁堡大學、紐約大學等高校的研究人員共同發布的一篇論文提出了新的神經機器翻譯工具箱 Nematus，它在 WMT 和 IWSLT 的機器翻譯任務上取得了頂級表現，也已經被用來訓練產品環境下的系統；在去年的一篇論文《Learning to Translate
谷歌翻譯是如何藉助多項新興AI技術提高翻譯質量的

據國外媒體報導，谷歌表示，它已在提高沒有大量書面文本語料的語言的翻譯質量上取得了進展。在一篇即將正式發表的博客文章中，該公司詳細介紹了助力提升谷歌翻譯（Google Translate）所支持的108種語言翻譯質量的新創新技術(特別是缺乏語料數據的約魯巴語和馬拉雅拉姆語)。谷歌翻譯服務平均每天翻譯1500億個單詞。
重磅| 谷歌大腦養成記:從識別貓到突破性機器翻譯

選自NYT機器之心編譯谷歌如何使用人工智慧來改進谷歌翻譯等許多谷歌服務？《紐約時報》雜誌今日發布了一篇重磅長篇《The Great A.I. Awakening》全面解讀谷歌利用機器學習重塑自身的戰略。機器之心編譯時進行了適當的刪減。
深度| 逐層剖析,谷歌機器翻譯突破背後的神經網絡架構是怎樣的?

選自SMERITY機器之心編譯谷歌神經機器翻譯（GNMT）論文《Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》描述了一種將深度學習融入產品的有趣方法。該論文和架構是不標準的，在很多情況下偏離學術論文中的架構。
有道nmt神經網絡_有道神經網絡翻譯(nmt) - CSDN

隨著人工智慧的發展，一改傳統機器翻譯的格局，隨著LSTM、RNN等技術的加入，新時期機器翻譯在翻譯質量上最大的變革就是從PBMT到NMT的轉變，而其中，谷歌神經機器翻譯（GNMT：Google Neural Machine Translation）系統實現了到目前為止機器翻譯質量的最大提升。
搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍

近年來，幾乎所有的研究機構在發表關於機器翻譯新方法的論文時，都會以 WMT 數據集作為實驗數據，並以 BLEU 評分來衡量方法的有效性，給出一個量化的、可比的翻譯質量評估，因此，WMT 數據集已經成為機器翻譯領域公認的主流數據集。
如何評價Google神經機器翻譯(GNMT)系統?

Google最新宣布發布穀歌神經機器翻譯（GNMT：Google Neural Machine Translation）系統，在官方博客中Google稱該系統使用了當前最先進的訓練技術，能夠實現到當下機器翻譯質量上最大的提升。
人工智慧翻譯 OR 人工翻譯?

隨著2018博鰲亞洲論壇，「騰訊同傳」事件引發的熱烈的討論，人工智慧翻譯（或機器翻譯）與人工翻譯未來發展的討論再一次出現在人們面前。其實早在上世紀30年代，就有了機器翻譯語言的想法和實踐。
巨頭扎堆的小市場:不學外語,機器翻譯搞定一切?

隨著人工智慧的發展，一改傳統機器翻譯的格局，隨著LSTM、 RNN等技術的加入，新時期機器翻譯在翻譯質量上最大的變革就是從PBMT到NMT的轉變，而其中，谷歌神經機器翻譯（GNMT：Google Neural Machine Translation）系統實現了到目前為止機器翻譯質量的最大提升。
谷歌推出神經網絡翻譯中譯英水平匹敵真人?

輸入中文，翻譯系統給出的答案往往是「慘不忍睹」，簡單的機械翻譯對於那些谷歌翻譯的依賴者來說已遠遠不夠。谷歌公司稱，相較之前的算法，谷歌神經機器翻譯能減少80%的錯誤，與通過標準測試的真人翻譯所差無幾。在之前的一項西班牙語譯為英語的測試中，設定滿分為6分，谷歌舊的翻譯系統得到3.6分，人類普遍得分為5.1分，而谷歌的新系統得到了5分的好成績。
谷歌開放GNMT教程:如何使用TensorFlow構建自己的神經機器翻譯系統

選自谷歌機器之心編譯參與：機器之心編輯部近日，谷歌官方在 Github 開放了一份神經機器翻譯教程，該教程從基本概念實現開始，首先搭建了一個簡單的NMT模型，隨後更進一步引進注意力機制和多層 LSTM 加強系統的性能，最後谷歌根據 GNMT 提供了更進一步改進的技巧和細節，這些技巧能令該NMT系統達到極其高的精度。
微信翻譯大型翻車現場?機器翻譯到底有哪些不確定性

另一方面，問題可能更多出現在語料庫上，現在業界所做的機器翻譯很大程度上靠語料「懟」，只要平行語料數量足夠多，質量足夠好，其實一般的系統也可以訓練出很好的結果。之前在知乎上就有一個問題詢問微信翻譯團隊如何設置，根據自稱團隊成員」LynnCui「的爆料，微信翻譯是由微信後臺一小撮不到10人的工程師團隊從零折騰出來的引擎完成翻譯的。
網易有道上線神經網絡翻譯質量媲美英語八級

作為目前機器翻譯領域最前沿的技術，神經網絡翻譯採用獨到的神經網絡結構，能夠對翻譯的全過程整體建模；與統計翻譯模型（SMT）相比，神經網絡翻譯模型更像一個有機體。NMT對整個句子進行編碼，能夠更充分地利用上下文信息，判定多義詞的詞義，生成更高質量的譯文。

谷歌發布神經機器翻譯,翻譯質量接近筆譯人員

相關焦點

谷歌正式推出神經翻譯 翻譯水平遠超過去十年

谷歌神經網絡機器翻譯已支持英語與其他8種語言的互譯

重磅| 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot...

機器翻譯七十年:百度領跑神經網絡翻譯時代

谷歌機器翻譯取得顛覆性突破 到底幾分真假?

BAT、谷歌、Facebook都在搞的神經機器翻譯,真的就地表最強了嗎?

機器翻譯三大核心技術原理 | AI知識科普

將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」

谷歌翻譯是如何藉助多項新興AI技術提高翻譯質量的

重磅| 谷歌大腦養成記:從識別貓到突破性機器翻譯

深度| 逐層剖析,谷歌機器翻譯突破背後的神經網絡架構是怎樣的?

有道nmt神經網絡_有道神經網絡翻譯(nmt) - CSDN

搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍

如何評價Google神經機器翻譯(GNMT)系統?

人工智慧翻譯 OR 人工翻譯?

巨頭扎堆的小市場:不學外語,機器翻譯搞定一切?

谷歌推出神經網絡翻譯 中譯英水平匹敵真人?

谷歌開放GNMT教程:如何使用TensorFlow構建自己的神經機器翻譯系統

微信翻譯大型翻車現場?機器翻譯到底有哪些不確定性

網易有道上線神經網絡翻譯質量媲美英語八級

谷歌正式推出神經翻譯翻譯水平遠超過去十年

谷歌機器翻譯取得顛覆性突破到底幾分真假?

谷歌推出神經網絡翻譯中譯英水平匹敵真人?