【重磅】谷歌發布 Zero-Shot 神經機器翻譯系統:AI 巴別塔有望成真(附論文)

2021-02-15 新智元


來源: Google Research

作者:Mike Schuster (Google Brain), Melvin Johnson (Google Translate) and Nikhil Thorat (Google Brain )

編譯:李靜怡

新智元啟動新一輪大招聘:COO、執行總編、主編、高級編譯、主筆、運營總監、客戶經理、諮詢總監、行政助理等 9 大崗位全面開放。 

簡歷投遞:jobs@aiera.com.cn

HR 微信:13552313024

新智元為COO和執行總編提供最高超百萬的年薪激勵;為骨幹員工提供最完整的培訓體系、高於業界平均水平的工資和獎金。

加盟新智元,與人工智慧業界領袖攜手改變世界。

【新智元導讀】谷歌今日更新博客,介紹了谷歌神經機器翻譯系統重大更新,實現了用單一模型對多語種通用表徵。這種新的模型體積不僅與多語言翻譯模型一樣,參數相同,而且速度更快、質量更高。不僅如此,系統還實現「零數據翻譯」,也即能夠在從來沒有見過的語言之間進行翻譯。這意味著傳說中的「巴別塔」有望成真。【進入新智元公眾號,在對話框輸入「1123」下載論文】

(文/Mike Schuster,Melvin Johnson,Nikhil Thorat)過去10年中,谷歌翻譯已從僅支持幾種語言發展到了支持 103 種,每天翻譯超過了 1400 億字。為了實現這一點,我們需要構建和維護許多不同的系統,以便在任何兩種語言之間進行轉換,由此產生了巨大的計算成本。神經網絡改革了許多領域,我們確信可以進一步提高翻譯質量,但這樣做意味著重新思考谷歌翻譯背後的技術。

今年 9 月,谷歌翻譯改為啟用谷歌神經機器翻譯(GNMT)的新系統,這是一個端到端的學習框架,可以從數百萬個示例中學習,並在翻譯質量方面有顯著提升。不過,雖然啟用 GNMT 的幾種語言翻譯質量得到了提升,但將其擴展到所有 103 種穀歌翻譯支持的語種,卻是一個重大的挑戰。

實現零數據翻譯(Zero-Shot Translation)

在論文《谷歌多語言神經機器翻譯系統:實現零數據翻譯》(Google’s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation)中,我們通過擴展以前的 GNMT 系統解決這一挑戰,使單個系統能夠在多種語言之間進行翻譯。我們提出的架構不需要改變基本的 GNMT 系統,而是在輸入句子的開頭使用附加的「token」,指定系統將要翻譯的目標語言。除了提高翻譯質量,我們的方法還實現了「Zero-Shot Translation」,也即在沒有先驗數據的情況下,讓系統對從未見過的語言進行翻譯。

下圖展示了最新 GNMT 的工作原理。假設我們使用日語和英語以及韓語和英語之間相互翻譯為例,訓練一個多語言系統,如動畫中藍色實線所示。這個新的多語言系統與單個 GNMT 系統大小一樣,參數也一樣,能夠在日英和韓英這兩組語言對中進行雙語翻譯。參數共享使系統能夠將「翻譯知識」(translation knowledge)從一個語言對遷移到其他語言對。這種遷移學習和在多種語言之間進行翻譯的需要,迫使系統更好地利用其建模能力。


由此,我們想到:能夠讓系統在從未見過的語言對之間進行翻譯嗎?例如韓語和日語之間的翻譯,系統並沒有接受過日韓之間翻譯的訓練。但答案是肯定的——雖然從來沒有教過它但,新的系統確實能夠生成日韓兩種語言之間合理的翻譯。我們將其稱為「零數據」(zero-shot)翻譯,如動畫中的黃色虛線所示。據我們所知,這還是首次將這種類型的遷移學習應用機器翻譯中。

零數據翻譯的成功帶來了另一個重要的問題:系統是否學會了一種通用的表徵,其中不同語言中具有相同意義的句子都以類似的方式表示,也即所謂的「國際通用語」(interlingua)?使用內部網絡數據的三維表徵,我們能夠看見系統在翻譯日語、韓語和英語這幾種語言時,在各種可能的語言對之間進行轉換(比如日語到韓語、韓語到英語、英語到日語等等)時,內部發生的情況。

上圖中的(a)部分顯示了這些翻譯的總體幾何構成。圖中不同顏色的點代表不同的意思;意思相同的一句話,從英語翻譯為韓語,與從日語翻譯為英語的顏色相同。我們可以從上圖中看到不同顏色的點各自形成的集合(group)。(b)部分是這些點集的其中一個放大後的結果,(c)部分則由原語言的顏色所示。在單個點集中,我們能夠看到日韓英三種語言中,擁有相同含義的句子聚在一起。這意味著網絡必定是對句子的語義進行編碼,而不是簡單地記住短語到短語之間的翻譯。由此,我們認為這代表了網絡中存在了一種國際通用語(interlingua)。

我們在論文中還寫下了更多的結果和分析,希望這些的發現不僅能夠幫助從事機器學習或機器翻譯的研究人員,還能對於語言學家和對使用單一系統處理多語言感興趣的人有用。

最後,上述多語言谷歌神經機器翻譯系統(Multilingual Google Neural Machine Translation)從今天開始將陸續為所有谷歌翻譯用戶提供服務。當前的多語言系統能夠在最近推出的16個語言對中的 10 對中進行轉化,提高了翻譯質量,並且簡化了生產架構。

正如前文所說,今年 9 月,谷歌宣布對部分語種啟用谷歌神經機器翻譯(GNMT)的新系統,並在幾種率先使用的測試語種(包括漢語)翻譯質量方面得到了顯著提升。下面的動圖展示了 GNMT 進行漢英翻譯的過程。首先,網絡將漢字(輸入)編碼成一串向量,每個向量代表了當前讀到它那裡的意思(即 e3 代表「知識就是」,e5 代表「知識就是力量」)。整句話讀完之後開始解碼,每次生成一個作為輸出的英語單詞(解碼器)。



要每一步生成一個翻譯好的英語單詞,解碼器需要注意被編碼中文向量的加權分布中,與生成英語單詞關係最為密切的那個(上圖中解碼器 d 上面多條透明藍線中顏色最深的那條),解碼器關注越多,藍色越深。

使用人類對比評分指標,GNMT 系統生成的翻譯相比此前有了大幅提高。在幾種重要語言中,GNMT 將翻譯錯誤降低了 55%-58%。

不過,當時也有很多研究人員認為,當時谷歌翻譯取得的「裡程碑」,與其說是技術突破,不如說是工程上的勝利——大規模部署本身確實需要軟硬體方面超強的實力,尤其是想谷歌翻譯這樣支持 1 萬多種語言的商業應用,對速度和質量的要求都非常的高。但是,神經機器翻譯的技術早已存在,借鑑了語言和圖像處理方面的靈感,是多種技術的整合。

現在,只用了大約 2 個月的時間(論文首次上傳到 arXiv 是 11 月 14 日),谷歌翻譯和谷歌大腦團隊就實現了技術上的突破——讓系統在從未見過的語言對之間進行翻譯,也即所謂的「zero-shot translation」。

不僅如此,谷歌研究人員還在論文最後做了分析,新的模型代表了實現一種「國際通用語」模型的可能。有評論稱,這可以說是實現「巴別塔」的第一步。


就在幾天前,國外研究員 Smerity 在他的博客上發布了一篇分析谷歌神經機器翻譯(GNMT)架構的文章,在 HackerNews、Reddit 等網站都引發了很多討論。

Smerity 在博文中指出,GNMT 的架構並不標準,而且在很多情況下偏離主流學術論文中提出的架構。但是,根據谷歌特定的需求,谷歌修改了系統,重點保證系統的實用性而並非追求頂尖結果。

【論文】谷歌的多語言神經機器翻譯系統:實現 zero-shot 翻譯


摘要

我們提出了一種使用單一神經機器翻譯(NMT)模型,在多語種之間進行翻譯簡潔而優雅的解決方案。不需要修改谷歌現有的基礎系統模型架構,而是在輸入句子的前面加入人工 標記(token)明確其要翻譯成的目標語言。模型的其他部分(包括編碼器、解碼器和注意模型)保持不變,而且可以在所有語言上共享。使用一個共享的 wordpiece vocabulary,這種方法能夠使用單一模型實現多語種神經機器翻譯,而不需要增加參數,相比此前提出的方法更為簡單。實驗表明,這種新的方法大部分時候能提升所有相關語言對的翻譯質量,同時保持總的模型參數恆定。

在 WMT' 14 基準上,單一多語言模型在英法雙語翻譯上實現了與當前最好技術相同的結果,並在英德雙語翻譯上超越當前最佳的結果。同時,單一多語言模型分別在 WMT'14 和 WMT'15 基準上,超越了當前最佳的法英和德英翻譯結果。在用於生產的語料庫上,多達 12 個語言對的多語言模型能夠實現比許多單獨的語言對更好的表現。

除了提升該模型訓練所用的語言對的翻譯質量之外,新的模型還能在訓練過程中將沒有見過的語言對相互聯繫起來(bridging),表明用於神經翻譯的遷移學習和零數據翻譯是可能的。最後,我們分析了最新模型對通用語言間表徵的跡象,還展示了一些混合語言時會出現的有趣案例。


【進入新智元公眾號,在對話框輸入「1123」下載論文】

編譯來源:

https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html

http://smerity.com/articles/2016/google_nmt_arch.html?

新智元招聘

職位  運營總監

職位年薪:36- 50萬(工資+獎金)

工作地點:北京-海澱區

所屬部門:運營部

匯報對象:COO

下屬人數:2人

年齡要求:25 歲 至 35 歲

性別要求:不限

工作年限:3 年以上

語  言:英語6級(海外留學背景優先)

職位描述

負責大型會展贊助商及參展商拓展、挖掘潛在客戶等工作,人工智慧及機器人產業方向

擅長開拓市場,並與潛在客戶建立良好的人際關係

深度了解人工智慧及機器人產業及相關市場狀況,隨時掌握市場動態 

主動協調部門之間項目合作,組織好跨部門間的合作,具備良好的影響力

帶領團隊完成營業額目標,並監控管理項目狀況

負責公司平臺運營方面的戰略計劃、合作計劃的制定與實施

崗位要求

大學本科以上學歷,碩士優先,要求有較高英語溝通能力

3年以上商務拓展經驗,有團隊管理經驗,熟悉商務部門整體管理工作

對傳統全案公關、傳統整合傳播整體方案、策略性整體方案有深邃見解

具有敏銳的市場洞察力和精確的客戶分析能力、較強的團隊統籌管理能力

具備優秀的時間管理、抗壓能力和多任務規劃統籌執行能力

有廣泛的TMT領域人脈資源、有甲方市場部工作經驗優先考慮

有媒體廣告部、市場部,top20公關公司市場拓展部經驗者優先

新智元歡迎有志之士前來面試,更多招聘崗位請訪問新智元公眾號。

相關焦點

  • 谷歌發布 Zero-Shot 神經機器翻譯系統:AI 巴別塔有望成真
    實現零數據翻譯(Zero-Shot Translation)在論文《谷歌多語言神經機器翻譯系統:實現零數據翻譯》(Google’s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation)中,我們通過擴展以前的 GNMT 系統解決這一挑戰,使單個系統能夠在多種語言之間進行翻譯。
  • 重磅 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot翻譯(附論文)
    the Gap between Human and Machine Translation》,介紹了谷歌的神經機器翻譯系統(GNMT),該系統實現了機器翻譯領域的重大突破,參見報導《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》。
  • 谷歌神經機器翻譯系統 Zero-Shot 正式上線
    今年九月,谷歌發表聲明,基於神經機器翻譯的谷歌翻譯全新上線。(GNMT,Google Neural Machine Translation)。神經機器翻譯是端到端的學習架構,它能從數百萬的實例中學習,提供大幅提升的翻譯效果。雖然功能得到了改善,但是讓谷歌翻譯把當下支持的 103 種語言全部採用神經機器翻譯技術,卻是一項巨大的挑戰。
  • 谷歌神經機器翻譯系統Zero-Shot正式上線
    為了做到這一點,在任意兩種語言之間,谷歌翻譯都要運行多個翻譯系統,這帶來巨大的計算成本。如今,許多領域都正在被神經網絡技術顛覆。谷歌確信他們可以利用神經網絡進一步提升翻譯質量。這要求谷歌重新思考谷歌翻譯的算法架構。今年九月,谷歌發表聲明,基於神經機器翻譯的谷歌翻譯全新上線。(GNMT,Google Neural Machine Translation)。
  • 【專知薈萃14】機器翻譯 Machine Translation知識資料全集(入門/進階/綜述/視頻/代碼/專家,附PDF下載)
    歡迎大家分享轉發~入門學習CIPS青工委學術專欄第9期 | 神經機器翻譯 http://www.cipsc.org.cn/qngw/?p=953基於深度學習的機器翻譯研究進展 http://www.caai.cn/index.php?
  • 重磅 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破(附論文)
    Human and Machine Translation》介紹谷歌的神經機器翻譯系統(GNMT),當日機器之心就對該論文進行了摘要翻譯並推薦到網站(www.jiqizhixin.com)上。今日,谷歌 Research Blog 發布文章對該研究進行了介紹,還宣布將 GNMT 投入到了非常困難的漢語-英語語言對的翻譯生產中,引起了業內的極大的關注。十年前,我們發布了 Google Translate(谷歌翻譯),這項服務背後的核心算法是基於短語的機器翻譯(PBMT:Phrase-Based Machine Translation)。
  • 【乾貨】神經機器翻譯全流程解析,one-shot 和 zero-shot 學習成亮點
    曾經有人好奇,是否自然地認為翻譯問題應該是一種密碼學問題。被譽為機器翻譯之父的Warren Weaver,曾說過:「This is really written in English, but it has been coded in some strange symbols. I will now proceed to decode. 」。
  • 谷歌翻譯竟預言世界末日,專家解密神經翻譯6大難題
    這段驚悚的「預言」來自谷歌翻譯。2016年,谷歌宣布機器翻譯「重大突破」——神經機器翻譯(GNMT),將翻譯質量提高到接近人類筆譯的水平。然而,它將無意義的文本翻譯成怪異的宗教預言引起了新的恐慌。這次,要怪AI是「黑盒」,還是拖出谷歌員工來背鍋?
  • 【論文推薦】最新十篇機器翻譯相關論文—自適應機器翻譯綜述、結構化預測、雙向神經機器翻譯、圖編解碼模型、英日機器翻、上下文感知
    【導讀】專知內容組既昨天推出九篇機器翻譯(Machine Translation)相關論文,今天又推出最新十篇機器翻譯相關論文,歡迎查看!
  • 重磅 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破,正確率最高87%(附論文)
    》介紹谷歌的神經機器翻譯系統(GNMT),以下是翻譯內容。今天,我們宣布發布穀歌神經機器翻譯(GNMT:Google Neural Machine Translation)系統,該系統使用了當前最先進的訓練技術,能夠實現到目前為止機器翻譯質量的最大提升。
  • 熱點 谷歌用神經機器系統把漢語翻譯成英語 錯誤率最高下降85%
  • ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文
    論文連結:https://www.aclweb.org/anthology/P19-1426神經機器翻譯(NMT)是根據上下文單詞來預測下一個詞的一種方式,並按順序生成目標詞。質量評估(Quality estimation, QE)是機器翻譯中缺失的一個部分:它的目標是在不訪問參考譯文的情況下評估翻譯系統的質量。
  • 覆蓋40種語言:谷歌發布多語言、多任務NLP新基準XTREME
    近日,來自 CMU、谷歌研究院和 DeepMind 的科學家們提出了覆蓋四十種語言的大規模多語言多任務基準 XTREME,希望一舉解決這個問題。自然語言處理(NLP)所面臨的其中一個關鍵性挑戰是,構建的系統不僅要在英文中 work,而且要在世界範圍內約 6900 種語言中也 work。
  • Facebook上的機器翻譯也全面擁抱神經網絡了
    量子位立即去測試了一下,效果……還算能看懂:谷歌、微軟和Facebook開發神經機器翻譯技術已有一段時間,這些公司同時也在拋棄老式基於短語的統計機器翻譯技術。相對基於短語的方法,基於神經網絡的方法更有前景,而最重要的是這種方法能帶來更準確的結果。
  • 教程 | 如何為神經機器翻譯配置編碼器-解碼器模型?
    用於神經機器翻譯的編碼器-解碼器模型 具有編碼器-解碼器架構的循環神經網絡已經超越了傳統的基於短語的統計機器翻譯系統,實現了當前最佳的結果。 給個證據,谷歌在 2016 年發表了論文《Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》,參閱機器之心文章《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》;該論文稱谷歌現在已經將這種技術用在了他們的谷歌翻譯服務中
  • 如何評價OpenAI最新的工作CLIP:連接文本和圖像,zero shot效果堪比ResNet50?
    如果要對比這個方法和傳統圖像分類方法,那麼優缺點都是比較明顯的:最後再說一些擴展的觀點:1.千萬不要被它zero-shot的能力嚇到,這不是真正的zero-shot!作者:劉一凡https://www.zhihu.com/question/438649654/answer/16762822721.首先是最大的VIT-L/14的zero-shot的精度到了76.2,也就是提問裡的「zero shot效果堪比ResNet50」,VIT-L/14的參數量大概是ResNet50的幾十倍了。
  • 從AI到機器翻譯 ,百度、谷歌「宿敵」較量終究繞不過
    直到人工智慧技術的出現,機器翻譯的變革時代終於開啟。2016年9月,谷歌宣布此前開發的神經網絡機器翻譯系統(GNMT:Google Neural Machine Translation),正式被應用到谷歌翻譯中。據了解,區別於傳統的基於短語的翻譯(PBMT),GNMT選取了更廣泛的文本樣本來幫助得出最準確的翻譯結果,人工智慧的運用則讓機器翻譯更符合人類的思維模式和語法結構。
  • 專訪 搜狗+NMT+團隊:神經機器翻譯將消除跨語言溝通障礙
    搜狗搜索技術負責人許靜芳、搜狗搜索機器翻譯負責人翟飛飛、清華計算機系副教授劉洋,就「搜狗神經機器翻譯」的優勢、團隊組建和技術拓展等問題,展開了深度的分享。許靜芳:首先,對翻譯問題的理解、重視和投入問題,在不同的公司不同的階段是有差異的。其次,聚焦在技術上面,NMT 從發展到應用在商業系統裡也就這一、兩年左右的事情,本身這個技術正處在非常快速的迭代的過程中。如果現在要去比較我們(搜狗)和百度、谷歌的差異,我們自己本身在翻譯的模型,語料的挖掘,特別是深度學習模型很大,用的語料很多。
  • Google工程師:谷歌翻譯在幾個月內效果明顯提升的秘訣
    AI 前線導讀:相信經常使用谷歌翻譯的讀者已經發現了,今年穀歌翻譯的水平可以說實現了質的飛躍。從以前一句話都翻譯的亂七八糟,到現在幾百詞甚至上千詞的長段落可以通順翻譯,谷歌翻譯到底經歷了什麼?在谷歌任職的工程師來為你解答。
  • 翻譯界大突破,Google翻譯開始採用人工智慧!
    Google 表示:「與之前採用的算法相比,Google 神經機器翻譯系統(GNMT) 能降低80% 的翻譯錯誤率,並且十分接近人類譯員的翻譯水平。  數據聽起來炫酷,但最後翻譯的效果並不會像外界想像的那麼有突破。  從今天開始,Google Translate 將採用和以往不同的方法 —— Google 神經機器翻譯系統(GNMT)來進行雙語翻譯。