將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」

2020-12-06 機器之心Pro

機器之心

作者:iCombinator

機器翻譯之夢

今天,當我們很自然的拿出手機,選擇一個谷歌、百度或微軟的翻譯 app ,輕而易舉的完成文字翻譯、拍照翻譯和實時語音翻譯時,我們可能不會意識到由於深度學習的出現和數據量的積累,研究數十年的機器翻譯問題已經變得可用並走入了我們的生活,給我們帶來了極大便利。

1954年,計算機科學家第一次公開發布了一款可以翻譯人類語言的機器。後來這被稱為喬治城-IBM實驗:一個能將句子從俄語翻譯成英語的「電子大腦」(electronic brain)。 當時,科學家相信,一旦通用翻譯器被開發出來,不僅可以讓美國在國家安全上領先蘇聯,還能消除語言障礙,從而促進世界和平。 他們還相信,這種進步馬上就要實現了:喬治城語言學專家Leon Dostert與IBM創始人Thomas Watson共同發起了這個項目。他們認為,5年後(甚至不到5年的時間內),人們就可以用電子翻譯器在若干種語言之間進行翻譯。結果,事實證明,這個進步非常緩慢。60多年後,實時的通用翻譯器(如《星球大戰》中的C-3PO和《銀河系漫遊指南》中的巴別魚(Babel Fish))依然只是科幻作品的產物。

但今天,當我們站在此處回顧歷史,我們才發現我們真的已經將科幻變成了現實。

變革性的神經機器翻譯

去年,谷歌提出了GNMT,神經機器翻譯(NMT: Neural Machine Translation)是一種用於自動翻譯的端到端的學習方法,該方法有望克服傳統的基於短語的翻譯系統的缺點。但 NMT 系統的訓練和翻譯推理的計算成本非常高,同時也難以應對罕見詞,這些問題阻礙了 NMT 在實際部署和服務中的應用,因為在實際應用中,準確度和速度都很關鍵。而谷歌的神經機器翻譯提出了帶有 8 個編碼器和 8 個解碼器的深度 LSTM 網絡組成的模型,使用了注意力和殘差連接。為了提升並行性從而降低訓練時間,注意機制將解碼器的底層連接到了編碼器的頂層。在推理計算過程中使用了低精度運算來加速翻譯速度。為改善對罕見詞的處理,谷歌將詞分成常見子詞單元(詞的組件)的一個有限集合,該集合既是輸入也是輸出。這種方法能提供「字符」-delimited models 的靈活性和「詞」-delimited models 的有效性之間的平衡、能自然地處理罕見詞的翻譯、並能最終提升系統的整體準確度。谷歌的波束搜索技術使用了一個長度規範化過程,並使用了一個覆蓋度懲罰,其可以激勵很可能能覆蓋源句子中所有的詞的輸出句子的生成。在 WMT' 14 英語-法語和英語-德語基準上,GNMT 實現了可與當前最佳結果媲美的結果。通過在一個單獨的簡單句子集合的人類對比評估中,它相比於谷歌已經投入生產的基於短語的系統的翻譯誤差平均降低了 60%。

Google Translate 產品負責人 Barak Turovsky 在谷歌舊金山的一次新聞發布會上說:「這一次的進步超過了過去十年積累的總和。」

過去幾年,機器智能的快速發展已經給我們的語音識別和圖像識別能力帶來了巨大的提升,但改進機器翻譯仍然是一個高難度的目標。而隨著眾多公司對神經機器翻譯的研究,我們已經階段性的解決了機器翻譯問題。

神經網絡機器翻譯技術成為人工智慧翻譯主流。該技術通過「端到端」的方法將翻譯平行語料進行映射,以「編碼器—注意力機制—解碼器」的結構來解決翻譯問題。 神經機器翻譯有兩個關鍵技術,一個是 gating,另外還有一個是 attention,這兩個特別適合處理語言中長距離調序,生成的譯文要比傳統的方式生成的譯文流利很多。

我們好像找到了打開人類語言寶庫的鑰匙,眾多公司和機構開始了對神經機器翻譯的研究。

哈佛大學自然語言處理研究組(Harvard NLP)宣布開源了其研發的神經機器翻譯系統 OpenNMT,該系統已經達到生產可用的水平;來自愛丁堡大學、紐約大學等高校的研究人員共同發布的一篇論文提出了新的神經機器翻譯工具箱 Nematus,它在 WMT 和 IWSLT 的機器翻譯任務上取得了頂級表現,也已經被用來訓練產品環境下的系統;在去年的一篇論文《Learning to Translate in Real-time with Neural Machine Translation》中,研究人員說他們「第一次」能夠證明某些算法可以「在同步翻譯上表現得非常好,比以前的基於分割的算法好得多。」從而讓實時翻譯變得更加流暢;谷歌在提出 GNMT 之後,又提出了一種使用單個神經機器翻譯(NMT)模型在多種語言之間進行翻譯的簡潔優雅的解決方案,這不需要對基礎系統的模型架構進行修改,而是在輸入句子的一開始引入了一個人工 token 來確定所需的目標語言。

國內科技公司在這方面的進展也同樣令人興奮,2016年,12 月 21 日,在百度機器翻譯技術開放日上,百度技術委員會聯席主席、自然語言處理部技術負責人吳華博士表示,基於領先的人工智慧、神經網絡以及自然語言處理技術,百度早在一年多以前就率先發布了世界上首個網際網路 NMT 系統,引領機器翻譯進入神經網絡翻譯時代。

去年百度曾在 ACL 會議上發表論文《Multi-Task Learning for Multiple Language Translation》,探討用 NMT 技術解決多語言翻譯及語料稀疏的問題。該論文得到業內研究人員的極大關注,並被 ACL2016 的 NMT Tutorial 列為研究方向。

「我們從 2014 年開始便嘗試做基於神經網絡的翻譯系統,2015 年發布在線翻譯系統的時,BLEU(Bilingual Evaluation Understudy)指標已經比傳統的 SMT(統計機器翻譯)系統高六、七個點。我們同時還開發了離線版本,可以在手機上使用。」吳華在接受機器之心採訪時表示,「當時學術界對於深度學習的翻譯方法到底是否實用還有一番爭論,我們很早就發現基於 Attention 機制的 Seq2Seq 深度學習模型是有用的,經過多次實驗驗證,在很多集合上超過了傳統方法。同時,針對 NMT 本身存在的一些問題,進行了技術攻關,短短 3 個月的時間便完成了開發和上線。當大家還在討論 Attention 機制時,我們已經結合了原有的統計方法上線。可以說,百度翻譯是全球首個網際網路神經網絡翻譯系統。」

百度從 2015年5月發布了基於深度學習的在線翻譯系統,在翻譯模型、解碼算法、大規模語料訓練等方面取得突破性進展,融合統計與深度學習的方法,通過優化的搜索算法,利用優先隊列及候選翻譯表,突破了翻譯速度限制;使用從網際網路獲取的大數據語料訓練,已知的最大規模的訓練深度神經網絡翻譯系統的語料,突破了訓練語料規模限制;這種翻譯方法的最大優勢在於譯文流暢,更加符合語法規範,容易理解。相關論文發表於領域權威會議ACL,AAAI,IJCAI,MTSUMMIT等。

機器翻譯在研究方面取得突破性進展,而如何將其大規模產品化,尤其是在手機這個終端上應用成為眾多科技公司都面臨的問題,而眾多公司也紛紛開始了嘗試。在去年的自然語言處理頂會ACL2016上,有個關於NMT的Tutorials 就提到,未來NMT的一個重要研究方向是手機端的NMT翻譯系統,需要克服模型大小、速度等多個重要問題。

百度在2015年6月在移動端發布了基於深度學習的離線翻譯系統,促進了技術的落地。百度採用模型壓縮技術,將模型規模壓縮70倍以上,手機端可存儲,同時採用動態加載、優化模型解碼等技術,提高解碼速度,使其在手機端流暢運行。

神經機器翻譯的產品化及開放化

這次機器翻譯技術的突破與以往最大的不同就是其變得可用,去年 11 月,谷歌宣布將神經機器翻譯集成到了其網頁版和移動版的翻譯應用之中,這涉及總共八種語言的相互翻譯中,這些語言的母語總人口佔到了世界總人口的三分之一,覆蓋了谷歌翻譯 35% 以上的請求。但谷歌的目標是將神經機器翻譯擴展到所有 103 種語言。近期,谷歌的谷歌翻譯 App 也正式向國內市場開放。

百度也結合OCR技術和語音識別技術,發布了具有豐富實用功能的翻譯 APP ,可以實時的通過攝像頭的取景框來翻譯外文景點指示牌、菜單、說明書和實物等。結合語音技術的會話翻譯,可以幫助實現不同語種的無障礙交流。

機器翻譯技術的突破不僅為我們帶來了生活的便利和效率的提升,還產生了巨大的社會效益。據多篇新聞報導,警察利用百度翻譯救助迷路的俄羅斯友人,公交車售票員利用百度翻譯將丟失的錢包送到了巴基斯坦小夥手中,交警利用百度翻譯與外國友人交流處理交通問題。

而如果要將這些機器翻譯技術的效率和效應發揮到最大化,就需要更加開放。而這也是科技巨頭們努力的方向。

去年11月,谷歌宣布了提供機器學習 API 的公共雲服務 Google Cloud Platform,「能讓任何人都輕鬆地使用我們的機器學習技術」。今天,Google Cloud Platform 也使神經機器翻譯背後的系統向谷歌的企業用戶開放——谷歌提供了 Cloud Translation。微軟和IBM也分別擁有自己的機器翻譯開放平臺Microsoft Cognitive Service - Translator 和 IBM Watson Language Translator。

百度翻譯也提供了開放雲接口服務,為大量中小企業提供翻譯平臺服務,降低了創業創新門檻。目前,有超過1萬個第三方應用接入百度翻譯,例如華為將翻譯服務集成到其Ascend Mate7手機的攝像頭翻譯應用中,帶有翻譯功能的手機被銷往法國、德國等30多個國家和地區;B2B跨境電子商務平臺「敦煌網」使用「百度翻譯」進行跨境貿易,促進了對外貿易的發展。百度翻譯API為企業每年節省的人工翻譯成本折合人民幣高達2億元。同時,百度翻譯從2011年6月開始向網際網路用戶提供免費翻譯服務,日均響應上億次翻譯請求,目前百度翻譯已經支持全球28種熱門語言互譯。

這些都加速了目前最先進的機器翻譯技術的落地,以及為更廣泛的人所用,來改變更多的行業。

據維基百科介紹,人類目前大概有 6000 多種語言。自人類在未建成的「巴別塔」下不歡而散以來,實現全人類之間的順暢交流一直是我們的夢想。基於目前的人工智慧技術發展,在很長一段時間內,雖然機器翻譯還完全取代不了人類,但基於網際網路大數據和先進機器翻譯技術的結合已經突破了原來編輯規則的局限,並在多個場景下解決了用戶的具體需求。目前的機器翻譯讓我們看到了真正實現「巴別塔之夢」的希望。這也是我們機器翻譯讓用戶持續興奮、讓技術公司和研究人員保持動力的最大原因。

相關焦點

  • 機器之心獨家對話百度 NLP:先解決語義理解,再談機器翻譯取代人類
    機器之心原創作者:虞喵喵9 月 28 日,Google 在 Research Blog 中介紹其神經網絡機器翻譯系統(GNMT)進展,譯文質量的大幅提升引發業內極大關注。據稱,在雙語評估者的幫助下,通過對維基百科和新聞網站的例句測定,在多個樣本的翻譯中谷歌神經網絡機器翻譯系統將錯誤降低了 55-85%甚至更多。
  • 重磅| 谷歌大腦養成記:從識別貓到突破性機器翻譯
    選自NYT機器之心編譯谷歌如何使用人工智慧來改進谷歌翻譯等許多谷歌服務?《紐約時報》雜誌今日發布了一篇重磅長篇《The Great A.I. Awakening》全面解讀谷歌利用機器學習重塑自身的戰略。機器之心編譯時進行了適當的刪減。
  • AI 如何成為百度翻譯 DAU 高速增長的引擎?
    在「巴別塔倒下」的日子裡,人類社會一直沒有放棄不同語言之間的翻譯。特別是在 2020 年剛剛過去的這個春天,當人類社會意義需要緊密聯繫在一起的時候,語言翻譯,更是承載著各個國家團結一致、共同抗疫的訴求。也是在剛剛過去的這個季度,百度旗下的翻譯產品百度翻譯獲得眾多關注。
  • 重磅| 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot...
    》,介紹了谷歌的神經機器翻譯系統(GNMT),該系統實現了機器翻譯領域的重大突破,參見報導《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》。Google Translate 產品負責人 Barak Turovsky 在谷歌舊金山的一次新聞發布會上說:「這一次的進步超過了過去十年積累的總和。」谷歌已經將自己的未來定義成了一家人工智慧和機器學習公司——使用這些技術的計算機無需特定的編程就能自己學習執行任務。
  • 深度| 逐層剖析,谷歌機器翻譯突破背後的神經網絡架構是怎樣的?
    選自SMERITY機器之心編譯谷歌神經機器翻譯(GNMT)論文《Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》描述了一種將深度學習融入產品的有趣方法。該論文和架構是不標準的,在很多情況下偏離學術論文中的架構。
  • 機器翻譯七十年:百度領跑神經網絡翻譯時代
    近兩年,神經網絡機器翻譯(Neural Machine Translation, NMT)技術異軍突起,取得了翻譯質量的大幅躍升。12月21日,在百度機器翻譯技術開放日上,百度技術委員會聯席主席、自然語言技術負責人吳華博士表示,基於領先的人工智慧、神經網絡以及自然語言處理技術,百度早在1年多以前就率先發布了世界上首個網際網路NMT系統,引領機器翻譯進入神經網絡翻譯時代。
  • 機器翻譯進化史:用計算機取代同聲傳譯?
    耶和華說:「看哪!他們成為一樣的人民,都是一樣的言語……我們下去,在那裡變亂他們的口音,使他們的言語彼此不通。」是眾人的塔半途而廢,人類也各散東西。《聖經》以巴別塔解釋不同的種族和語言因何存在,如今的人們用這座未能建成的通天高塔象徵語言不通帶來的混亂隔閡。
  • 植入晶片、冷凍復活……這些年超人類主義從科幻變成現實了麼?
    植入晶片、冷凍復活……這些年超人類主義從科幻變成現實了麼? 變成一個超人類最快捷的方式是什麼?被某個特殊的蜘蛛咬上一口。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    最近,谷歌的學者又提出了完全基於注意力的翻譯架構,注意力機制不再是連接編碼器和解碼器的模塊,而是模型的主體,取得了性能上的突破。當然,從工程實踐角度,如今主流的機器翻譯系統,無論是谷歌、臉書還是搜狗,都仍然使用 RNN 編碼器-解碼器結構。編碼器和解碼器都有三層,其中編碼器的第一層為雙向層。與谷歌的 GNMT 雙向八層結構相比這個神經網絡並沒有那麼深,因此在效率上能夠獲得不小的提高。
  • 谷歌開放GNMT教程:如何使用TensorFlow構建自己的神經機器翻譯系統
    選自谷歌機器之心編譯參與:機器之心編輯部近日,谷歌官方在 Github 開放了一份神經機器翻譯教程,該教程從基本概念實現開始,首先搭建了一個簡單的NMT模型,隨後更進一步引進注意力機制和多層 LSTM 加強系統的性能,最後谷歌根據 GNMT 提供了更進一步改進的技巧和細節,這些技巧能令該NMT系統達到極其高的精度。
  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。
  • 百度翻譯閃耀MIT年度科技大會,吳華現場展示百度WiFi翻譯機
    百度受邀作為機器翻譯領域的代表,向全世界展示機器翻譯最新進展。現場,吳華結合百度的具體實踐,介紹了機器翻譯的歷史以及神經網絡機器翻譯取得的巨大進步。吳華表示,世界語言的多樣性使得人類一直存在「巴別塔困境」,而機器翻譯的使命正是運用人工智慧打破人與人之間交流的障礙,這同時也是人工智慧的終極目標之一。
  • ACL 2019 論文:谷歌提出增強神經網絡機器翻譯魯棒性的新方法
    Robust Neural Machine Translation with Doubly Adversarial Inputs近年來,利用 Transformer 模型進行神經機器翻譯(NMT)取得了巨大的成功。
  • 重磅| Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍...
    Dauphin機器之心編譯參與:吳攀、微胖、蔣思源去年穀歌在機器翻譯上取得了連續不斷的突破,谷歌的方法用到了文本處理慣用的循環神經網絡。近日,Facebook 也宣布在神經機器翻譯上取得了重大進展,在超過了去年穀歌研究的水平的同時還實現了顯著的速度提升。而和谷歌的方法不一樣,Facebook 的方法採用了一種完全基於卷積神經網絡的架構。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    機器翻譯作為有效增強全球化信息的能力,通過對文本、圖片、語音、文檔的翻譯,在開拓海外市場、提升客戶體驗、獲取海外洞察、支持公司策略等應用場景下都將為企業賦能。IDC數據顯示,到2021年底,超過70%具有海外業務的中國企業將不同程度的採用機器翻譯,應用場景也將更為豐富。
  • 百度翻譯閃耀MIT年度科技大會 吳華現場展示翻譯機
    其中,百度受邀作為機器翻譯領域的代表,向全世界展示機器翻譯最新進展,無疑是對百度翻譯乃至中國科技競爭力的極大肯定。  現場,吳華結合百度的具體實踐,介紹了機器翻譯的歷史以及神經網絡機器翻譯取得的巨大進步。吳華表示,世界語言的多樣性使得人類一直存在「巴別塔困境」,而機器翻譯的使命正是運用人工智慧打破人與人之間交流的障礙,這同時也是人工智慧的終極目標之一。
  • 百度翻譯八周年 全新版本發布「YOUNG溝通,更多彩」
    從品牌和體驗的升級,到理念和功能的創新,百度翻譯通過一點一滴的努力踐行著最初的願景——打破語言障礙,使人們隨時隨地與世界自由溝通。作為百度翻譯八周年的全新版本,百度翻譯8.0又給用戶帶來了什麼樣的驚喜呢?
  • 谷歌機器翻譯取得顛覆性突破 到底幾分真假?
    ,然後對它們的大部分進行獨立翻譯,而神經機器翻譯則將整個輸入句子視作翻譯的基本單元。所以重大突破並不僅僅是上了深度神經網絡,而是以句子為單元。最近,做機器翻譯的同志們一打開朋友圈,猛然發現好像飯碗沒了,谷歌爸爸大力出奇蹟,提高了機器翻譯87%的水平。結果打開人家原文一看,原來虛驚一場,只是現有工作的整合,一篇完美的工程論文,並沒有新的模型提出。不禁長舒一口氣,呼~飯碗還在。
  • 機器翻譯三大核心技術原理 | AI知識科普
    01機器翻譯和巴別塔的傳說《聖經》中記載了這樣一個故事:人類曾經聯合起來興建能通往天堂的高塔——巴別塔,為了阻止人類的計劃,上帝讓人類說不同的語言,使人類相互之間不能溝通,計劃因此失敗,人類自此各散東西。實現不同語種之間的無障礙溝通,一直都是人類終極夢想之一。
  • BAT、谷歌、Facebook都在搞的神經機器翻譯,真的就地表最強了嗎?
    這期間發生的大事,是以神經網絡作為基礎的機器翻譯,開始在全面超越此前以統計模型為基礎的統計機器翻譯,並快速成為在線翻譯系統的主流標配。在這場革命之後,機器翻譯徹底進入了Neural Machine Translation,即NWT神經機器翻譯時代。很多人為此歡欣鼓舞。