谷歌發布神經機器翻譯:翻譯質量接近筆譯人員

2020-12-25 IT之家

據外媒報導,谷歌於昨日發布了網頁版和移動版的谷歌翻譯。在漢譯英的過程中,會採用全新的神經機器翻譯,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個翻譯系統的運作原理,發表了一篇學術論文。

早前,谷歌就曾表示它們在谷歌翻譯中運用了神經網絡技術,但只限於實時視覺翻譯這個功能。前段時間,谷歌的高級員工Jeff Dean曾告訴VentureBeat,谷歌已經在嘗試把越來越多的深度學習功能融入到谷歌翻譯中。除此之外,谷歌的一位發言人在郵件中告訴VentureBeat,最新的神經機器翻譯是他們努力研發深度學習功能的成果。

實際上,谷歌一直以來都在致力於將深度神經網絡融入它旗下越來越多的應用軟體中,其中包括Google Allo和Inbox by Gmail。這個功能可以幫助谷歌更快捷、更有效地處理它們的數據。

谷歌的神經機器翻譯(GNMT)對八層長的短時記憶遞歸神經網絡(LSTM-RNNs)依賴性很強。「通過層間殘留聯繫可以加強梯度流。」谷歌科學家在論文中寫道。在圖像處理器的幫助下,神經網絡一旦變得足夠成熟,谷歌就可以靠它尚未發布的張量處理單元進行數據處理。

雖然神經機器翻譯並不永遠是最佳之選,但是谷歌的各種嘗試顯示,在某些情況下它還是有過人之處的。

「人們對這個翻譯系統的評價顯示,比起之前基於短語的翻譯系統,在翻譯多種語言時,神經學習翻譯系統的錯誤率已經降低了60%,其中包括英法互譯,英西互譯以及英漢互譯。附加實驗的結果顯示,翻譯系統的質量將和筆譯人員平均水準更加接近。」

在昨天發表的一篇博文中,Google Brain Team的研發科學家Quoc Le和Mike Schuster提到,有了雙語評分員的幫助,在翻譯Wikipedia上的多語種樣句時,谷歌神經機器翻譯的錯誤率實際上已經降低了55%到85%。

儘管如此,這個系統還是不完美的。「神經機器翻譯還是會犯一些筆譯人員永遠都不可能犯的錯誤,比如漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯、對文章語境缺乏整體把控等等。所以,我們還是有很大的進步空間。但不可否認的是,神經機器翻譯具有裡程碑意義。」

相關焦點

  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。早前,谷歌就曾表示過,他們在谷歌翻譯中運用了神經網絡技術,但只限於實時視覺翻譯這個功能。前段時間,谷歌一名叫Jeff Dean的高級員工曾經告訴VentureBeat,谷歌已經在嘗試把越來越多的深度學習功能和機制融入到谷歌翻譯中。
  • 翻譯界的重大突破——谷歌翻譯整合神經網絡,翻譯質量接近人工筆譯...
    System: Bridging the Gap between Human and Machine Translation》介紹谷歌的神經機器翻譯系統(GNMT),當日機器之心就對該論文進行了摘要翻譯並推薦到網站(www.jiqizhixin.com)上。
  • 谷歌正式推出神經翻譯 翻譯水平遠超過去十年
    用谷歌翻譯常出錯,譬如......完全不懂怎麼會這樣,雖然我大天朝的文字遊戲的確複雜。 谷歌的工程師面臨很大的麻煩,畢竟它需要覆蓋100中語言,相互間排列組合能達到上萬種。Google也一直在研究更準確的翻譯方式,最近Google正式啟用「神經網絡機器翻譯系統」。
  • 谷歌翻譯高勤:神經網絡技術將主導機器翻譯的未來
    谷歌翻譯研發科學家高勤  中國網科技7月11日訊 谷歌翻譯研發科學家高勤在今天舉行的中國網際網路大會上介紹稱,谷歌翻譯在神經網絡機器翻譯技術上已經取得重要進展,並同時對機器翻譯技術在未來當中實際應用。他表示:「神經網絡機器翻譯和非專業人工翻譯已經相當接近,對於中英文互譯也取得最大提升。」  高勤在大會上稱,神經網絡翻譯技術與傳統翻譯技術有很大不同。傳統機器翻譯技術是基於短語統計機器翻譯拼圖過程,嘗試找出較好翻譯選項,而神經網絡機器學習屬於利用雲語言與目標語言信息,使整各翻譯過程變得連續且完整。
  • 英漢翻譯so easy!谷歌發布神經網絡翻譯系統
    谷歌發布神經網絡翻譯系統 Google今天宣布發布Google神經網路機器翻譯系統(Google Neural Machine Translation),簡稱GNMT,使用當前最先進的訓練技術,能夠實現到迄今為止機器翻譯質量的最大提升。
  • 谷歌用神經機器系統把漢語翻譯成英語 錯誤率最高下降85%
    新浪科技訊 北京時間9月28日上午消息,谷歌今天宣布,網絡和移動版的谷歌翻譯現在使用新的神經機器翻譯系統,並用於漢譯英,目前,谷歌翻譯應用每天翻譯約1800萬次。谷歌也在發布一篇關於該方法的學術論文。 此前谷歌也曾表示在谷歌翻譯中使用神經網絡,但具體用於實時視頻翻譯功能。
  • 谷歌的神經翻譯系統意味著機器翻譯到盡頭了?
    整個的報告以機器翻譯為主線展開,大概分四部分:第一叫做機器翻譯的波瀾史,幾十年的發展一波三折,非常有意思;第二是機器翻譯現在主流的技術神經機器翻譯,還是可以改進的。我可以給大家看一些例子,並不是谷歌就做到頭了,還有很多的空間。
  • 谷歌開源神經機器翻譯技術,推出tf-seq2seq框架
    陳樺 編譯自 Google官方博客量子位 報導 | 公眾號 QbitAI谷歌研究軟體工程師、谷歌大腦團隊成員Anna Goldie和Denny Britz今天撰文,宣布在「谷歌神經機器翻譯」的基礎上推出開源框架tf-seq2seq,給外部研究人員提供幫助。
  • ...谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot翻譯
    》,介紹了谷歌的神經機器翻譯系統(GNMT),該系統實現了機器翻譯領域的重大突破,參見報導《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》。這些語言的母語總人口佔到了世界總人口的三分之一,覆蓋了谷歌翻譯 35% 以上的請求。通過這一次更新,谷歌翻譯一次性提升的性能超過了過去十年進步的總和。但這只是一個開始。儘管我們目前在谷歌搜索、谷歌翻譯應用和網站上只有 8 種語言,但我們的目標是將神經機器翻譯擴展到所有 103 種語言,並讓你能隨時隨地都能接入到谷歌翻譯。
  • 谷歌翻譯竟預言世界末日,專家解密神經翻譯6大難題
    我們正在經歷世界上的戲劇性的發展,這表明我們越來越接近末日和耶穌的回歸。」這段驚悚的「預言」來自谷歌翻譯。2016年,谷歌宣布機器翻譯「重大突破」——神經機器翻譯(GNMT),將翻譯質量提高到接近人類筆譯的水平。然而,它將無意義的文本翻譯成怪異的宗教預言引起了新的恐慌。這次,要怪AI是「黑盒」,還是拖出谷歌員工來背鍋?
  • 谷歌神經機器翻譯之我見
    本文寫於2016年9月Google升級神經機器翻譯(GNMT)之際。
  • 能犧牲大語種、提升小語種翻譯質量的谷歌多語言機器翻譯
    ,谷歌拓展了機器翻譯系統的邊界:用所有可用的數據訓練一個超大規模的多語言神經機器翻譯系統。—— Warren Weaver, 1949尋找新的挑戰過去幾年中,得益於神經機器翻譯(NMT)技術的流行,機器翻譯的質量越來越高。不過神經機器翻譯的成功也同時依賴於大量的有監督訓練數據。所以對於只能找到很少標註數據、甚至找不到標註數據的語言要怎麼處理呢?
  • 機器翻譯與人工翻譯之爭
    2015年,蒙特婁大學引入注意力機制,使得神經機器翻譯達到實用階段。此後,神經機器翻譯不斷取得進展。2016年,谷歌GNMT發布,該系統可模仿人腦的神經思考模式,翻譯出與人工翻譯相媲美的譯文。同年,微軟在Switchboard對話語義識別達到人類水平,訊飛上線NMT系統,神經機器翻譯開始被大規模應用。
  • 谷歌翻譯會讓人類翻譯失業嗎?
    對於一個完全不懂英文的人來說,通過谷歌翻譯來了解一篇文章的大意已經足夠了。得益於人工智慧技術的發展,谷歌翻譯在準確性和速度上都有了很大提升,不少翻譯結果甚至能讓人感到驚喜。除了谷歌之外,國內的有道翻譯和搜狗翻譯在這兩年的進步也很快。那麼,如果機器翻譯技術再繼續發展下去,人類翻譯會失業嗎?在回答問題之前,我們有必要先了解機器翻譯背後的工作原理。
  • 谷歌翻譯啟用全新神經網絡機器翻譯支持印地語、俄國和越南語
    《谷歌翻譯啟用全新神經網絡機器翻譯支持印地語、俄國和越南語》文章已經歸檔,不再展示相關內容,編輯建議你查看最新於此相關的內容:牽手Google,王雪紅意欲成就HTC再次起飛HTC與Google籤署戰略合作協議的消息傳出後
  • 谷歌機器翻譯取得顛覆性突破 到底幾分真假?
    ,然後對它們的大部分進行獨立翻譯,而神經機器翻譯則將整個輸入句子視作翻譯的基本單元。所以重大突破並不僅僅是上了深度神經網絡,而是以句子為單元。最近,做機器翻譯的同志們一打開朋友圈,猛然發現好像飯碗沒了,谷歌爸爸大力出奇蹟,提高了機器翻譯87%的水平。結果打開人家原文一看,原來虛驚一場,只是現有工作的整合,一篇完美的工程論文,並沒有新的模型提出。不禁長舒一口氣,呼~飯碗還在。
  • 谷歌的神經翻譯系統並不意味著機器翻譯到頭了,還有大把創新可做|...
    整個的報告以機器翻譯為主線展開,大概分四部分:第一叫做機器翻譯的波瀾史,幾十年的發展一波三折,非常有意思;第二是機器翻譯現在主流的技術神經機器翻譯,還是可以改進的。我可以給大家看一些例子,並不是谷歌就做到頭了,還有很多的空間。
  • 谷歌揭秘自家翻譯系統:如何利用AI技術提高翻譯質量
    目前谷歌翻譯可支持108種語言,平均每天翻譯1500億個單詞。  谷歌翻譯最早亮相於2006年,在過去的13年間,翻譯水平有了重大飛躍。谷歌表示,其翻譯突破並不是由單一技術推動的,而是針對低資源語言、高資源語言、總體質量、推理速度等一系列技術組合的突破。
  • BAT、谷歌、Facebook都在搞的神經機器翻譯,真的就地表最強了嗎?
    2014年到2016年,機器翻譯領域可以說是翻天覆地。這期間發生的大事,是以神經網絡作為基礎的機器翻譯,開始在全面超越此前以統計模型為基礎的統計機器翻譯(SMT),並快速成為在線翻譯系統的主流標配。在這場革命之後,機器翻譯徹底進入了Neural Machine Translation,即NMT神經機器翻譯時代。很多人為此歡欣鼓舞。
  • BAT、谷歌、Facebook都在搞的神經機器翻譯,真的就地表最強了嗎...
    2014年到2016年,機器翻譯領域可以說是翻天覆地。這期間發生的大事,是以神經網絡作為基礎的機器翻譯,開始在全面超越此前以統計模型為基礎的統計機器翻譯,並快速成為在線翻譯系統的主流標配。在這場革命之後,機器翻譯徹底進入了Neural Machine Translation,即NMT神經機器翻譯時代。很多人為此歡欣鼓舞。回想去年,谷歌在中英翻譯系統上部署了GNMT——谷歌神經機器翻譯之後,當時網上有一句廣為流傳的話:「作為翻譯,看到這個新聞的時候,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。」