【關注】谷歌翻譯實現重大突破!讀外語專業的同學方了嗎?

2021-02-24 廣東高考在線

谷歌翻譯實現重大突破!你們來感受下!

上面圖片看不清的請看下面兩張截圖,大家對比一下↓↓↓

作為一個翻譯,看到這個新聞的此時此刻,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼……換言之···做翻譯的人現在開始要被第三次工業革命淘汰了?

谷歌翻譯的重大突破是什麼?這一切是如何發生的?其實昨天谷歌就已經發表了相關論文,介紹了自己最新的神經機器翻譯系統(GNMT),以及新系統的工作原理。

  

9月27日,谷歌在 ArXiv.org 上發表論文《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》,介紹谷歌的神經機器翻譯系統(GNMT)。

  

9月28日,谷歌 Research Blog 發布文章對該研究進行了介紹,還宣布將 GNMT 投入到了非常困難的漢語-英語語言的翻譯生產中,引起了業內的極大的關注。

  

十年前,我們發布了 Google Translate(谷歌翻譯),這項服務背後的核心算法是基於短語的機器翻譯(PBMT:Phrase-Based Machine Translation)。

  

自那時起,機器智能的快速發展已經給我們的語音識別和圖像識別能力帶來了巨大的提升,但改進機器翻譯仍然是一個高難度的目標。

  
今天,我們宣布發布穀歌神經機器翻譯(GNMT:Google Neural Machine Translation)系統,該系統使用了當前最先進的訓練技術,能夠實現到目前為止機器翻譯質量的最大提升。

我們的全部研究結果詳情請參閱我們的論文《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》。

  

幾年前,我們開始使用循環神經網絡(RNN:Recurrent Neural Networks)來直接學習一個輸入序列(如一種語言的一個句子)到一個輸出序列(另一種語言的同一個句子)的映射。

其中基於短語的機器學習(PBMT)將輸入句子分解成詞和短語,然後在很大程度上對它們進行獨立的翻譯,而神經機器翻譯(NMT)則將輸入的整個句子視作翻譯的基本單元。

  

這種方法的優點是:相比於之前的基於短語的翻譯系統,這種方法所需的工程設計更少。當其首次被提出時,NMT 在中等規模的公共基準數據集上的準確度,就達到了可與基於短語的翻譯系統媲美的程度。

  

自那以後,研究者已經提出了很多改進 NMT 的技術,其中包括模擬外部對準模型(external alignment model)來處理罕見詞,使用注意(attention)來對準輸入詞和輸出詞 ,以及將詞分解成更小的單元應對罕見詞。儘管有這些進步,但 NMT 的速度和準確度還沒能達到成為 Google Translate 這樣的生產系統的要求。

  

我們的新論文描述了怎樣克服讓 NMT 在非常大型的數據集上工作的許多挑戰、如何打造一個在速度和準確度上都足夠能為谷歌 用戶和服務帶來更好的翻譯體驗的系統。

  

來自對比評估的數據,其中人類評估者對給定源句子的翻譯質量進行比較評分。得分範圍是 0 到 6,其中 0 表示「完全沒有意義的翻譯」,6 表示「完美的翻譯」。

  

下面的可視化圖展示了 GNMT 將一個漢語句子翻譯成英語句子的過程。

  

該網絡將該漢語句子的詞編碼成一個向量列表,其中每個向量都表徵了到目前為止所有被讀取到的詞的含義(編碼器(Encoder))。一旦讀取完整個句子,解碼器就開始工作——一次生成英語句子的一個詞(解碼器(Decoder))。

  

為了在每一步都生成翻譯正確的詞,解碼器重點注意了與生成英語詞最相關的編碼的漢語向量的權重分布(「注意(Attention)),藍色連結的透明度表示解碼器對一個被編碼的詞的注意程度)。

  

使用人類評估的並排比較作為一項標準,GNMT 系統得出的翻譯相比於之前基於短語的生產系統有了極大提升。

  

在雙語人類評估者的幫助下,我們在來自維基百科和新聞網站的樣本句子上測定發現:GNMT 在多個主要語言對的翻譯中將翻譯誤差降低了 55%-85% 甚至更多。

  

今天除了發布這份研究論文之外,我們還宣布將 GNMT 投入到了一個非常困難的語言(漢語-英語)的翻譯的生產中。

  
現在,移動版和網頁版的 Google Translate 的漢英翻譯已經在 100% 使用 GNMT 機器翻譯了——每天大約 1800 萬條翻譯。

GNMT 的生產部署是使用我們公開開放的機器學習工具套件 TensorFlow 和我們的張量處理單元(TPU:Tensor Processing Units),它們為部署這些強大的 GNMT 模型提供了足夠的計算算力,同時也滿足了 Google Translate 產品的嚴格的延遲要求。

漢語到英語的翻譯是 Google Translate 所支持的超過 10000 種語言對中的一種,在未來幾個月,我們還將繼續將我們的 GNMT 擴展到遠遠更多的語言對上。

機器翻譯還遠未得到完全解決。GNMT 仍然會做出一些人類翻譯者永遠不出做出的重大錯誤,例如漏詞和錯誤翻譯專有名詞或罕見術語,以及將句子單獨進行翻譯而不考慮其段落或頁面的上下文。為了給我們的用戶帶來更好的服務,我們還有更多的工作要做。

  
但是,GNMT 代表著一個重大的裡程碑。我們希望與過去幾年在這個研究方向上有所貢獻的許多研究者和工程師一起慶祝它——不管是來自谷歌還是更廣泛的社區。

  

對於谷歌的神經機器翻譯系統,有人歡喜有人憂,你怎麼看?

美國研究生留學

相關焦點

  • 重磅 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot翻譯(附論文)
    the Gap between Human and Machine Translation》,介紹了谷歌的神經機器翻譯系統(GNMT),該系統實現了機器翻譯領域的重大突破,參見報導《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》。
  • Google Translate重大突破——整個翻譯界的憂慮和恐懼!
    谷歌翻譯實現重大突破!你們來感受下!谷歌翻譯的重大突破是什麼?這一切是如何發生的?其實昨天谷歌就已經發表了相關論文,介紹了自己最新的神經機器翻譯系統(GNMT),以及新系統的工作原理。昨天(9月28日),谷歌 Research Blog 發布文章對該研究進行了介紹,還宣布將 GNMT 投入到了非常困難的漢語-英語語言的翻譯生產中,引起了業內的極大的關注。以下文章轉載自機器之心微信公眾號(ID:almosthuman2014)原文作者:Quoc V.
  • 谷歌翻譯引擎提高了多少?
    3個多BLEU的差距,如果由人來判斷,仔細看的話,是能感覺到的,但是也就是一個小的進步,談不上突破什麼的。」「對於他們(谷歌發表)的文章,我覺得有兩個遺憾的地方:一. 所採用的技術都是之前發表過的,沒有全新的技術(對谷歌的要求自然要高一點,呵呵)。二.
  • 機器翻譯來了!
    據不完全統計,目前人類自然語言約有8000餘種,即使最強大的語言大師,窮其一生也只能掌握30多種,人們在日常交往以及政治、經濟、文化、科技等信息交互中,主要依賴翻譯或專業翻譯機構。國人上小學起就開始學習外語,用外語交流總不如母語得心應手,到頭來真正熟練掌握一門外語並非易事,更不用說掌握多門外語了。
  • 重磅 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破(附論文)
    今日,谷歌 Research Blog 發布文章對該研究進行了介紹,還宣布將 GNMT 投入到了非常困難的漢語-英語語言對的翻譯生產中,引起了業內的極大的關注。十年前,我們發布了 Google Translate(谷歌翻譯),這項服務背後的核心算法是基於短語的機器翻譯(PBMT:Phrase-Based Machine Translation)。
  • 最強翻譯器,支持30多種外語的翻譯軟體,支持手機和電腦
    大家好,今天小花卷為大家帶來的是最強翻譯器,支持30多種外語的翻譯軟體,支持手機和電腦。翻譯軟體是將一種語言翻譯為另一種語言的軟體,花卷提供的翻譯軟體支持30多種語音翻譯,幾乎可以滿足大家的所有語言需求。
  • 最強的翻譯工具,比谷歌翻譯還厲害!
    正文---對於翻譯工具,由於是剛需,小編我也是在公眾號推薦過好幾款,有「複製翻譯」的CopyTranslator,也有聚合翻譯神器多譯,還有前幾天剛推薦的文獻翻譯神器知雲文獻翻譯。以上這三款軟體都是按照應用場景精心挑選的,各有各的特點。
  • 關於谷歌翻譯,你不知道的幾個使用技巧!
    即使是從來沒有聽說過機器翻譯的人,也肯定經常聽說谷歌翻譯——因為它使交流變得更容易。當然,谷歌翻譯有時也會出錯。如果您輸入一個特定的方言,該應用程式可能會將其翻譯錯誤。有些錯誤甚至是十分荒謬的。但老實說: 這款應用程式大部分時間都還是很好用的,甚至可以用來學習一門新的語言。這裡有一些谷歌翻譯的使用技巧可以供您嘗試。
  • 2020年穀歌AI重大突破
    但我們已經證明,基於機器學習的預測系統能夠以更好的空間解析度來預測當前降水情況(回答「我家附近的公園正在下雨嗎?」,而不只是「當前所在城市正在下雨嗎?」),並產生未來 8 小時內準確率遠高於 HRR 的短期預報。這套模型不僅預報計算速度更快,同時也擁有更高的時空解析度。
  • WT2實時翻譯耳機:滿足你對外語交流的一切想像
    計算機技術的發展推動了機器翻譯技術的長足進步,從早期的詞典匹配,到詞典結合語言學專家知識的規則翻譯,再到基於語料庫的統計機器翻譯,各種各樣的翻譯軟體紛紛推出,為人們提供實時、便捷的翻譯服務。當今時代,外語水平已經不再是阻擋人與人之間交流的屏障,可攜式翻譯產品應運而生。但截止目前,翻譯產品市場還相對比較混亂,翻譯產品的質量也良莠不齊。
  • 計算機翻譯會取代人工翻譯嗎?| 譯 • 視野
    「使用谷歌翻譯可能會導致一些嚴重的錯誤,尤其是當單詞有多種含義時,法律或工程等領域常有這種情況,」在法國梅裡貝爾工作的薩曼莎·蘭利說。她曾是一名律師,現在是法院認可的法語-英語法律翻譯。其中一個最普遍使用的新工具就是是所謂的翻譯耳機,通常通過智慧型手機應用程式操作。耳機會將聽到的外語給用戶翻譯出來。
  • 谷歌翻譯會讓人類翻譯失業嗎?
    仔細讀一讀上面的譯文,你會發現除了有兩三處小問題(比如we should not hinder globalization是粘連句),英文讀起來很通順,意思也表達比較到位。譯文中還出現了比如from a global perspective, at all costs, be the driving force等表達。
  • 最專業的英文翻譯軟體!「一行黑科技」
    翻譯軟體對於我們來說基本上算是一個必備的工具,不管你是不是英文專業,不管你是在工作還是娛樂,可以說我們總會碰到一些外語需要靠工具翻譯。目前我們一般的翻譯操作就是:複製外語文獻,打開百度輸入翻譯,然後粘貼。實際上這種操作還是略微有些複雜的,並且裡面有很多細節問題,比如不同的搜尋引擎的翻譯結果不同,比如百度和谷歌,還有就是對於一些單詞或者短語來說,在線翻譯提供的結果可能較為局限。
  • 谷歌翻譯應用竟然連有道都不如......
    近日,谷歌翻譯App 高調宣布將重回中國市場,引發熱議。據了解,谷歌的大部分產品和服務在2010年左右就無法在中國大陸使用了。不過,谷歌翻譯的網頁端卻一直開放。因為支持 100多種語言之間互譯,因此谷歌的網頁版翻譯工具是不少外語學生、跨境電商從業者以及出海創業人員的一個頗為實用的工具。
  • 重磅 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破,正確率最高87%(附論文)
    》介紹谷歌的神經機器翻譯系統(GNMT),以下是翻譯內容。今天,我們宣布發布穀歌神經機器翻譯(GNMT:Google Neural Machine Translation)系統,該系統使用了當前最先進的訓練技術,能夠實現到目前為止機器翻譯質量的最大提升。
  • 科研工具|翻譯神器,教你實現文獻在線快速翻譯
    今天的辦法來了,我們可以通過一個劃詞翻譯小工具,實現實時的在線翻譯,對於陌生的詞語或者句子,不用大量的複製粘貼到谷歌或者百度翻譯上就可實現翻譯。(可以實現不同語言,不同的翻譯工具進行翻譯)如果我們遇到陌生的詞語或者句子,一般是複製粘貼到谷歌翻譯或者百度翻譯的網站上
  • 王小川的AI翻譯之戰,勝算多大?
    用搜狗領先的神經網絡翻譯技術和語音識別技術實現離線語音翻譯、離線拍照翻譯,我們相信這款產品能夠真正幫助國人應對跨語言溝通難題,成為大家出國旅行的必備神器,用中文走遍世界。這時候,翻譯APP基本廢掉了,具備離線翻譯能力的專業翻譯機才該是「拯救外語盲」的首選。有網的時候看不出區別,沒網的時候就一見高下了。就像拳擊比賽,玩的就是赤手空拳硬功夫。但離線翻譯能力有多強,也是各家翻譯機搶奪用戶的真槍實彈。
  • 谷歌翻譯改版,支持上傳文件翻譯
    今天就和大家來聊聊「谷歌翻譯」這款日漸完善的產品,也是少有的在大陸地區還可以使用的谷歌服務。谷歌翻譯已經正常服務全球 10 億用戶 13 年了,是目前世界上最多人使用的免費翻譯工具。就讓我用幾個值得活用的谷歌翻譯功能和場景,來演示下它的使用方法。可以直接調用系統攝像頭,掃描視野中的文字,可以直接在視窗中翻譯成你希望的內容,在出國旅行時會非常有用。
  • 中意雙語|谷歌翻譯是如何運作的——為什麼它無法替代專業翻譯員
    谷歌翻譯(Google Translate)已經成為短篇幅翻譯的在線便捷參考工具。它的出現極大地使人們的生活變得更方便,但如果我們對翻譯所涉及到的外語一竅不通的話,盲目相信它的翻譯結果就很容易讓我們產生誤解。
  • 谷歌發布 Zero-Shot 神經機器翻譯系統:AI 巴別塔有望成真
    為了實現這一點,我們需要構建和維護許多不同的系統,以便在任何兩種語言之間進行轉換,由此產生了巨大的計算成本。神經網絡改革了許多領域,我們確信可以進一步提高翻譯質量,但這樣做意味著重新思考谷歌翻譯背後的技術。今年 9 月,谷歌翻譯改為啟用谷歌神經機器翻譯(GNMT)的新系統,這是一個端到端的學習框架,可以從數百萬個示例中學習,並在翻譯質量方面有顯著提升。