AlphaGo 神經網絡應用於 Google 翻譯,將接近人類水平

2020-12-07 愛範兒

AlphaGo 神經網絡應用於 Google 翻譯,將接近人類水平

那個支持 AlphaGo 贏得圍棋比賽的深度神經網絡如今又要有新的表現,Google 即將把它應用於 Google 翻譯中,讓機器翻譯更加通順流暢,表意清晰。目前該系統僅應用於中文到英文的語言對翻譯。

Google 表示,新的翻譯系統簡稱為 Google 神經機器翻譯(Google Neural Machine Translation-GNMT),就某些語言而言,GNMT 錯誤率可以減少 60%。

人類翻譯、神經機器翻譯系統和短語單詞翻譯系統的完整度(分成 0~6 的程度)在不同語言應用中的對比

該項目的負責人之一,同時也是 Google 智庫成員的工程師 Mike Schuster 談到:

我們將按照 「端到端」 的模式對整個系統進行統一訓練,這可以使公司更專注於減少翻譯的錯誤率方面。雖然現在還並不完美,但的的確確是完善了很多。

新的神經機器翻譯系統如何檢測一個句子,並對它之間的關聯性和重要性進行考量

在機器翻譯方面,Google 使用的深度神經網絡叫做 LSTM(long short-term memory – 長期短期記憶)。LSTM 可以保留長期和短期的記憶,有點像人類的大腦,這使得它可以用更複雜的方式進行學習。

和 Google 以前的短語翻譯系統(Phrase-Based Machine Translation-PBMT)不同,LSTM 可以從頭到尾記住一句話再進行翻譯,使長句翻譯不再是單詞的拼湊,而是流暢通順的語言。

一句中文在短語單詞翻譯系統、神經機器翻譯系統和人類翻譯的區別

其實多年以來,Google 一直想讓 LSTM 服務於翻譯工作,然而一直無法攻克翻譯速度這個難題。直到做了大量的工程和算法工作,才得以完善這個模型,讓新神經機器翻譯系統能夠在跨越大型的 Internet 服務時保持工作速度。

Google 還計劃利用新系統推出 10000 多個語言對的機器翻譯。

 

以上圖片均來自:googleblog ,題圖來源:vertexreport

相關焦點

  • 如何評價Google神經機器翻譯(GNMT)系統?
    幾年前,Google開始使用循環神經網絡來直接學習一個輸入序列(如一種語言的一個句子)到一個輸出序列(另一種語言的同一個句子)的映射。其中基於短語的機器學習(PBMT)將輸入句子分解成詞和短語,然後對它們的大部分進行獨立翻譯,而神經網絡機器翻譯(NMT)則將整個輸入句子視作翻譯的基本單元。
  • 有道nmt神經網絡_有道神經網絡翻譯(nmt) - CSDN
    另一方面,隨著智能翻譯的興起,越來越多語言專業的學生和翻譯行業的工作人士抱怨,神經網絡翻譯等技術的出現,讓原本就競爭激烈的翻譯市場迅速進入了冰凍期。但是,未來機器翻譯真的會完全取代人類,讓翻譯員們下崗嗎?網易智能梳理了目前主流的機器翻譯技術與應用,一探智機器翻譯行業究竟。
  • 網易有道上線神經網絡翻譯質量媲美英語八級
    人工智慧改變翻譯讓翻譯更「聰明」深度學習是推動當前人工智慧熱潮最關鍵的技術,它首先在圖像、音頻等感知領域獲得了巨大成功,目前在語言方面的應用也獲得了長足的進展。而神經網絡翻譯就是深度學習在機器翻譯領域的具體應用。
  • 網易有道上線神經網絡翻譯 質量可媲美英語八級
    人工智慧改變翻譯讓翻譯更「聰明」深度學習是推動當前人工智慧熱潮最關鍵的技術,它首先在圖像、音頻等感知領域獲得了巨大成功,目前在語言方面的應用也獲得了長足的進展。而神經網絡翻譯就是深度學習在機器翻譯領域的具體應用。
  • 谷歌推出神經網絡翻譯 中譯英水平匹敵真人?
    據澎湃新聞9月29日報導,27日,谷歌推出了新的翻譯系統,聲稱該套翻譯系統基於對人類神經思考的模仿,能夠與真人翻譯競相匹敵。滿分為6分,橘色為真人翻譯、綠色為谷歌神經網絡翻譯、藍色為短語式翻譯。 從前的譯介模式是短語式的,翻譯系統將一句話拆分成單詞或者詞組進行翻譯,往往得到一些狗屁不通的結果。而新的翻譯系統稱之為谷歌神經機器翻譯(GNMT),這項新的技術運用更少的機器設計選擇,它將一句話視為整體進行解碼,雖然仍是將一句話分割成若干獨立單元,但每個單元都放在句子的前後進行考量。
  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」這些專家系統,很多是借用海量人類經驗和數據開發出來的。然而,在有些特定問題上,人類的知識要麼過於昂貴,要麼不靠譜,要麼無法獲得。因此,人工智慧研究的一個長期目標就是跳過這一步,創造能在最有挑戰性的領域,不用人類輸入就達到超人水平的算法。我們發表在《自然》期刊上的最新論文,展示了實現該目標的關鍵一步。
  • Google翻譯App更新:拍照就可翻譯!
    今天,Google翻譯App更新了!8年來,用戶可通過translate.google.cn訪問網頁版的Google翻譯,現在用戶還可下載Android和iOS版本應用。
  • Transformer新型神經網絡在機器翻譯中的應用|公開課筆記
    大家可以看到我PPT下面的幾個 LOGO,我們翻譯團隊是屬於阿里巴巴機器智能技術實驗室,中間是阿里翻譯的 Logo和我們的口號「Translate and Beyond」。這次分享的題目是「Transformer新型神經網絡在機器翻譯中的應用」。
  • 神經網絡與人工智慧應用
    雖然更廣泛的經濟影響是複雜的,但與 ML 能力接近的任務上,對勞動力需求更有可能下降,而作為這些系統補充的任務勞動力的需求可能增加。每當 ML 系統跨越一個門檻,在某個任務上比人類更具成本效益時,企業家和管理者為了利潤最大化,將越來越多地尋求用機器替代人類。這將影響整個經濟,提高生產力,降低價格,轉移勞動力需求,重組行業。
  • AlphaGo將應用於谷歌翻譯 炒股機器人橫空出世
    日前,關於人工智慧有兩條新聞值得關注,一是谷歌宣布將把AlphaGo技術應用於谷歌翻譯,二是中國一家證券公司開發的A股機器人,經過三個月的時間,以24.06%(年化96%)的累計收益率戰勝了98%的用戶,炒股機器人橫空出世……  AlphaGo將應用於谷歌翻譯
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    谷歌人工智慧團隊DeepMind團隊在國際學術期刊《自然》(Nature)上發表論文,宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習,其水平超過此前所有AlphaGo(阿爾法狗)。
  • ACL論文 | 深度學習大神新作,神經網絡的自然語言翻譯應用
    Manning進行了關於神經機器翻譯(NMT)的講座。神經機器翻譯是一種簡單的新架構,可以讓機器學會翻譯。該方法雖然相對較新,已經顯示出了非常好的效果,在各種語言對上都實現了最頂尖的表現。神經網絡在自然語言處理方面,未來有巨大的應用潛力。
  • 物理波動力學計算在模擬循環神經網絡的應用
    神經網絡的基礎是大量的稱為節點的神經元的元素的集合,通常以緊密互連的束狀排列。簡而言之,神經元是具有多個輸入和單個輸出的特徵的細胞。單元的輸出是其輸入的直接函數,每個單元在輸出的總體貢獻中得到不同的「關注」。這種「注意力」水平稱為權重。輸出會帶有某種閾值效應,僅在神經元超過這個閾值時才產生激發響應。連接到激發神經元的相關輸入被「激發」,該過程在整個網絡中進行,直到最終輸出。
  • 谷歌正式推出神經翻譯 翻譯水平遠超過去十年
    用谷歌翻譯常出錯,譬如......完全不懂怎麼會這樣,雖然我大天朝的文字遊戲的確複雜。 Google也一直在研究更準確的翻譯方式,最近Google正式啟用「神經網絡機器翻譯系統」。其最大特點在於,可以將句子視為一個整體進行翻譯,而非以往的將其拆分為詞和短語。同時,翻譯的精確度與流暢度也有所提升目前谷歌該系統支持八組語言的互譯,包括英語和法語、德語、西班牙語、葡萄牙語、中文、日語、韓語、土耳其語等。這包含了世界約三分之一人口的母語,佔到了谷歌翻譯查詢量的35%以上。
  • 將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」
    而谷歌的神經機器翻譯提出了帶有 8 個編碼器和 8 個解碼器的深度 LSTM 網絡組成的模型,使用了注意力和殘差連接。為了提升並行性從而降低訓練時間,注意機制將解碼器的底層連接到了編碼器的頂層。在推理計算過程中使用了低精度運算來加速翻譯速度。為改善對罕見詞的處理,谷歌將詞分成常見子詞單元(詞的組件)的一個有限集合,該集合既是輸入也是輸出。
  • 人工智慧再下一城:機器翻譯提前7年達到人類專業翻譯水平
    黃學東驕傲地說,2015年微軟率先在圖像識別ImageNet數據集達到人類水平,2016年在Switchboard對話語義識別達到人類水平,2017在斯坦福問答數據集SQuAD上達到人類水平,今天又在機器翻譯上達到人類水平,一路走來,微軟的進步激動人心,「這是我們共同的成就,我們是站在同行的肩膀上往上走」。
  • 機器翻譯七十年:百度領跑神經網絡翻譯時代
    近兩年,神經網絡機器翻譯(Neural Machine Translation, NMT)技術異軍突起,取得了翻譯質量的大幅躍升。12月21日,在百度機器翻譯技術開放日上,百度技術委員會聯席主席、自然語言技術負責人吳華博士表示,基於領先的人工智慧、神經網絡以及自然語言處理技術,百度早在1年多以前就率先發布了世界上首個網際網路NMT系統,引領機器翻譯進入神經網絡翻譯時代。
  • 人工神經網絡的五大主要應用場景
    人工神經網絡(ANN)是一種被設計用來模擬人腦分析和處理信息的計算系統。它是人工智慧(AI)的基礎,解決了以人類或統計標準將被證明是不可能或很難解決的問題。人工神經網絡具有自我學習能力,能夠在獲得更多數據的前提下產生更好的結果。人腦對現實世界情境的解讀方式是計算機無法做到的。神經網絡最初是在20世紀50年代發展起來的,目的就是解決這個問題。
  • 深度| 逐層剖析,谷歌機器翻譯突破背後的神經網絡架構是怎樣的?
    編碼器-解碼器展示了基於神經的機器翻譯可能提供的潛力。即使有了如今複雜的神經機器翻譯架構,大部分還是根據解碼器-編碼器架構分解出的產物。該架構有兩個主要的缺點,都和長度有關。第一個,像人類一樣,該架構記憶有限。LSTM 最後的隱態,也就是 S,要死記硬背需要翻譯的句子的全部內容。