神經機器翻譯工具 將首先用於中翻英

2020-12-25 SZNEWS

據新華社消息 世界智慧財產權組織10月31日在日內瓦表示,中國國際專利申請量預計兩年內將居全球次席,因此該組織推出的最新基於人工智慧的神經機器翻譯工具將首先用在中文專利文檔轉化為英文的服務上。

世界智慧財產權組織今年3月發布的數據顯示,2015年中國以2.98萬件《專利合作條約》框架下提交的國際專利申請排名全球第3位,僅位居美國(5.74萬)和日本(4.42萬)之後。

神經機器翻譯是一個新興技術,建立在龐大的、能夠「學習」之前翻譯過的句子的神經網絡模型上。與之前「基於短語」的方法相比,神經機器翻譯可產生更為自然的語序,並在差異性較大的兩種語言的翻譯中,如日文-英文或中文-英文中有顯著進步。

通過學習掌握中國國家知識產權局提供給世界智慧財產權組織資料庫的6000萬個中文專利文獻語句,並與美國專利商標局提交的英文翻譯相對比,神經機器翻譯工具實現了中文—英文專利文檔翻譯的高度準確,將上小時的人工翻譯時間縮減為數秒。

目前,專利申請方可在世界智慧財產權組織官網公共測試平臺上試用這一最新的中文-英文翻譯服務,世界智慧財產權組織還計劃將神經機器翻譯服務擴大至用法文提出的專利申請,其他語言緊隨其後。

相關焦點

  • 世界智慧財產權組織推出的新翻譯工具,將率先用於中翻英
    新華網日內瓦10月31日消息,世界智慧財產權組織10月31日在日內瓦表示,中國國際專利申請量預計兩年內將居全球次席,因此該組織推出的最新基於人工智慧的神經機器翻譯工具將首先用在中文專利文檔轉化為英文的服務上。
  • 世界智慧財產權組織推出的新翻譯工具將率先用於中翻英
    新華社日內瓦10月31日電(記者張淼)世界智慧財產權組織10月31日在日內瓦表示,中國國際專利申請量預計兩年內將居全球次席,因此該組織推出的最新基於人工智慧的神經機器翻譯工具將首先用在中文專利文檔轉化為英文的服務上。
  • WIPO新型翻譯工具將率先用於中文等譯為英文
    原標題:WIPO新型翻譯工具將率先用於中文等譯為英文   日前從世界智慧財產權組織(WIPO)官網獲悉,WIPO將在其開發的基於人工智慧的神經機器翻譯工具率先用於在中文專利文獻翻譯成英文的服務上。
  • 什麼是神經機器翻譯(NMT)?
    機器翻譯翻譯行業不斷發展以滿足客戶的需求,神經機器翻譯(NMT)是這一進程的最新一步。由於能夠一次翻譯整個句子,NMT的輸出可以類似於人工翻譯。隨著越來越多的企業走向全球化,NMT可能會對翻譯行業產生巨大影響。什麼是神經機器翻譯?NMT使用基於神經網絡的技術來實現更多上下文精確的翻譯,而不是一次翻譯一個單詞的破碎句子。使用大型人工神經網絡計算單詞序列的概率,NMT將完整的句子放入一個集成模型中。
  • 史丹福大學 NLP 組開放神經機器翻譯代碼庫
    在這篇文章中,他們還放出了在多種翻譯任務上(比如英德翻譯和英語-捷克語翻譯)實現了當前最佳結果的代碼庫(codebase)。除此之外,「為了鼓勵再現和增加透明」,他們還放出了他們用於訓練模型的處理過的數據以及可以通過他們的代碼庫使用的預訓練好的模型。發布地址:http://nlp.stanford.edu/projects/nmt/
  • Caffe2新增RNN支持,Facebook全面轉向神經機器翻譯
    這意味著 Facebook 可在產品中部署神經機器翻譯了。我們很高興共享 Caffe2 在支持循環神經網絡(RNN)方面的最新成果。今年 4 月推出 Caffe2 時,它並不支持 RNN;為此,在過去的幾個月,我們開發出了當前最優的 RNN 構件以支持 RNN 用例(比如機器翻譯、語音識別)。
  • 神經機器翻譯的直觀解釋 | 留言送書
    神經機器翻譯是一種將一種語言翻譯成另一種語言的技術。一個例子是把英語轉換成印地語。讓我們想想,如果你在一個印度村莊,那裡的大多數人都不懂英語。你打算毫不費力地與村民溝通。在這種情況下,你可以使用神經機器翻譯。
  • 【重磅】谷歌發布 Zero-Shot 神經機器翻譯系統:AI 巴別塔有望成真
    假設我們使用日語和英語以及韓語和英語之間相互翻譯為例,訓練一個多語言系統,如動畫中藍色實線所示。這個新的多語言系統與單個 GNMT 系統大小一樣,參數也一樣,能夠在日英和韓英這兩組語言對中進行雙語翻譯。參數共享使系統能夠將「翻譯知識」(translation knowledge)從一個語言對遷移到其他語言對。這種遷移學習和在多種語言之間進行翻譯的需要,迫使系統更好地利用其建模能力。
  • 面向神經機器翻譯的篇章級單語修正模型
    《面向神經機器翻譯的篇章級單語修正模型》[1]是EMNLP2019上一篇關於篇章級神經機器翻譯的工作。針對篇章級雙語數據稀缺的問題,這篇文章探討了如何利用篇章級單語數據來提升最終性能,提出了一種基於目標端單語的篇章級修正模型(DocRepair),用來修正傳統的句子級翻譯結果。
  • 微軟的裡程碑式突破:AI中翻英效果媲美人類
    摘要:微軟周三稱,研發出了首個媲美人類水平的中翻英系統。這一翻譯目前已經開放,也在一定程度上顯示出了相對更高的翻譯水平,但目前全世界的英翻中水平,似乎都仍有待提高……微軟周三稱,機器翻譯取得重要進展,研發出了首個媲美人類水平的中翻英系統。
  • F8 2017 | 技術負責人為你解析 Facebook 神經機器翻譯
    至今,已有 15 個不同語言的翻譯系統,遷移到了新的機器翻譯架構;Facebook 平臺上,超過 50% 的翻譯出自基於神經網絡的系統。那麼,為什麼 Facebook 要轉移至神經網絡機器翻譯?或者說,新架構的優點是什麼?
  • 維基百科聯手谷歌翻譯,結果「慘不忍睹」!
    近日,據 VentureBeat 等多家外媒報導,為了解決這個問題,維基媒體基金會(Wikimedia Foundation,維基百科的運營方)表示,正與谷歌合作,將谷歌翻譯(Google Translate)將免費集成到維基百科的內部翻譯工具中,與開源翻譯工具 Apertium 一同成為附加的功能。
  • 號稱要砸翻譯飯碗,神經機器翻譯哪家強?
    Google新發布了神經機器翻譯(GNMT:Google Neural Machine Translation)系統,並稱該系統使用了當前最先進的訓練技術,能夠實現到當下機器翻譯質量上最大的提升。有從事翻譯職業的網友甚至這樣形容:作為翻譯看到這個新聞的時候,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。
  • 資源| 清華大學開源神經機器翻譯工具包THUMT
    參與:李澤南機器翻譯是自然語言處理的重要組成部分,其目的是使用計算機自動將文本翻譯成其他語言的形式。近年來,端到端的神經機器翻譯發展迅速,已經成為機器翻譯系統的新主流。近日,清華大學自然語言處理組發布了機器翻譯工具包 THUMT,為業內人士的研究和開發工作提供了便利。
  • F82017|技術負責人為你解析Facebook神經機器翻譯
    該講座主題為 Facebook 機器翻譯的兩代架構以及技術挑戰。雷鋒網消息:在昨日的 F8 會場,該講座吸引了眾多開發者到場,主講者是 Facebook 語言翻譯部門技術負責人 Necip Fazil Ayan。Necip Fazil Ayan 首先介紹了 Facebook 翻譯業務的使命和願景,以及對機器翻譯的應用。
  • 神經機器翻譯的編碼-解碼架構有了新進展, 具體要怎麼配置?
    翻譯/  崔躍輝、葉倚青校對/  葉倚青用於循環神經網絡的編碼-解碼架構,在標準機器翻譯基準上取得了最新的成果,並被用於工業翻譯服務的核心。該模型很簡單,但是考慮到訓練所需的大量數據,以及調整模型中無數的設計方案,想要獲得最佳的性能是非常困難的。
  • 谷歌翻譯預言世界末日 神經機器翻譯或是故障原因
    圖片來源:百度圖片谷歌翻譯中新發現了一個小故障,導致在線工具將一些亂七八糟的詞句翻譯成耶穌關於世界末日的警告和預言。在谷歌翻譯中設置成夏威夷語翻譯成英語,輸入狗(dog)八次,然後就會看到奇怪的信息:「你想讓一隻狗信仰耶穌並得救嗎?」將'dog'在谷歌翻譯鍵入18次並選擇輸入語言為毛利語會產生以下信息:世界末日時鐘還差3分鐘到12點。我們正在經歷世界上的人物和戲劇性的發展,這表明我們越來越接近末日和耶穌的回歸。谷歌翻譯擁有超過100種語言,每天為超過5億人提供服務。
  • 介紹幾個翻譯工具
    一些同學在做翻譯的時候可能會藉助一些工具來提高效率以及對譯文進行查證,這裡介紹幾個比較好用的翻譯工具/方法。
  • ACL 2018 | TA-NMT:利用大語種語料,提升小語種神經機器翻譯能力
    與大語種豐富的語料數據相比,小語種機器翻譯面臨的主要挑戰是語料的稀疏性問題。為了更好地解決這一問題,微軟亞洲研究院自然語言計算組提出了一個呈三角結構的神經機器翻譯模型TA-NMT,利用大語種的豐富語料來提升小語種機器翻譯的能力。近年來,神經機器翻譯發展迅速,在諸如英法、英德、中英等許多大語種(Rich Language)翻譯任務上均取得了突破性成果。
  • 世界智慧財產權組織將中文專利譯為英文
    世界智慧財產權組織於2016年10月31日在瑞士日內瓦表示,中國國際專利申請量預計兩年內將居全球次席,因此該組織推出的最新基於人工智慧的神經機器翻譯工具將首先用在中文專利文檔轉化為英文的服務上。世界智慧財產權組織總幹事高銳表示:「中國在智慧財產權和科學技術上的實力不斷增強,2015年14%的國際專利申請來自中國,我們預計2016年的比例將達到17%或18%,甚至更高。