NMT機器翻譯技術,或將開啟第二次全球化浪潮

2020-11-28 搜狐網

原標題:NMT機器翻譯技術,或將開啟第二次全球化浪潮

近日,在百度機器翻譯技術開放日上,百度技術委員會聯席主席、自然語言處理部技術負責人吳華博士表示,基於領先的人工智慧、神經網絡以及自然語言處理技術,百度早在1年多以前就率先發布了世界上首個網際網路NMT系統,引領機器翻譯進入神經網絡翻譯時代。

近兩年,神經網絡機器翻譯(Neural Machine Translation, NMT)技術異軍突起,取得了翻譯質量的大幅躍升。隨著其翻譯準確度的提升,在文化全球化的時代背景推動下,高度成熟的翻譯技術或將開啟第二次全球化的浪潮。

而究竟是否達成推動,那麼我們就需要來觀察一下,到底NMT技術發展到了何種階段,應用到了何種階段,以及當前的全球化時代背景又是怎樣?

一,NMT神經網絡機器翻譯系統到底是什麼

1)機器翻譯的前4個階段

1947年計算機誕生以來,學界就開始嘗試利用計算機進行機器翻譯,而從1947年到1991年這期間,機器翻譯並沒有太大的進展,原因在於整個學界是讓機器在模擬人類翻譯的過程,這也和計算機發展歷史的必然性有關,這一階段沒有數據,更沒有網際網路,因此只能停留於算法迭代階段止步不前。

此後隨著網際網路的發展,各種在線大數據的增加,1991年基於數據的統計機器翻譯,讓機器翻譯的準確度大幅度提升。

2)NMT成當前主流

隨著深度學習的崛起,其被廣泛應用到了各個數據挖掘領域,其運行原理是讓機器自動從更大規模的語言資料中學習規則,而非直接利用給定規則。2014年學界也開始提出將深度學習應用於機器翻譯,創造出神經網絡機器翻譯(NMT)系統。

神經網絡翻譯技術從2014年9月提出,到百度2015年5月上線首個網際網路NMT系統,只用了短短8個月時間。2015年百度翻譯正式上線NMT系統,成為世界範圍內第一個真正實用的NMT系統。而谷歌在2016年9月才發布第一款NMT翻譯系統,比百度晚了整整兩年。

二,NMT翻譯已有大量應用

各大巨頭開始緊盯NMT翻譯技術,則正是說明了隨著機器翻譯準確率的大幅度上升,機器翻譯將有廣闊的商業前景,擺脫此前只存在於大學實驗室的研究狀態。

而百度,谷歌等公司早就開啟了實際的應用,以百度為例,目前的百度翻譯支持全球28種語言互譯,756個翻譯方向,每日響應過億次的翻譯請求,而這一切的原因在於實際應用。

1)應用於學習

很多中學生以及大學生都會通過百度網頁翻譯、APP對不懂的詞彙進行翻譯學習,對於生詞,不僅能查到讀音、用法,還能看到具體的使用場景和權威例句。對於不認識的物體,結合圖像識別進行實物翻譯,給出多種語言的描述,幫助記憶。

2)應用於境外遊

百度翻譯最具備商業化的使用場景,依然在境外遊市場,結合百度其他人工智慧技術,百度翻譯目前應用在如下場景。

首先是圖片技術+翻譯,當用戶無法識別建築物上的標誌時,通過拍照就可以讓百度翻譯為其進行精準的翻譯。而當用戶在國外點餐時,通過百度翻譯拍照識別同樣很重要。

其次是語音識別技術+翻譯,百度翻譯中有個「對話翻譯」功能,可以讓用戶和國外用戶直接實時對話,一旦用戶說完一個語言,機器就會馬上翻譯成另一種語言並語音讀出,實現無障礙交流。

3)中國企業的全球化賦能

百度翻譯還開放了API接口,助力廣大企業國際化。目前已有超過2萬個第三方應用接入。華為、OPPO、中興、三星等手機廠商,金山詞霸、靈格斯詞霸、敦煌網等眾多產均接入了百度翻譯API。世界智慧財產權組織(WIPO)也將百度翻譯API集成到官網,供用戶將專利信息翻譯成不同語種查詢。對於這些企業的國際化來說,百度翻譯有著極其重要的作用。

而未來隨著一帶一路戰略的推進,我國還將繼續鼓勵更多的企業進行全球化,而翻譯技術將在未來起到不可或缺的作用。

三,文化全球化時代,NMT翻譯技術或將開啟第二次全球化浪潮

此前一輪的全球化浪潮主要在於工業的驅動,分工的經濟帶來了全球經濟旺盛的增長,但隨著基礎設施建立的完成,滿足了溫飽階段之後,文化需求開始增長,各國之間的文化交流也越來越密切。

在娛樂領域,我們看到近期火爆國內電影市場電影包括《神奇動物在哪裡》、《佩小姐的奇幻城堡》、《你的名字》等等,均來自國外。此外,像各種英劇、美劇、韓劇、二次元動漫也都是網民們非常樂於觀看的節目,有著極高的受眾。大量觀看影片的網民們,其實早就習慣了那些充滿英語、韓語、日語的世界,通過大量的觀影,網民們早就消除了對其他國家在文化上的陌生與隔閡感。

與此同時在新聞領域,今年英國脫歐事件、法國恐襲事件、美國川普當選事件、韓國樸槿惠閨蜜事件、也在國內各大新聞客戶端持續發酵,成為網民們熱議的焦點,熱度一點都不遜色於國內事件。

所以,現在不僅僅是經濟的全球化,而是一個文化正在全球化的時代,國內用戶有著與國外用戶交流的渴望,他們也開始越來越關心國外的文化娛樂、以及新聞事件,並且也越來越希望自己能夠在第一時間獲得國外大事件的信息,甚至是第一時間參與到對方的交流中。

但語言問題卻是繞不過去的障礙因素,而現在基於NMT的翻譯技術則讓機器翻譯上升到了一個全新的臺階,無論是百度,還是谷歌都在發力NMT翻譯技術,這對於全球化的交流來說是一件好事。

基於文化逐漸融合的現狀,彼此交流的渴望,未來也一定會出現各個跨國的,滿足各種需求的網站或者APP,例如可以有一個韓劇迷的網站或者APP,同時容納中韓兩國國民,可以由美劇的網站或者APP同時容納中美兩國的國民。本國民眾都只需要輸入自己國家的語言,而通過翻譯技術,在對方國家呈現出對方國家的語言,這一試想並非不可能,基於網際網路的NMT技術發展,這樣的一天或許就在不久後到來。

結語:

隨著網際網路的來臨、大數據的爆發,機器翻譯技術也迎來了自身的春天。而同時隨著文化的全球化時代的到來,機器翻譯將會在其中扮演一股不小的力量。

NMT機器翻譯作為當前最主流最有效的技術,或將開啟下一次的全球化浪潮。

作者微信公眾號:首席發言者(shouxifayanzhe)返回搜狐,查看更多

責任編輯:

相關焦點

  • 谷歌開放GNMT教程:如何使用TensorFlow構建自己的神經機器翻譯系統
    機器之心對該教程進行簡要的描述,跟詳細和精確的內容請查看項目原網站。GitHub 連結:https://github.com/tensorflow/nmt機器翻譯,即跨語言間的自動翻譯,是機器學習社區最活躍的研究領域。在機器翻譯的眾多方法中,序列到序列(sequence-to-sequence,seq2seq)模型 [1, 2] 近期獲得巨大成功。
  • 什麼是神經機器翻譯(NMT)?
    由於能夠一次翻譯整個句子,NMT的輸出可以類似於人工翻譯。隨著越來越多的企業走向全球化,NMT可能會對翻譯行業產生巨大影響。什麼是神經機器翻譯?NMT使用基於神經網絡的技術來實現更多上下文精確的翻譯,而不是一次翻譯一個單詞的破碎句子。
  • 資源| 史丹福大學NLP組開放神經機器翻譯代碼庫(附論文)
    選自斯坦福機器之心編譯參與:吳攀、杜夏德近日,史丹福大學自然語言處理組(Stanford NLP)發布了一篇文章,總結了該研究組在神經機器翻譯(NMT)上的研究信息。在這篇文章中,他們還放出了在多種翻譯任務上(比如英德翻譯和英語-捷克語翻譯)實現了當前最佳結果的代碼庫(codebase)。
  • 專欄| AI翻譯引進NMT技術,就能精準識別「語境」嗎?
    2016年,GNMT技術(谷歌的神經網絡機器翻譯技術,模仿人腦的神經思考模式)全面布局於谷歌翻譯系統中,隨後,谷歌聲稱其AI翻譯的譯文質量誤差降低了55%-85%,並且將此技術廣泛應用於網頁翻譯與手機應用。
  • 治癒全球化② | 全球化浪潮中的航向標:新加坡自貿港的經驗對海南...
    [11]二、新加坡自由貿易港為何在全球化浪潮中走向繁榮作為支撐全球航運物流體系的區域性關鍵節點,新加坡自由貿易港的發展和繁榮,是與全球化進程相互促進的結果。[19]可見,新加坡既具有執行力較強的國內治理體系,又能在稅收和商業等特定領域中秉持張弛有度的原則,在治理的技術層面體現出了很強的靈活性,將自由貿易港的運營,與整個國家的關鍵性戰略及政策聯繫在一起,從而為新加坡提供了強大的發展動力。新加坡自由貿易港的存在,不僅鞏固了新加坡在全球化進程中的關鍵地位,也豐富了全球治理的形式,在一定程度上實現了國家治理與港區治理、地區治理和全球治理的聯動共進。
  • 機器之心GMIS 2017圓滿落幕 聚焦前沿技術、產業落地及AI全球化
    為了實現這個目標,有三個簡單的方法:「第一點,機器人的目標就是使得人類的意願最大化的實現,就是說機器應該使得人類的意願得到滿意,而不是讓機器給我們創造一種讓人類感覺不舒適生活。第二點,機器人不知道什麼是價值,所以不要給機器有一個固定的價值系統。第三點,人類的行為給機器提供參考。」  對於未來人工智慧到底會走向何處?
  • 機器翻譯什麼時候能取代人工翻譯?知行翻譯公司認為不可能
    機器翻譯是通過計算機將一種自然語言(源語言)轉換成另一種自然語言(目標語言)的過程。它是計算語言學的一個分支,是人工智慧的終極目標之一,具有重要的科學研究價值。機器翻譯具有很大的實用價值。隨著經濟全球化和網際網路的迅速發展,機器翻譯技術在促進政治、經濟和文化交流方面發揮著越來越重要的作用。
  • 機器翻譯三大核心技術原理 | AI知識科普
    後處理模塊是將翻譯結果進行大小寫的轉化、建模單元進行拼接,特殊符號進行處理,使得翻譯結果更加符合人們的閱讀習慣。02曲折中前行的機器翻譯機器翻譯的故事始於1933年,從最開始的只是科學家腦海中一個大膽設想,到現在大規模的開始應用,機器翻譯技術的發展道路大概有6個階段。
  • 百度機器翻譯獲2015年度國家科技進步二等獎(圖)
    國家科學技術獎勵授予在各個領域實現重大技術突破、做出創造性貢獻的中國公民和組織,此前獲獎的「載人航天」、「探月工程」、「青藏鐵路」等成果舉世矚目、彪炳史冊。百度機器翻譯項目在大會上被授予國家科技進步獎,成為BAT中首個獲此獎項的企業。機器翻譯是人工智慧領域最難的課題之一。1947年,機器翻譯步入歷史舞臺,50年代機器翻譯研究持續升溫,美國、前蘇聯等國家均出現了研究熱潮。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    其中,作為自然語言處理領域頂級國際會議之一的 EMNLP 2017 將於今年 9 月在丹麥首都哥本哈根舉行,與此同時,第二屆機器翻譯大會(WMT 2017)將會作為本次會議的分論壇同時召開。今年的一大亮點是,WMT 首次增設了中文和英文間的新聞數據翻譯任務。
  • 有道nmt神經網絡_有道神經網絡翻譯(nmt) - CSDN
    不得不提,在機器翻譯進化史中,最具裡程碑式的突破之一就是谷歌翻譯在2016年推出的神經網絡翻譯(GNMT),相比於谷歌之前基於短語的機器翻譯(PBMT: Phrase-Based Machine Translation),GNMT所需要設計的工程量更少,同時翻譯效果更好,可見GNMT 的技術將把機器翻譯帶到一個全新的紀元。
  • 機器翻譯應用價值凸顯 百度翻譯豐富產品矩陣助力企業智能化升級
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。  會上,武連峰講到,企業具備全球化信息能力非常重要。機器翻譯作為有效增強全球化信息的能力,通過對文本、圖片、語音、文檔的翻譯,在開拓海外市場、提升客戶體驗、獲取海外洞察、支持公司策略等應用場景下都將為企業賦能。IDC數據顯示,到2021年底,超過70%具有海外業務的中國企業將不同程度的採用機器翻譯,應用場景也將更為豐富。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    IDC中國副總裁兼首席分析師武連峰、百度AI技術生態部總經理劉倩、百度人工智慧技術委員會主席何中軍進行主題演講,同時與在場的40多位來自金融、製造、能源等行業企業信息化負責人聚焦機器翻譯的價值、企業應用需求、未來發展趨勢等話題展開深入的互動討論,分享最佳實踐經驗,助力企業更好的提升機器翻譯大規模產業化應用,推動企業智能化升級。會上,武連峰講到,企業具備全球化信息能力非常重要。
  • 搶佔AI翻譯賽道,搜索平臺為何不約而同發力NMT?
    AI翻譯真的是塊肥肉嗎?為什麼要發力NMT?搜索公司在AI翻譯這個事上扎堆並不令人意外。2016年,GNMT技術(谷歌的神經網絡機器翻譯技術,模仿人腦的神經思考模式)全面布局於谷歌翻譯系統中,隨後,谷歌聲稱其AI翻譯的譯文質量誤差降低了55%-85%,並且將此技術廣泛應用於網頁翻譯與手機應用。
  • 機器翻譯能解放生產力嗎?
    我們都知道只有技術革命才能解放生產力。在翻譯領域裡,基於自然語言「神經網絡模型」的機器翻譯的出現,終於讓大家看到了顛覆性的技術。從中,大家看到「神經網絡」的革命性和未來性,內心中對這項技術有了些憧憬和疑問,也就有了如此疑問。我們不講總的機器翻譯歷史和時間軸事件,僅從應用角度到來看,軟體翻譯可以有三個階段。
  • 臺灣不能決定的三件事:地理位置、國際關係、全球化浪潮
    臺灣不能決定的第二件事是國際關係結構。國際政治,其實就是大國政治,小國所能發揮的角色相當有限。在亞太地區,過去美國是最主要的主導力量,現在大陸經濟與軍事實力快速崛起,已出現兩強抗衡的局面。近年來,歐巴馬屢屢提到再平衡的戰略,正是針對大陸崛起的策略調整。    前幾個月,歐巴馬訪問亞洲國家時,對主要盟國皆提出了再保證的承認,尤其在釣魚島問題上,對日本更是堅定支持。
  • 譯馬當先,空中傳譯開啟「人工+智能」多元翻譯新模式
    翻譯促進互通,空中傳譯秉承「人與人,無國界」的發展理念,致力於人工翻譯,在此基礎上融入人工智慧技術,將人與機器有效結合,最大程度上幫助企業跨越語言障礙。翻譯行業經歷了1979~1991年的萌芽階段、1992~2002年的成長階段、2003~2013年的發展階段,從2014年開始正式進入繁榮階段。
  • 微軟技術院士黃學東:以人為師,機器翻譯達人類專業水平
    今年是黃學東加入微軟的第25年,但這位微軟老將至今仍活躍在人工智慧領域科學研究的前線。2018年3月份,他帶領的團隊在機器翻譯領域拿下一項裡程碑式的成就:其研發的機器翻譯系統在通用新聞報導的newstest2017中譯英測試集上,達到了人工翻譯水平。這是首個在新聞報導的翻譯質量和準確率上媲美人工翻譯的翻譯系統。
  • 未來的世界:機器翻譯VS人工翻譯
    蔡基剛:在特定領域的機器翻譯替代人工翻譯是技術發展的必然趨勢,而且在醫學、生物、法律、航天、海事等專業領域裡的機器翻譯取代大部分人工翻譯將是最近幾年的事情。我認為,特定領域的機器翻譯替代人工翻譯是技術發展的必然趨勢,而且在醫學、生物、法律、航天、海事等專業領域裡的機器翻譯取代大部分人工翻譯將是最近幾年的事情。 一、機器翻譯的語境化 李長栓的文章之所以比較悲觀,原因之一是他在闡述和論證時基本上脫離了語境。
  • 亞馬遜開源神經機器翻譯框架Sockeye:基於Apache MXNet的NMT平臺
    隨著神經機器翻譯(NMT)技術的不斷演進,越來越多的科研機構和公司選擇開源自己的項目,讓更多人能夠開發出自己的 NMT 模型。此前,清華大學開源了神經機器翻譯工具包 THUMT,谷歌也推出了基於 TensorFlow 的 NMT 模型搭建教程。