全國首創!陽光學院打造「語用神經網絡機器翻譯」系統

2020-12-17 中國教育在線

  中國教育在線訊 隨意打開一個英文網頁,複製相關內容到「語用神經網絡機器翻譯」系統裡,不一會兒就能準確翻譯出中文,而且詞語和語法邏輯均順暢可讀。近日,在陽光學院外國語與海外教育學院召開的「語料庫與語用神經網絡機器翻譯研究」專家論證會上,陽光學院「語言與智能研究團隊」演示了該系統的操作,由該團隊自主打造的「語用神經網絡機器翻譯」系統得到了與會專家的高度評價。與會專家表示:「該系統在國內傳統語言學學界是首創,對處理專業性大批量快速翻譯項目等具有實踐應用和推廣價值」。


  「語用神經網絡機器翻譯」系統操作頁面

  此次會議邀請到世界500強企業翻譯技術開發與管理的權威專家、全國唯一以翻譯類業務為主的上市公司高管及985高校的機器翻譯業界專家到會進行成果鑑定,專家們認為,陽光學院「語言與智能研究團隊」已具備快速開發專業語料庫的經驗和能力,所開發的系統可在線推廣和應用。

  據了解,由外國語與海外教育學院院長趙會軍博士帶領的陽光學院「語言與智能研究團隊」經過近六年的時間,共搜集和建立了8000多萬行英漢平行語料庫,試圖從語言學角度揭開神經網絡機器翻譯神秘「黑箱」的面紗,自主打造的「語用神經網絡機器翻譯」系統為語言學界在面向機器翻譯的語料和語言學理論及實證研究提供了平臺。該成果獲得「教育部人文社會科學規劃研究一般項目」、「福建省中青年教育科研項目」和福州市「智能翻譯教學與研究實驗室建設項目」的資助。在研究過程中,發表了語料庫和機器翻譯相關的 CSSCI 和 EI 等論文 7 篇。相關研究成果對語言學研究和從語言學角度研究機器翻譯具有很好的理論價值。

  趙會軍和團隊在測試系統

  有別於市面現有的神經網絡機器翻譯系統,該採用了語境關聯算法,將語用學原理融入神經網絡機器翻譯系統的詞向量算法中,強調句子之間、詞語之間的邏輯關係和語義關聯。讓絕大多數句子不僅能夠做到意思表達正確,通順可讀,還能在多義詞精準選詞方面具有良好效果。趙會軍表示,「未來外語學科的發展已經不單純是考驗語言學習和使用能力,而是要結合機器翻譯及現代智能語言技術才能有所發展。從翻譯界來說,機器翻譯的利用率很高,大部分的翻譯工作者都會或多或少地利用機器翻譯來輔助工作。因此,『語用神經網絡機器翻譯』系統的研發成功符合了這種發展趨勢。」

  未來已至,如何讓外語學科向應用型轉型,外國語與海外教育學院先行從機器翻譯領域進行了深入探索。2018年,該學院緊跟時代步伐,更新翻譯崗位培養方案,結合機器翻譯和語料庫前沿技術發展,設置翻譯技術方向的相關課程3門。近年來,外國語與海外教育學院陸續成立語言智能研究所、「語料庫翻譯工作室」,建立了語言智能研發團隊。在教師的帶領下,學生們能夠接觸最前沿的翻譯技術,參與語料庫的開發和應用,在學校裡就能體驗真實的工作場景,將極大促進陽光學院的語言智能教學、工科智能教學。

  此外,除了日常運用,「語用神經網絡機器翻譯」系統還將服務於高新技術企業及相關國際化大企業。「我們選擇從專業的航空發動機研究領域入手,建立了4萬多行的英漢雙語語料庫,目前已完成該領域的翻譯實驗,無論從精準性、專業性,還是邏輯性方面都已經達到可直接應用的程度。」趙會軍表示,學院即將和幾家相關領域的單位進行產學研合作,未來如果能在合作領域有所突破,還將產生一定的經濟效應。

相關焦點

  • 機器翻譯七十年:百度領跑神經網絡翻譯時代
    中新網12月22日電 機器翻譯距今已有70年的發展歷史。自上世紀40年代起,基於規則、實例以及統計的機器翻譯方法漸次登場,各領風騷。近兩年,神經網絡機器翻譯(Neural Machine Translation, NMT)技術異軍突起,取得了翻譯質量的大幅躍升。
  • Transformer新型神經網絡在機器翻譯中的應用|公開課筆記
    如左圖所示,我們輸入一個待翻譯的句子,通過神經網絡編碼器,去把這個句子的信息編碼成中間狀態,就是這個圖中紅色的部分,它用數值的隱層來表示。經過中間狀態、經過神經網絡解碼器去生成對應的翻譯,是編碼、解碼的過程。翻譯的知識和參數都是由神經網絡自動進行學習的,它省去了之前傳統方法之前的人工幹預模塊,使整個翻譯過程統一化,並且簡潔。
  • 將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」
    過去幾年,機器智能的快速發展已經給我們的語音識別和圖像識別能力帶來了巨大的提升,但改進機器翻譯仍然是一個高難度的目標。而隨著眾多公司對神經機器翻譯的研究,我們已經階段性的解決了機器翻譯問題。神經網絡機器翻譯技術成為人工智慧翻譯主流。該技術通過「端到端」的方法將翻譯平行語料進行映射,以「編碼器—注意力機制—解碼器」的結構來解決翻譯問題。
  • 專欄| 神經符號系統:讓機器善解人意
    關於理解或者語義,我們不得不採取了下面兩種耍賴式的定義來刻畫它們的不同側面:語義是特定語境下的語用,也就是說一句話的功效才是對它含義的最終表徵;理解一個語言對象(如一段話),等價於可以回答關於這個對象的所有問題。不幸的是,這兩個定義都不具有完全的可操作性,也就是說,很難用這個定義來自動化地衡量對語義的映射是否準確,或者理解是否恰當。
  • 百度何中軍:機器翻譯——從設想到大規模應用
    承辦單位為中國科學院大學學生會,協辦單位為中國科學院計算所研究生會、網絡中心研究生會、人工智慧學院學生會、化學工程學院學生會、公共政策與管理學院學生會、微電子學院學生會。2020年6月20日,第16期「AI未來說·青年學術論壇」NLP前沿技術及產業化線上專場論壇以「線上平臺直播+微信社群圖文直播」形式舉行。百度何中軍帶來報告《機器翻譯 —— 從設想到大規模應用》。
  • OPPO榮獲全國機器翻譯大賽多項第一名
    如今我們不管是工作中還是生活中,遇到需要翻譯的機會是越來越多了,而伴隨著科技發展,手機當仁不讓地充當了我們的「翻譯老師」。目前大部分手機都支持翻譯功能,究竟哪家的實力更突出一些?2020年全國機器翻譯大會評選結果或許能給出答案。
  • 這幾款東南亞語翻譯系統助您暢聽東南亞
    10月13日,《暢聽東南亞》節目來了一位特別的嘉賓,他是雲南省第五屆「興滇人才獎」獲得者,他是小語種語言信息處理人工智慧領域的開拓者,他帶領團隊創建了漢語—東南亞語言大規模語料庫,研發了東南亞五國語言分析平臺和漢語東南亞語神經機器翻譯系統,填補了小語種信息處理研究空白。他就是昆明理工大學信息工程與自動化學院院長餘正濤。
  • 機器翻譯簡史:八十多年來,人類就是要再造一座通天塔
    用這種方法,建立三種語言和中介語之間的轉換規則,就可以完成這三種語言之間的互相翻譯,而如果用基於轉換的方法,就需要為這三種語言兩兩建立規則。看起來很美對吧?總有現實來打臉。創造這種通用的中介語是非常難的,科學家們前赴後繼貢獻一生,也沒能成功。不過他們為後世留下了形態、句法甚至語義層面的表示方法。
  • 美國一學校發表一篇機器翻譯算法論文報告 顯示可解碼神經活動並將...
    打開APP 美國一學校發表一篇機器翻譯算法論文報告 顯示可解碼神經活動並將其翻譯為句子 城池 發表於 2020-03-31 14:01:28
  • 百度機器翻譯團隊獲得WMT2019中英翻譯冠軍
    接下來將從數據預處理、翻譯模型改進、訓練數據增強、模型集成和重排序等方面介紹百度翻譯團隊的參賽系統。一、數據處理神經網絡翻譯模型對訓練數據尤為敏感,不僅要求數據規模大,還要求數據質量高。因此,數據處理對於提升翻譯質量至關重要。
  • 百分點認知智能實驗室出品:機器翻譯是如何煉成的(下)
    按在「機器翻譯是如何煉成的(上)」的文章中,我們回顧了機器翻譯的發展史。在本篇文章中,我們將分享機器翻譯系統的理論算法和技術實踐,講解神經機器翻譯具體是如何煉成的。讀完本文,您將了解:· 神經機器翻譯模型如何進化並發展成令NLP研究者萬眾矚目的Transformer模型;· 基於Transformer模型,我們如何打造工業級的神經機器翻譯系統。
  • 落地機器翻譯服務,Atman推出TransGod翻譯工具
    Atman 成立於2016年年中,團隊早期成員主要來自微軟亞研院和微軟搜索技術中心,主要提供基於深度學習的神經網絡機器翻譯服務。Atman採用了目前國際上普遍認可的基於深度學習的神經網絡機器翻譯算法,這一算法目前已經被Google、Facebook、有道、搜狗等公司採用,並提升了翻譯的效果。
  • 機器翻譯革命強勢來襲 人類翻譯將無路可走?
    人工智慧推波助瀾全球知名翻譯公司「一小時翻譯」執行長奧弗·紹尚日前警告說,未來1至3年內,基於神經網絡翻譯技術的機器翻譯將會承擔價值400億美元翻譯市場上的近一半工作,預計會導致50萬名翻譯失業。神經機器翻譯(NMT)自2014年在科學論文中首次被提及以來,已使機器翻譯領域出現翻天覆地的變化,它開始全面超越以統計模型為基礎的統計機器翻譯(SMT),快速成為在線翻譯系統的主流標配。神經機器翻譯的「神經元」可以學習和收集信息,模仿人類大腦的神經元建立聯繫。
  • 親測|Google翻譯內核升級:大型數據集神經機器翻譯加持 稱誤差再降...
    據Google官方提供的數據顯示,Google翻譯搭載的Google的神經機器翻譯(GNMT:Google Neural Machine Translation)系統使用了當前最先進的訓練技術,因而提升了機器翻譯水平,將翻譯誤差再度降低了55%-85%。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。(IDC中國副總裁兼首席分析師武連峰)隨著企業業務和生態系統不斷向全球不同區域擴展,未來機器翻譯將成為剛需。
  • 我校英文學院學生胡婷婷在「第三屆全國機器翻譯與譯後編輯大賽...
    喜獲佳績 2020年7月18日,騰訊TranSmart第三屆全國機器翻譯與譯後編輯大賽雲端頒獎典禮隆重舉行,我校英文學院英語專業學生胡婷婷在此次大賽中榮獲優勝獎。
  • 重磅| 谷歌大腦養成記:從識別貓到突破性機器翻譯
    想像不到的實習生Dean 說,在谷歌大腦誕生的一兩年左右,該部門在開發一歲兒童智能水平的機器上取得非常好的結果。其語音識別團隊將他們的舊系統和神經網絡結合了起來,實現了近 20 年來最好的提升。他們的系統的物體識別能力也提升了一個數量級。這並不是因為谷歌在這一年突然想出了什麼突破性的方法,而是谷歌開始向其中投入更為顯著的資源和人才。
  • 你的定製版「谷歌」機器翻譯體系
    建立在深度學習基礎上的新翻譯系統,取代了語言學家數十年統計研究而建立的舊系統。像谷歌翻譯這樣的流行翻譯產品從內部結構發生改變,用新的深度學習模式取代了原來的代碼。依靠神經網絡的文本翻譯我們翻譯系統的核心是神經網絡,它能接受句子並輸出該句的翻譯。我以前寫過關於機器翻譯系統的歷史,以及我們如何使用神經網絡來翻譯文本的文章,在這裡摘取概要:神經翻譯系統實際上是兩個神經網絡端到端相互連接。
  • 為什麼韓漫秀的網站用不了了
    中科凡語依託中科院自動化所在人工智慧、自然語言處理和機器翻譯等斻؝�的深厚積累,推出的「飛譯CAT平臺」高效的解決了人工智慧在跨語言、跨領域信息分析處理和語言翻譯斻؝�存在的諸多問題,契合了市場的需求。 近日,由中國科學院自動化研究所和北�¶中科凡語科技有限公司共同主辦的「2020語言AI學術論壇暨凡語AI研究院成立儀式」在北�¶落幕。
  • 百度入圍Gartner全球AI翻譯服務代表企業 打造企業智能升級新引擎
    、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。多年的技術積累,讓百度能夠面向消費者直接提供跨網頁和APP的AI翻譯產品,面向企業和開發者百度提供公有雲和私有部署的AI翻譯服務,以滿足用戶不同場景的應用需求,一直發揮著智能化升級的先頭兵角色。 百度AI翻譯還打造了自己獨特的競爭優勢。