全國首創!陽光學院打造「語用神經網絡機器翻譯」系統

2020-12-19 教育信息速報

中國網海峽訊 隨意打開一個英文網頁,複製相關內容到「語用神經網絡機器翻譯」系統裡,不一會兒就能準確翻譯出中文,而且詞語和語法邏輯均順暢可讀…

近日,在陽光學院外國語與海外教育學院召開的「語料庫與語用神經網絡機器翻譯研究」專家論證會上,陽光學院「語言與智能研究團隊」演示了該系統的操作,由該團隊自主打造的「語用神經網絡機器翻譯」系統得到了與會專家的高度評價。

與會專家表示:「該系統在國內傳統語言學學界是首創,對處理專業性大批量快速翻譯項目等具有實踐應用和推廣價值」。

「語用神經網絡機器翻譯」系統操作頁面

此次會議邀請到世界500強企業翻譯技術開發與管理的權威專家、全國唯一以翻譯類業務為主的上市公司高管及985高校的機器翻譯業界專家到會進行成果鑑定,專家們認為,陽光學院「語言與智能研究團隊」已具備快速開發專業語料庫的經驗和能力,所開發的系統可在線推廣和應用。

據了解,由外國語與海外教育學院院長趙會軍博士帶領的陽光學院「語言與智能研究團隊」經過近六年的時間,共搜集和建立了8000多萬行英漢平行語料庫,試圖從語言學角度揭開神經網絡機器翻譯神秘「黑箱」的面紗,自主打造的「語用神經網絡機器翻譯」系統為語言學界在面向機器翻譯的語料和語言學理論及實證研究提供了平臺。該成果獲得「教育部人文社會科學規劃研究一般項目」、「福建省中青年教育科研項目」和福州市「智能翻譯教學與研究實驗室建設項目」的資助。在研究過程中,發表了語料庫和機器翻譯相關的 CSSCI 和 EI 等論文 7 篇。相關研究成果對語言學研究和從語言學角度研究機器翻譯具有很好的理論價值。

趙會軍和團隊在測試系統

有別於市面現有的神經網絡機器翻譯系統,該採用了語境關聯算法,將語用學原理融入神經網絡機器翻譯系統的詞向量算法中,強調句子之間、詞語之間的邏輯關係和語義關聯。讓絕大多數句子不僅能夠做到意思表達正確,通順可讀,還能在多義詞精準選詞方面具有良好效果。趙會軍表示,「未來外語學科的發展已經不單純是考驗語言學習和使用能力,而是要結合機器翻譯及現代智能語言技術才能有所發展。從翻譯界來說,機器翻譯的利用率很高,大部分的翻譯工作者都會或多或少地利用機器翻譯來輔助工作。因此,『語用神經網絡機器翻譯』系統的研發成功符合了這種發展趨勢。」

未來已至,如何讓外語學科向應用型轉型,外國語與海外教育學院先行從機器翻譯領域進行了深入探索。2018年,該學院緊跟時代步伐,更新翻譯崗位培養方案,結合機器翻譯和語料庫前沿技術發展,設置翻譯技術方向的相關課程3門。近年來,外國語與海外教育學院陸續成立語言智能研究所、「語料庫翻譯工作室」,建立了語言智能研發團隊。在教師的帶領下,學生們能夠接觸最前沿的翻譯技術,參與語料庫的開發和應用,在學校裡就能體驗真實的工作場景,將極大促進陽光學院的語言智能教學、工科智能教學。

此外,除了日常運用,「語用神經網絡機器翻譯」系統還將服務於高新技術企業及相關國際化大企業。「我們選擇從專業的航空發動機研究領域入手,建立了4萬多行的英漢雙語語料庫,目前已完成該領域的翻譯實驗,無論從精準性、專業性,還是邏輯性方面都已經達到可直接應用的程度。」趙會軍表示,學院即將和幾家相關領域的單位進行產學研合作,未來如果能在合作領域有所突破,還將產生一定的經濟效應。

【來源:海峽風】

聲明:轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯繫,我們將及時更正、刪除,謝謝。 郵箱地址:newmedia@xxcb.cn

相關焦點

  • 新譯科技:混合神經網絡算法使智能機器翻譯實現顛覆性突破
    新譯科技:混合神經網絡算法使智能機器翻譯實現顛覆性突破時間:2017-05-19 14:09   來源:中華網   責任編輯:青青 川北在線核心提示:原標題:新譯科技:混合神經網絡算法使智能機器翻譯實現顛覆性突破 在智能化的今天,傳統語言翻譯迎來智能化浪潮。
  • Google發布神經網絡機器翻譯系統:支持中英
    基於短語的機器學習會將輸入句子分解成詞和短語,然後對其中的大部分進行獨立翻譯。神經網絡機器翻譯則將整個輸入句子視作翻譯的基本單元,優點是所需調整更少,很快就在中等規模的公共基準數據集上達到了與基於短語的翻譯系統不相上下的準確度。
  • 深度神經網絡機器翻譯
    今天有時間和大家一起討論下下, 深度神經網絡機器翻譯。前言2016年年底, Google公布了神經網絡機器翻譯(GNMT), 從此宣告, 機器翻譯經過27年左右, 正式從1989年的IBM機器翻譯模型(PBMT,基於短語的機器翻譯),過渡到了神經網絡機器翻譯模型。已經極大接近了普通人的翻譯了。
  • 微軟神經網絡翻譯升級 增加丹麥語、荷蘭語等10種新語言支持
    原標題:微軟神經網絡翻譯升級:增加10種新語言支持   IT之家11月17日消息 一年前,微軟宣布,神經網絡正在為Microsoft Translator提供支持,微軟還為開發者提供了支持神經網絡翻譯的Microsoft Translator Text and
  • 谷歌翻譯啟用全新神經網絡機器翻譯支持印地語、俄國和越南語
    《谷歌翻譯啟用全新神經網絡機器翻譯支持印地語、俄國和越南語》文章已經歸檔,不再展示相關內容,編輯建議你查看最新於此相關的內容:牽手Google,王雪紅意欲成就HTC再次起飛HTC與Google籤署戰略合作協議的消息傳出後
  • 深度:回顧Google神經網絡機器翻譯上線歷程
    Google Translate作為久負盛名的機器翻譯產品,推出10年以來,支持103種語言,一直作為業界的標杆。而在前不久,Google官方對翻譯進行一次脫胎換骨的升級——將全產品線的翻譯算法換成了基於神經網絡的機器翻譯系統(Nueural Machine Translation,)。
  • 機器翻譯七十年:百度領跑神經網絡翻譯時代
    中新網12月22日電 機器翻譯距今已有70年的發展歷史。自上世紀40年代起,基於規則、實例以及統計的機器翻譯方法漸次登場,各領風騷。近兩年,神經網絡機器翻譯(Neural Machine Translation, NMT)技術異軍突起,取得了翻譯質量的大幅躍升。
  • Transformer新型神經網絡在機器翻譯中的應用|公開課筆記
    如左圖所示,我們輸入一個待翻譯的句子,通過神經網絡編碼器,去把這個句子的信息編碼成中間狀態,就是這個圖中紅色的部分,它用數值的隱層來表示。經過中間狀態、經過神經網絡解碼器去生成對應的翻譯,是編碼、解碼的過程。翻譯的知識和參數都是由神經網絡自動進行學習的,它省去了之前傳統方法之前的人工幹預模塊,使整個翻譯過程統一化,並且簡潔。
  • 谷歌的神經翻譯系統意味著機器翻譯到盡頭了?
    整個的報告以機器翻譯為主線展開,大概分四部分:第一叫做機器翻譯的波瀾史,幾十年的發展一波三折,非常有意思;第二是機器翻譯現在主流的技術神經機器翻譯,還是可以改進的。我可以給大家看一些例子,並不是谷歌就做到頭了,還有很多的空間。
  • 如何評價Google神經機器翻譯(GNMT)系統?
    幾年前,Google開始使用循環神經網絡來直接學習一個輸入序列(如一種語言的一個句子)到一個輸出序列(另一種語言的同一個句子)的映射。其中基於短語的機器學習(PBMT)將輸入句子分解成詞和短語,然後對它們的大部分進行獨立翻譯,而神經網絡機器翻譯(NMT)則將整個輸入句子視作翻譯的基本單元。
  • 神經網絡機器翻譯技術及應用(下)
    何中軍,百度機器翻譯技術負責人。本文根據作者2018年12月在全球架構師峰會上的特邀報告整理而成。神經網絡機器翻譯技術及應用(上)篇,我們為大家介紹了神經網絡機器翻譯的基本原理和挑戰,(下)篇繼續為大家講述機器翻譯的應用與未來。
  • 英漢翻譯so easy!谷歌發布神經網絡翻譯系統
    谷歌發布神經網絡翻譯系統 Google今天宣布發布Google神經網路機器翻譯系統(Google Neural Machine Translation),簡稱GNMT,使用當前最先進的訓練技術,能夠實現到迄今為止機器翻譯質量的最大提升。
  • 谷歌用神經機器系統把漢語翻譯成英語 錯誤率最高下降85%
    新浪科技訊 北京時間9月28日上午消息,谷歌今天宣布,網絡和移動版的谷歌翻譯現在使用新的神經機器翻譯系統,並用於漢譯英,目前,谷歌翻譯應用每天翻譯約1800萬次。谷歌也在發布一篇關於該方法的學術論文。 此前谷歌也曾表示在谷歌翻譯中使用神經網絡,但具體用於實時視頻翻譯功能。
  • 微軟Skype Translator用深層神經網絡提高機器語音翻譯質量
    Skype Translator與人腦一樣,會隨著數據輸入的不斷增多而變得越來越智能。Skype擁有32種語言版本,是全球增長最快的語音交流服務工具之一。Skype每個月有3億活躍用戶,可產生數萬億分鐘的對話,是機器翻譯最為理想的「實驗田」。
  • 微軟神經網絡翻譯升級:增加10種新語言支持
    一年前,微軟宣布,神經網絡正在為Microsoft Translator提供支持,微軟還為開發者提供了支持神經網絡翻譯的Microsoft Translator Text and Speech API。
  • 微軟提出新型通用神經機器翻譯方法,挑戰低資源語言翻譯問題
    數百萬人使用在線翻譯系統和移動應用進行跨越語言障礙的交流。在近幾年深度學習的浪潮中,機器翻譯取得了快速進步。微軟研究院近期實現了機器翻譯的歷史性裡程碑——新聞文章中英翻譯達到人類水平。這一當前最優方法是一個神經機器翻譯(NMT)系統,該系統使用了數千萬新聞領域的平行句子作為訓練數據。
  • 谷歌翻譯高勤:神經網絡技術將主導機器翻譯的未來
    谷歌翻譯研發科學家高勤  中國網科技7月11日訊 谷歌翻譯研發科學家高勤在今天舉行的中國網際網路大會上介紹稱,谷歌翻譯在神經網絡機器翻譯技術上已經取得重要進展,並同時對機器翻譯技術在未來當中實際應用。他表示:「神經網絡機器翻譯和非專業人工翻譯已經相當接近,對於中英文互譯也取得最大提升。」  高勤在大會上稱,神經網絡翻譯技術與傳統翻譯技術有很大不同。傳統機器翻譯技術是基於短語統計機器翻譯拼圖過程,嘗試找出較好翻譯選項,而神經網絡機器學習屬於利用雲語言與目標語言信息,使整各翻譯過程變得連續且完整。
  • 谷歌的神經翻譯系統並不意味著機器翻譯到頭了,還有大把創新可做|...
    此次在北京舉辦的MIFS 2016是由中國人工智慧學會、中國工程院戰略諮詢中心主辦,今日頭條、IEEE《計算科學評論》協辦的2016機器智能前沿論壇,這次論壇同時也是2016 BYTE CUP國際機器學習競賽的頒獎儀式。在MIFS 2016上,孫教授的演講回顧了機器翻譯波折的發展歷程,同時分享了在神經翻譯系統之後他們在提升機器翻譯上的實踐。
  • 號稱地表最強的神經機器翻譯,為什麼還是差強人意?
    14年到16年,機器翻譯領域可以說是翻天覆地。這期間發生的大事,是以神經網絡作為基礎的機器翻譯,開始在全面超越此前以統計模型為基礎的統計機器翻譯(SMT),並快速成為在線翻譯系統的主流標配。在這場革命之後,機器翻譯徹底進入了Neural Machine Translation,即NWT神經機器翻譯時代。很多人為此歡欣鼓舞。
  • 挑戰CET6翻譯考試的機器翻譯系統
    說它特殊,是因為「考生」只有一個,而且是一套機器翻譯系統。考題來自三天前剛結束的大學英語六級(CET6)考試,評分的是兩位具有六級閱卷經驗的高校資深專家。「考生」一口氣做了三道翻譯題,每道題滿分15分,它得到13分的均分,每題用時只有5秒。「這套機器翻譯系統的表現讓我們驚喜,翻譯得很地道。」對於成績,專家的鑑定是:優秀!