火山翻譯力奪國際機器翻譯大賽五項冠軍

2020-12-18 中關村在線

     在11月下旬結束的自然語言處理頂級學術會議EMNLP2020上,國際機器翻譯大賽(WMT20)公布了賽事最終結果,來自字節跳動火山引擎旗下的火山翻譯(Volctrans)在39支參賽隊伍中殺出重圍,以顯著優勢在「中文-英語」語向翻譯項目上拿下了冠軍。

  此外,火山翻譯團隊還拿下了「德語 -英語」和「德語-法語」語向機器翻譯項目的冠軍,更斬獲了平行語料過濾對齊項目普什圖語和高棉語的兩項第一。

      39支隊伍角逐國際頂級機器翻譯大賽WMT

  國際機器翻譯大賽(WMT)由國際計算語言學協會 (ACL) 舉辦,是全球學術界公認的國際頂級機器翻譯比賽,也是各大科技公司、頂尖院校與學術機構展示自身機器翻譯實力的較量舞臺。

  自2006年至今,國際機器翻譯大賽(WMT)已經成功舉辦15屆,本屆比賽共有39支隊伍參賽,包括微軟、Facebook、Google DeepMind、騰訊、小牛翻譯、華為、滴滴等實力雄厚的參賽團隊。

  組委會根據中英、英中、英德等22個不同翻譯任務提供測試數據集,並引入科學的語言專家人工評估流程。每個參賽系統首先由多名經驗豐富的語言學家進行評估,然後對最終分數進行標準化加權,最後進行排名。整個評估過程歷時四個月,評價結果有非常高的置信度。

  語言專家評估得分第一 火山翻譯拿下「中文-英語」語向冠軍

  歷年比賽中,「中文-英語」語向的翻譯任務都是參賽隊伍最多、競爭最為激烈的機器翻譯任務之一,今年更勝往年。

  火山翻譯團隊參加了非受限場景的比賽,也就是在給定測試集的情況下,可以使用任何數據和方法探索翻譯效果極限的比賽方式,組織方也引入了四個權威的在線機器翻譯商業系統(Online-A、G、Z、B)作為對比,這也是最能體現翻譯團隊數據和算法綜合能力的場景。在人工評估中,火山翻譯團隊(Volctrans) 力壓群雄,以明顯的優勢奪得了冠軍。

(圖:WMT2020 中英翻譯前幾名系統得分。Ave.z代表人工評估標準化分數,也是目前機器翻譯最受認可的指標。)

  相比「中文-英語」,「德語-英語」在 WMT 比賽上是傳統項目,也是歐洲國家最關注的語向。在最後的人工評價中,火山翻譯依然表現出色,取得了第一名的成績。國際機器翻譯大賽組委會給出了很高的評價,「作為新的參與者,火山翻譯表現尤為出色(particularly well),超越了很多傳統隊伍」。

  復旦大學計算機學院教授、EMNLP2021大會程序主席黃萱菁表示:「WMT是非常硬核的比賽,火山翻譯取得了出色成績。火山翻譯的LightSeq、mRASP等技術讓人眼前一亮,機器翻譯有廣闊的發展空間,非常期待火山翻譯為機器翻譯的技術研究和產品應用探索更多可能性。」

  領先的背後:火山翻譯致力於打造前沿研究、產品研發和用戶反饋的閉環

  火山翻譯(Volctrans)是由字節跳動計算機研究科學家、工程師、產品經理、產品運營和語言專家組成的專業團隊研發,其基於自主研發的機器學習技術,積累了百億多種語言語料,已支持超過50個語種、2500個語對之間的互譯,翻譯效果和速度業界領先。

(圖:火山翻譯官網。可以通過 https://translate.volcengine.cn/ 體驗火山翻譯,並了解更多產品能力。)

  目前,火山翻譯具備文本翻譯、語音翻譯、圖像翻譯、語種識別四種能力,在辦公、娛樂、新聞等場景表現優異。

  基於這些能力,火山翻譯推出了一系列形態多樣的產品與服務,包括機器翻譯雲服務、智能視頻翻譯、智能同傳、翻譯瀏覽器插件等。此外,火山翻譯支持API、SDK、私有部署等多種接入方式,且支持垂直領域的快速模型定製,能夠滿足不同群體和不同行業的翻譯需求。

  在視頻翻譯場景,火山翻譯提供簡單高效的視頻「轉寫-打軸-翻譯」全流程服務,輕鬆聽譯、智能打軸、高效編輯、專業審校,集四大能力於一身,幫助創作者輕鬆高效地應對跨語言視頻創作。

  在語音翻譯領域,火山翻譯的智能同傳技術也表現卓越,能夠根據現場發言提供高品質、低延時的實時語音識別字幕結果,同時提供人工字幕保障方案,讓會議現場以及直播字幕更精準流暢。

  火山翻譯的技術來源於字節跳動團隊多年機器學習和自然語言處理領域的深耕。團隊擁有百餘項技術發明專利,在人工智慧頂級國際學術會議發表50餘篇學術論文。在機器翻譯技術上更是獨創了mRASP多語言預訓練算法,把幾十種語言語料融合在一起訓練,獲得的模型在具體語對上微調取得了44個語對的業界最佳性能,整體效果力壓Facebook研發的mBART方法。同時,火山翻譯研發的LUT和COSTT語音到文本翻譯算法,從語音輸入(例如英語)可以直接輸出目標語言文字(例如中文),減少了錯誤累積,在效果上取得了業界領先。

  字節跳動傑出科學家、人工智慧實驗室總監李磊稱:「火山翻譯核心優勢在打造前沿研究、產品研發和用戶反饋的閉環,研發團隊分布全世界多個國家,工作中也在使用自己打造的產品來跨語言溝通,在迭代中快速進步。」

  火山翻譯團隊還研發了多項機器翻譯前沿技術,目前已經集成到火山翻譯系列產品中,例如鏡像式生成模型MGNMT、CTNMT算法、交互式翻譯算法CAMIT、膠囊翻譯網絡、並行翻譯算法PNAT和GLAT等。火山翻譯還採用了自研的高性能序列推理引擎LightSeq,推理速度業界最快,比原生系統提高10倍,可以達到每秒兩萬詞的翻譯速度。

  李磊表示:「火山翻譯已經為飛書、今日頭條等多款海內外產品提供穩定和高質量的翻譯服務,每天處理數億次翻譯請求,為來自全球的過億用戶群體提供優質的翻譯體驗。未來,火山翻譯希望為更多用戶提供服務,幫助用戶更高效地實現國際信息無障礙交流。」

本文屬於原創文章,如若轉載,請註明來源:火山翻譯力奪國際機器翻譯大賽五項冠軍http://pad.zol.com.cn/757/7576629.html

pad.zol.com.cn true http://pad.zol.com.cn/757/7576629.html report 4386      在11月下旬結束的自然語言處理頂級學術會議EMNLP2020上,國際機器翻譯大賽(WMT20)公布了賽事最終結果,來自字節跳動火山引擎旗下的火山翻譯(Volctrans)在39支參賽隊伍中殺出重圍,以顯著優勢在「中文-英語」語向翻譯項目上拿下了冠軍。  此外,火...

相關焦點

  • 2020國際機器翻譯大賽:火山翻譯力奪五項冠軍
    在11月下旬結束的自然語言處理頂級學術會議EMNLP2020上,國際機器翻譯大賽(WMT20)公布了賽事最終結果,來自字節跳動火山引擎旗下的火山翻譯(Volctrans)在39支參賽隊伍中殺出重圍,以顯著優勢在「中文-英語」語向翻譯項目上拿下了冠軍。
  • 要聞 | 2020 國際機器翻譯評測比賽:中譯語通斬獲五項冠軍,奪冠數量全球居首
    2020 國際機器翻譯大賽(WMT 2020)公布了谷歌Deepmind、微軟、Facebook、騰訊、OPPO、字節跳動、中譯語通等全球38支參賽隊伍的人工專家評測成績
  • 搜狗擊敗訊飛阿里,獲IWSLT國際口語機器翻譯評測大賽冠軍
    )國際頂級口語機器翻譯評測大賽上,搜狗擊敗訊飛、阿里巴巴, APPTEK(美國應用科技公司)、AFRL(美國空軍研究實驗室)以及KIT(德國卡爾斯魯厄理工學院)等國際國內多個強勁對手,一舉奪得了2018年IWSLT大賽Baseline Model(基線模型)賽道冠軍,代表中國向世界彰顯了AI領域的技術硬實力!
  • 騰訊民漢翻譯徵戰全國機器翻譯大賽奪得雙冠
    導語 :一年一度的全國機器翻譯大賽(CCMT 2019)於7月20日公布了比賽結果,來自TEG的騰訊民漢翻譯團隊自去年拿下英漢翻譯冠軍之後
  • WMT2017國際翻譯大賽,搜狗獲得中英/英中翻譯雙向冠軍
    語音翻譯,無疑是一個很好的突破口。擁有深度學習算法的加成,人工智慧讓機器學習變得更加「聰明」,足以打破語言文化的交流壁壘。從這一點來看,中國的科技公司已是佔據了領先地位。擁有語音技術積累的搜狗知音,在前幾天的WMT 2017國際評測中,獲得中英和英中翻譯雙向冠軍,機器翻譯的準確率和速度震動了整個業界。搜狗,已經跑在了人工智慧隊伍的前列。
  • WMT國際機器翻譯大賽結果流出,微信AI拔得頭籌
    作為全球學術界最具權威的機器翻譯比賽,近日,WMT2020國際機器翻譯大賽的榜單停止提交結果並發布排名,其中騰訊微信AI團隊在「中文-英文」翻譯任務上奪得冠軍。提交結果BLEU評分第一,微信AI斬獲中英翻譯方向冠軍WMT 是機器翻譯領域的國際頂級評測比賽之一,自2006年創辦至今,WMT已經成功舉辦15屆。
  • 「最權威」國際機器翻譯大賽結果出爐 微信AI拔得頭籌
    讀創/深圳商報記者 陳姝被譽為「全球學術界最具權威的機器翻譯比賽」的WMT2020國際機器翻譯大賽的榜單停止提交結果並發布排名,騰訊微信AI團隊在「中文-英文」翻譯任務上奪得冠軍。WMT 是機器翻譯領域的國際頂級評測比賽之一,自2006年創辦至今,WMT已經成功舉辦15屆。大賽每年都吸引了眾多來自全球的企業、科研機構和高校所組成的頂尖團隊。在賽制上,組委會根據中英、英中、中日等不同翻譯任務提供測試集,參賽者在線提交機器翻譯結果,組委會將根據在國際上具有廣泛認可度的BLEU自動評估指標對參賽者提交的機器譯文和標準答案進行擬合計算,擬合程度高者排在前面。
  • MT國際機器翻譯大賽結果流出 微信AI在中英方向拔得頭籌
    【TechWeb】7月7日消息,近日,WMT2020國際機器翻譯大賽的榜單停止提交結果並發布排名,其中騰訊微信AI團隊在「中文-英文」翻譯任務上奪得冠軍。WMT是機器翻譯領域的國際頂級評測比賽之一,自2006年創辦至今,WMT已經成功舉辦15屆。大賽每年都吸引了眾多來自全球的企業、科研機構和高校所組成的頂尖團隊,包括微軟、Facebook、百度、金山、日本情報通信研究機構(NICT)。
  • 2018機器翻譯大賽 金山團隊奪冠
    評測方使用機器翻譯的客觀考核指標(BLEU、NIST、TER)來評分,其中BLEU是最主要的評估指標。在今年的比賽中,數據總量達到1300萬句對,且其中具有上下文情景的中英雙語數據達到300萬句對,相比去年大幅擴充。來自金山AI Lab的其中一致參賽團隊,以客觀成績領先其他對手3個BLEU值,答辯成績超過其他團隊30分的優異成績獲得冠軍;另一支參賽團隊則以較高的優勢獲得亞軍。
  • 斬獲WMT2020國際機器翻譯大賽中英方向第一名
    來源:經濟日報-中國經濟網經濟日報-中國經濟網北京7月9日訊 作為全球學術界最具權威的機器翻譯比賽,近日,WMT2020國際機器翻譯大賽的榜單停止提交結果並發布排名,其中騰訊微信AI團隊在「中文-英文」翻譯任務上奪得冠軍。
  • 百度機器翻譯團隊獲得WMT2019中英翻譯冠軍
    8月1日,WMT2019國際機器翻譯大賽研討會在義大利佛羅倫斯召開。本屆大賽,百度機器翻譯團隊在中文-英文翻譯任務上獲得冠軍。圖1 人工評價結果WMT全稱是Workshop on Machine Translation,是業界公認的國際頂級機器翻譯比賽之一,其中中文-英文翻譯任務是歷年參賽隊伍最多、競爭最為激烈的機器翻譯任務之一。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    其中,作為自然語言處理領域頂級國際會議之一的 EMNLP 2017 將於今年 9 月在丹麥首都哥本哈根舉行,與此同時,第二屆機器翻譯大會(WMT 2017)將會作為本次會議的分論壇同時召開。今年的一大亮點是,WMT 首次增設了中文和英文間的新聞數據翻譯任務。
  • 機器翻譯能達60個語種3000個方向,近日又奪全球五冠,這家牛企是誰?
    2020國際機器翻譯評測比賽結束,來自中國的中譯語通科技股份有限公司展現出機器翻譯領域的領先實力。其參賽6個語言方向,在高棉語-英語、英語-高棉語、普什圖語-英語、英語-普什圖語、泰米爾語-英語等5個語言方向上獲得冠軍,在英語-泰米爾語方向位居第二,奪冠數量全球居首。 國際機器翻譯大賽(WMT)由國際計算語言學協會 (ACL)主辦,是全球學術界公認的規模最大的國際頂級機器翻譯評測比賽之一,自2006年以來,已連續舉辦15屆。
  • │第三屆全國機器翻譯與譯後編輯大賽西安翻譯學院學生獲優勝獎
    近年來迅速崛起的神經網絡機器翻譯在大幅提升翻譯效率的同時,也不斷讓我們探索新的翻譯形態。利用機器翻譯與譯後編輯的翻譯模式可以極大提升翻譯效率,實現翻譯項目在時間、質量與成本的最佳平衡。相較於往屆大賽模式,本屆大賽創新性地引入了交互翻譯模式。
  • PPO斬獲CCMT全國機器翻譯6項第一,沒想到OPPO這麼強
    10月10日-12日,2020全國機器翻譯大會(CCMT)於線上召開。此次大會吸引了國內外20多支團隊參賽,競爭激烈。令人驚喜的是,OPPO在此次大賽中大放異彩,其參與了6條翻譯賽道的比賽,就斬獲了6項第一、1項第二的優異成績。
  • 人間正道是滄桑 ——騰訊TranSmart第三屆全國機器翻譯與譯後編輯大賽頒獎典禮
    她指出本項賽事以機器翻譯與譯後編輯為主題,正是外語人、譯界學人對科技變局的積極的有效的應對。吳院長期待未來各位同仁繼續通力合作,傳播翻譯技術,普及機器翻譯和譯後編輯知識,培養更多的優秀翻譯人才。    上海一者科技有限公司為此次MTPE大賽的承辦方之一。
  • 機器翻譯大賽一等獎並非偶然,OPPO這項翻譯技術早就用了
    前幾天全國機器翻譯大會在線上召開,離線任務的評測結果也已經一一公布。大會吸引了包括OPPO、騰訊、同花順、清華大學、北京理工大學、南京大學等,共計20多個隊伍參加。而在諸多參與大會的知名企業和高校中,國內一線手機品牌OPPO取得的成績非常不錯。
  • 人工智慧翻譯大比拼 有道翻譯戰勝谷歌奪得冠軍
    在其中的人工智慧翻譯大賽中,谷歌翻譯、有道翻譯官、搜狗翻譯三款翻譯軟體同臺競技,實測翻譯效果。最終,有道翻譯官憑藉著突出的對話翻譯和拍照翻譯功能,以及幾乎無短板的優勢,在比賽中拔得頭籌。最終,憑藉在對話翻譯、拍照翻譯中的出色表現,有道翻譯官奪得此次人工智慧翻譯大賽冠軍。而現場的不少觀眾也被比賽過程中各種精準的翻譯結果所折服,紛紛表示「簡直碾壓了我四級英語水平。」
  • 機器翻譯什麼時候能取代人工翻譯?知行翻譯公司認為不可能
    所謂機器翻譯,就是利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程。它是計算語言學的一個分支,是人工智慧的終極目標之一,具有重要的科學研究價值。而且機器翻譯又具有重要的實用價值。
  • 第三十二屆韓素音國際翻譯大賽
    2020年第三十二屆韓素音國際翻譯大賽由中國翻譯協會、四川外國語大學聯合主辦,《中國翻譯》編輯部與四川外國語大學翻譯學院聯合承辦。競賽原文見中國翻譯協會官網(www.tac-online.org.cn)「韓素音國際翻譯大賽」專欄第三十二屆中刊登的內容(點擊進入專欄)。