2020國際機器翻譯大賽:火山翻譯力奪五項冠軍

2020-12-01 比特網

  在11月下旬結束的自然語言處理頂級學術會議EMNLP2020上,國際機器翻譯大賽(WMT20)公布了賽事最終結果,來自字節跳動火山引擎旗下的火山翻譯(Volctrans)在39支參賽隊伍中殺出重圍,以顯著優勢在「中文-英語」語向翻譯項目上拿下了冠軍。

  此外,火山翻譯團隊還拿下了「德語 -英語」和「德語-法語」語向機器翻譯項目的冠軍,更斬獲了平行語料過濾對齊項目普什圖語和高棉語的兩項第一。

   39支隊伍角逐國際頂級機器翻譯大賽WMT

  國際機器翻譯大賽(WMT)由國際計算語言學協會 (ACL) 舉辦,是全球學術界公認的國際頂級機器翻譯比賽,也是各大科技公司、頂尖院校與學術機構展示自身機器翻譯實力的較量舞臺。

  自2006年至今,國際機器翻譯大賽(WMT)已經成功舉辦15屆,本屆比賽共有39支隊伍參賽,包括微軟、Facebook、Google DeepMind、騰訊、小牛翻譯、華為、滴滴等實力雄厚的參賽團隊。

  組委會根據中英、英中、英德等22個不同翻譯任務提供測試數據集,並引入科學的語言專家人工評估流程。每個參賽系統首先由多名經驗豐富的語言學家進行評估,然後對最終分數進行標準化加權,最後進行排名。整個評估過程歷時四個月,評價結果有非常高的置信度。

  語言專家評估得分第一 火山翻譯拿下「中文-英語」語向冠軍

  歷年比賽中,「中文-英語」語向的翻譯任務都是參賽隊伍最多、競爭最為激烈的機器翻譯任務之一,今年更勝往年。

  火山翻譯團隊參加了非受限場景的比賽,也就是在給定測試集的情況下,可以使用任何數據和方法探索翻譯效果極限的比賽方式,組織方也引入了四個權威的在線機器翻譯商業系統(Online-A、G、Z、B)作為對比,這也是最能體現翻譯團隊數據和算法綜合能力的場景。在人工評估中,火山翻譯團隊(Volctrans) 力壓群雄,以明顯的優勢奪得了冠軍。

  (圖:WMT2020 中英翻譯前幾名系統得分。Ave.z代表人工評估標準化分數,也是目前機器翻譯最受認可的指標。)

  相比「中文-英語」,「德語-英語」在 WMT 比賽上是傳統項目,也是歐洲國家最關注的語向。在最後的人工評價中,火山翻譯依然表現出色,取得了第一名的成績。國際機器翻譯大賽組委會給出了很高的評價,「作為新的參與者,火山翻譯表現尤為出色(particularly well),超越了很多傳統隊伍」。

  復旦大學計算機學院教授、EMNLP2021大會程序主席黃萱菁表示:「WMT是非常硬核的比賽,火山翻譯取得了出色成績。火山翻譯的LightSeq、mRASP等技術讓人眼前一亮,機器翻譯有廣闊的發展空間,非常期待火山翻譯為機器翻譯的技術研究和產品應用探索更多可能性。」

  領先的背後:火山翻譯致力於打造前沿研究、產品研發和用戶反饋的閉環

  火山翻譯(Volctrans)是由字節跳動計算機研究科學家、工程師、產品經理、產品運營和語言專家組成的專業團隊研發,其基於自主研發的機器學習技術,積累了百億多種語言語料,已支持超過50個語種、2500個語對之間的互譯,翻譯效果和速度業界領先。

  (圖:火山翻譯官網。可以通過 https://translate.volcengine.cn/ 體驗火山翻譯,並了解更多產品能力。)

  目前,火山翻譯具備文本翻譯、語音翻譯、圖像翻譯、語種識別四種能力,在辦公、娛樂、新聞等場景表現優異。

  基於這些能力,火山翻譯推出了一系列形態多樣的產品與服務,包括機器翻譯雲服務、智能視頻翻譯、智能同傳、翻譯瀏覽器插件等。此外,火山翻譯支持API、SDK、私有部署等多種接入方式,且支持垂直領域的快速模型定製,能夠滿足不同群體和不同行業的翻譯需求。

  在視頻翻譯場景,火山翻譯提供簡單高效的視頻「轉寫-打軸-翻譯」全流程服務,輕鬆聽譯、智能打軸、高效編輯、專業審校,集四大能力於一身,幫助創作者輕鬆高效地應對跨語言視頻創作。

  在語音翻譯領域,火山翻譯的智能同傳技術也表現卓越,能夠根據現場發言提供高品質、低延時的實時語音識別字幕結果,同時提供人工字幕保障方案,讓會議現場以及直播字幕更精準流暢。

  火山翻譯的技術來源於字節跳動團隊多年機器學習和自然語言處理領域的深耕。團隊擁有百餘項技術發明專利,在人工智慧頂級國際學術會議發表50餘篇學術論文。在機器翻譯技術上更是獨創了mRASP多語言預訓練算法,把幾十種語言語料融合在一起訓練,獲得的模型在具體語對上微調取得了44個語對的業界最佳性能,整體效果力壓Facebook研發的mBART方法。同時,火山翻譯研發的LUT和COSTT語音到文本翻譯算法,從語音輸入(例如英語)可以直接輸出目標語言文字(例如中文),減少了錯誤累積,在效果上取得了業界領先。

  字節跳動傑出科學家、人工智慧實驗室總監李磊稱:「火山翻譯核心優勢在打造前沿研究、產品研發和用戶反饋的閉環,研發團隊分布全世界多個國家,工作中也在使用自己打造的產品來跨語言溝通,在迭代中快速進步。」

  火山翻譯團隊還研發了多項機器翻譯前沿技術,目前已經集成到火山翻譯系列產品中,例如鏡像式生成模型MGNMT、CTNMT算法、交互式翻譯算法CAMIT、膠囊翻譯網絡、並行翻譯算法PNAT和GLAT等。火山翻譯還採用了自研的高性能序列推理引擎LightSeq,推理速度業界最快,比原生系統提高10倍,可以達到每秒兩萬詞的翻譯速度。

  李磊表示:「火山翻譯已經為飛書、今日頭條等多款海內外產品提供穩定和高質量的翻譯服務,每天處理數億次翻譯請求,為來自全球的過億用戶群體提供優質的翻譯體驗。未來,火山翻譯希望為更多用戶提供服務,幫助用戶更高效地實現國際信息無障礙交流。」

類型:廣告

免責聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。

相關焦點

  • WMT2017國際翻譯大賽,搜狗獲得中英/英中翻譯雙向冠軍
    語音翻譯,無疑是一個很好的突破口。擁有深度學習算法的加成,人工智慧讓機器學習變得更加「聰明」,足以打破語言文化的交流壁壘。從這一點來看,中國的科技公司已是佔據了領先地位。擁有語音技術積累的搜狗知音,在前幾天的WMT 2017國際評測中,獲得中英和英中翻譯雙向冠軍,機器翻譯的準確率和速度震動了整個業界。搜狗,已經跑在了人工智慧隊伍的前列。
  • 百度機器翻譯團隊獲得WMT2019中英翻譯冠軍
    8月1日,WMT2019國際機器翻譯大賽研討會在義大利佛羅倫斯召開。本屆大賽,百度機器翻譯團隊在中文-英文翻譯任務上獲得冠軍。圖1 人工評價結果WMT全稱是Workshop on Machine Translation,是業界公認的國際頂級機器翻譯比賽之一,其中中文-英文翻譯任務是歷年參賽隊伍最多、競爭最為激烈的機器翻譯任務之一。
  • 搜狗獲全球口語翻譯大賽冠軍 多模型融合細節打磨成制勝法寶
    【TechWeb】11月7日,在2018IWSLT(International Workshop on Spoken Language Translation)全球頂級口語機器翻譯評測大賽上,搜狗憑藉BLEU(BLEU是機器翻譯自動評價方法,其數值越大意味著越準確)值28.09的成績奪得冠軍,超過第二名
  • 第三十二屆韓素音國際翻譯大賽
    2020年第三十二屆韓素音國際翻譯大賽由中國翻譯協會、四川外國語大學聯合主辦,《中國翻譯》編輯部與四川外國語大學翻譯學院聯合承辦。本屆競賽分別設立漢語與英語、法語、俄語、西班牙語、阿拉伯語5個語種的雙向互譯,共計10個比賽項目,參賽者可任選一項或同時參加多項競賽。
  • 人工智慧替代人工翻譯 機器翻譯世界盃誰能贏
    機器翻譯,是利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程,是AI(人工智慧)的終極目標之一。1954年,美國喬治敦大學研製出世界首個英俄機器翻譯系統。從早期的詞典匹配,到詞典結合語言學專家知識的規則翻譯,再到基於語料庫的統計機器翻譯,機器翻譯的技術研發歷程,可謂曠日持久。然而,計算機系統始終難以理解人類的語言,滿足不了生活工作所需的「聰明」程度。
  • 第四屆世界中葡翻譯大賽獲獎名單
    第四屆世界中葡翻譯大賽由澳門特別行政區政府高等教育局和澳門理工學院聯合舉辦,旨在培養中葡翻譯專才、加強全世界範圍內中葡翻譯教研交流,推進澳門「國際葡萄牙語培訓中心」和「中葡雙語人才培養基地」建設,助力國家「一帶一路」發展。
  • ...院「黑科技」再獲國際冠軍 生物醫學中英文獻可實現「一鍵翻譯」
    近日,平安醫療科技研究院在國際機器翻譯比賽WMT2020的生物醫學翻譯比賽中,「中譯英」、「英譯中」兩項任務評分均位居榜首,戰勝包括華為、百度、騰訊、謝菲爾德大學等在內的20多家國際知名公司、學術機構,斬獲生物醫學領域中英雙向翻譯任務機器評測的冠軍。
  • 捷通華聲靈雲機器翻譯:翻譯水平全球第一梯隊
    靈雲機器翻譯(MT)支持中英、中維(維吾爾語)互譯,翻譯效果具體如何,我們一起看下:  中英互譯BLEU值(一種評估機器翻譯與人工翻譯相似性的參數)平均38,漢譯維BLEU值平均37,達到業界領先水平。
  • 湖南科技大學教師榮獲第三屆「人民中國杯」日語國際翻譯大賽一等獎
    近日,第三屆「人民中國杯」日語國際翻譯大賽落下帷幕。湖南科技大學外國語學院日語系教師童江寧、龍瀟在社會組筆譯比賽中表現出色,童江寧獲得日譯漢一等獎和漢譯日二等獎,龍瀟獲得漢譯日二等獎。童江寧老師獲獎證書。
  • 黃友義:翻譯大賽將激發全世界漢學家的翻譯熱情
    中國網9月2日訊(記者吳瑾)旨在激發大家對中國文化興趣的「2013中國國際翻譯大賽」於9月2日正式拉開帷幕。為此,中國網專訪了中國外文局副局長、中國翻譯協會秘書長黃友義。黃友義:我們要翻譯的是當代作家的作品而不是中國4,000年古典文學史的作品,因為那樣就要考核翻譯者的歷史知識。而我們本次想考察的是人們對當代中國的認識。我們沒怎麼加入70後、80後的作家是因為他們的知名度還不夠。當然我們也許會在之後的歷屆大賽中豐富體裁,擴充人選,將散文詩歌也納入其中。
  • 「機器翻譯」技術到底有哪些現實應用?
    為了實現這一夢想,以IBM、谷歌、微軟、科大訊飛為代表的國內外科研機構和企業均相繼成立機器翻譯團隊,專門從事智能翻譯研究,矢志打破語言障礙。  IBM從2001起就開始大規模開展該領域的研究,並在英語、阿拉伯語和中文之間的互譯領域進行重點投入。2009年9月IBM正式推出了ViaVoice Translator機器翻譯軟體。
  • 百度機器翻譯獲國家科技進步獎
    1月8日,2015年度國家科學技術獎勵大會在人民大會堂舉行,百度機器翻譯項目獲頒國家科學技術進步獎二等獎,這是該獎項首次出現網際網路巨頭(BAT)的身影。   機器翻譯一直被公認為人工智慧領域最難的課題之一,百度機器翻譯的突破性成果,使我國掌握了網際網路機器翻譯的核心技術,佔領了技術制高點。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面進行了系統而深入的研究,取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 機器翻譯七十年:百度領跑神經網絡翻譯時代
    中新網12月22日電 機器翻譯距今已有70年的發展歷史。自上世紀40年代起,基於規則、實例以及統計的機器翻譯方法漸次登場,各領風騷。近兩年,神經網絡機器翻譯(Neural Machine Translation, NMT)技術異軍突起,取得了翻譯質量的大幅躍升。
  • 機器翻譯:谷歌翻譯是如何對幾乎所有語言進行翻譯的?
    全文共13204字,預計學習時長34分鐘谷歌翻譯大家想必都不陌生,但你有沒有想過,它究竟是如何將幾乎所有的已知語言翻譯成我們所選擇的語言?本文將解開這個謎團,並且向各位展示如何用長短期記憶網絡(LSTM)構建語言翻譯程序。本文分為兩部分。第一部分簡單介紹神經網絡機器翻譯(NMT)和編碼器-解碼器(Encoder-Decoder)結構。
  • 重建巴別塔,機器翻譯的前世今生丨語言學午餐
    圖靈在二戰期間利用機器破譯密文的事跡給了他機器翻譯的靈感:翻譯也可以看成是一種編碼和解碼的過程!當我看到俄文文章,我說「它就是以英語寫成,只是被古怪符號加密而已。現在我要破解密碼。」機器翻譯的此後70年的發展,大體可分為四大階段:基於規則的機器翻譯(Rule-Based Machine Translation, RBMT)、基於例句的機器翻譯(Example-Based Machine Translation, EBMT)、統計機器翻譯(Statitical Machine Translation, SMT)、神經機器翻譯(Neural
  • 百度翻譯打造「翻譯雞」打破溝通壁壘 榮獲世界級設計大獎
    加冕國際設計大獎,百度翻譯的獲獎之路,從品牌創意到產品體驗  百度翻譯榮獲 K-DESIGN AWARD設計大獎  K-Design Award是由 DESIGNSORI主辦,競爭十分激烈的世界級設計大獎。
  • 第三屆BETT全國商務英語翻譯大賽總決賽舉行 海南外國語職業學院...
    新海南客戶端、南海網、南國都市報6月23日消息(記者 鍾瑜)日前,第三屆BETT全國商務英語翻譯大賽總決賽在線上舉行,海南外國語職業學院國際商務系黃碧妍同學榮獲專科組筆譯賽特等獎(第一名),張知雨、陳勇、姚瑤、李龍怡和周俊希同學獲得專科組筆譯賽三等獎,體現出優異的專業知識素養和積極向上的精神風貌
  • 直擊百度翻譯APP全國英語口語「學霸PK」現場
    主持人屆的「三字哥哥」最近主持了一個不得了的比賽:評委間「鬥智鬥勇」、選手們妙語連珠,上來就開賽,結束就倒計時臨場發揮……這一系列「神仙操作」引得網友感慨萬千直道「PK節目看了千千萬萬,從沒見過真來比賽不講故事的大賽」,「我這是追了個什麼神仙節目」!
  • 巨頭扎堆的小市場:不學外語,機器翻譯搞定一切?
    理論上講,對於那些要想出國旅遊的人來說,這未嘗不是一件好事,因為有了它們就不需要擔心因為語言不通而造成的囧途尷尬了,從心理學的角度上來講,智能翻譯的出現帶來的是身處異國他鄉也能感受到的安全感。但是,翻譯機真的能解決很多人英語不夠用的困境嗎?面對商業應用,針對需要大量專業術語的國際會議,這些智能的機器翻譯是否還會奏效?