2020 國際機器翻譯大賽(WMT 2020)公布了谷歌Deepmind、微軟、Facebook、騰訊、OPPO、字節跳動、中譯語通等全球38支參賽隊伍的人工專家評測成績(最終賽事結果)。中譯語通參賽6個語言方向,5項冠軍,1項亞軍,奪冠數量全球居首。
國際機器翻譯大賽(WMT)由國際計算語言學協會 (ACL)主辦,是全球學術界公認的規模最大的國際頂級機器翻譯評測比賽之一,自2006年以來,已連續舉辦15屆。比賽的主要宗旨是評估機器翻譯最新發展水平,傳播通用測試數據集和公共訓練數據,改進機器翻譯評估評測方法。
大賽為所有語言方向的參賽隊伍提供平行語料作為機器翻譯引擎的訓練數據,採用先機器評測後人工專家評測的評測流程,並以人工專家評測成績作為最終賽事結果。評測成績實行百分制,進而在語言專家團隊的評測成績基礎上進行加權計算,得出「Ave.z」人工評測標準化成績和最終排名,同時引入Online-A、G、Z、B四個在線機器翻譯系統作為評測成績對比。科學嚴謹的評測方法使得整個評測結果具有很高的置信度。
2020 國際機器翻譯評測比賽,中譯語通GTCOM評測成績
大賽共發布中文-英語、捷克語-英語、法語-德語、德語-英語、因紐特語-英語、泰米爾語-英語、日語-英語、普什圖語-英語、波蘭語-英語、俄語-英語、高棉語-英語等11個語言對、22個語言方向的機器翻譯評測任務。中譯語通參賽6個語言方向,在高棉語-英語、英語-高棉語、普什圖語-英語、英語-普什圖語、泰米爾語-英語等5個語言方向上表現搶眼,斬獲冠軍,英語-泰米爾語方向位居第二,再次彰顯了其機器翻譯的領先實力。
中譯語通的機器翻譯戰績不止如此。早在2019年國際機器翻譯大賽,全球60餘家頂級團隊參加比賽,中譯語通與微軟亞洲研究院、Facebook三家均獲得3個語言方向冠軍,奪冠數量並列第一;2018年國際機器翻譯大賽,中譯語通僅參賽英中方向自動評測,並獲得第一名。此外,在2017年國際口語機器翻譯評測比賽(IWSLT2017)的20個語言方向翻譯評測任務中,中譯語通囊括了16個語言方向的第一名。
中譯語通機器翻譯軟體應用展示
對中譯語通而言,不俗的成績源自不懈地堅持。中譯語通是國內率先開展機器翻譯研究的企業之一。多年來,領域機器翻譯和語種機器翻譯模型研究持續突破,可支持金融、科技、醫療等多個垂直領域以及多達60個語種、3000個語言方向的翻譯。海量高質量語料和先進的數據清洗技術讓其機器翻譯優勢更為凸顯。中譯語通積累的高質量專業領域平行語料超過52億句對。在數據清洗上,中譯語通採用了語言模型和翻譯模型分別對語料進行清洗,設計了循環語料生成和清洗方法來不斷重複提高翻譯質量和語料質量。在訓練技術上,採用了預訓練模型調優、知識蒸餾、多模型融合解碼、聯合訓練、翻譯重排序等技術提高訓練的質量。
中譯語通機器翻譯硬體產品展示
如今,中譯語通已構建了完善的機器翻譯應用生態體系。應用範圍覆蓋文本、網頁、音視頻等多模態數據;應用產品形態涉及文件夾翻譯、文檔翻譯、Word翻譯插件、字幕通、網頁翻譯、輔助翻譯平臺等;應用場景更為廣泛,包括但不限於國際會議同傳、遠程辦公教學、翻譯項目管理、跨語言語義檢索、多語種數據加工等等;應用模式也十分多樣化,除成熟軟硬體產品外,還支持行業機器翻譯模型定製、私有雲及本地化部署、軟硬體一體機、雲端調用等多種模式。