搜狗擊敗訊飛阿里,獲IWSLT國際口語機器翻譯評測大賽冠軍

2021-01-07 雷鋒網

近日,在剛剛落幕的IWSLT(International Workshop on Spoken Language Translation)國際頂級口語機器翻譯評測大賽上,搜狗擊敗訊飛、阿里巴巴, APPTEK(美國應用科技公司)、AFRL(美國空軍研究實驗室)以及KIT(德國卡爾斯魯厄理工學院)等國際國內多個強勁對手,一舉奪得了2018年IWSLT大賽Baseline Model(基線模型)賽道冠軍,代表中國向世界彰顯了AI領域的技術硬實力!

表1  IWSLT大賽Baseline Model賽道最終結果

 --取自IWSLT官方公布結果:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

這是搜狗繼WMT 2017機器翻譯頂級評測大賽奪冠之後,所摘得的又一翻譯領域的技術桂冠。短期內連續登頂世界第一的位置,充分證明了搜狗在翻譯行業特別是口語翻譯領域已位居領先地位。

IWSLT是什麼比賽?

IWSLT是國際最具影響力的口語機器翻譯評測比賽,從2004年開始已經舉辦了15屆。每屆比賽都吸引了世界各地機器翻譯領域的知名企業和研究機構參與,本屆比賽吸引了訊飛、阿里巴巴等國內公司,愛爾蘭ADAPT中心,美國約翰霍普金斯大學,德國卡爾斯魯厄理工學院,芬蘭赫爾辛基大學,英國愛丁堡大學,美國AppTek公司等多家國際知名大學、研究機構和公司參加。

表2  IWSLT2018大賽參賽情況

--取自IWSLT官方公布結果:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

本屆IWSLT 2018的口語機器翻譯任務主要評測基於指定數據集從英語到德語的語音翻譯能力,共分為Baseline Model(基線模型賽道)和End-to-End(端到端賽道)兩個賽道,其中Baseline Model賽道主要評測語音翻譯的流水線方案,輸入語音先通過語音識別系統得到語音識別結果,之後將結果送入機器翻譯系統獲得譯文,這也是業內最主流、效果最好的語音翻譯解決方案,市場上商用機器同傳、翻譯機等語音翻譯類產品幾乎都採用了類似的方法;End-to-End則是本次評測新增設的賽道,主要鼓勵參賽方探索基於神經網絡的端到端語音翻譯解決方案,希望能夠輸入語音,基於深度神經網絡模型直接輸出譯文,這種方法目前仍處於早期研究階段,受制於語音-文本平行語料難以大規模採集、算法研究不成熟等因素的限制,距離商用仍存在較大距離。本次評測中,在訓練集、測試集相同的情況下,Baseline Model賽道最好的系統取得了28.09的BLEU(機器翻譯質量評價指標,值越大代表翻譯質量越好),而End-to-End賽道最好的系統僅取得了19.4的BLEU,較Baseline Model賽道相差8.69個BLEU,差距非常明顯,也證明了Baseline Model賽道評測的算法仍是目前最可行和實用的解決方案。

搜狗本次參加的是Baseline Model賽道的評測,並取得了第一名的好成績。評測任務面向TED演講和大會學術報告場景,測試集包括來自英國、歐洲、印度等各個國家的英語演講者,存在噪聲、口音、自由表達等複雜語音現象,同時語言中存在大量領域專有名詞和口語化的表達(如:大量語氣詞、錯誤語法表達等),具有極強的實戰意義和挑戰性。最終,搜狗提交的系統BLEU值達到28.09,領先排名第二的科大訊飛1.6個BLEU,證明了搜狗在口語機器翻譯領域強大的實力。

AI賽道中持續發力,搜狗領跑語音翻譯行業

搜狗的AI戰略藍圖之中,語言是最核心的重頭戲。一直以來,搜狗都堅持著「自然交互+知識計算」的人工智慧核心方向,並持續深耕技術,推動技術向產品的快速轉化,2016年,搜狗發布了自有人機互動解決方案-知音引擎。擁有充足真實語料數據優勢的搜狗,將語音識別與機器翻譯技術相結合,並在2016年推出了全球首款商用AI同傳系統-搜狗同傳,引領了語音翻譯技術的普及與應用。通過數百場的國際會議「實戰」,搜狗同傳獲得了無數媒體和觀眾的好評,成為當下炙手可熱的「AI字幕君」。

與此同時,搜狗也推出了一系列的智能硬體,將語音翻譯技術應用到了更廣闊的場景之中,幫助用戶打破了跨國交流時的語言困境。2018年3月,搜狗推出了搜狗旅行翻譯寶,具備離線翻譯功能與拍照翻譯功能,讓馬化騰都為之心動,在朋友圈裡大打廣告。作為首款智能翻譯硬體,它支持42種語言對話翻譯,解決了旅遊場景中用戶聽不懂、看不懂、不會說等真實痛點。該項產品在京東平臺首發當日即告售罄,首日銷售額破千萬。與此同時,搜狗還推出了錄音翻譯筆,提供錄音轉寫、對話翻譯、同聲傳譯等功能,把AI同傳落地到了消費級產品之中,開拓了語音翻譯的新航道。

眾所周知,人工智慧是未來科技的風向標。通過這次在IWSLT比賽中的優秀成績,可以看到以搜狗為代表的國產科技巨頭企業,已表現出了引領行業的技術硬實力。

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 搜狗擊敗訊飛阿里 獲IWSLT國際口語機器翻譯評測大賽冠軍
    近日,在剛剛落幕的IWSLT(International Workshop on Spoken Language Translation)國際頂級口語機器翻譯評測大賽上,搜狗擊敗訊飛、阿里巴巴, APPTEK(美國應用科技公司)、AFRL(美國空軍研究實驗室)以及KIT(德國卡爾斯魯厄理工學院)等國際國內多個強勁對手
  • 再發「最強音」,科大訊飛喜獲國際口語機器翻譯評測大賽冠軍
    再發「最強音」,科大訊飛喜獲國際口語機器翻譯評測大賽冠軍 繼斬獲今年八項「世界第一」之後,科大訊飛再度發力,在剛剛結束的 2018 年國際口語機器翻譯評測比賽中,科大訊飛在英德方向語音翻譯任務端到端模型比賽中
  • 對話搜狗口語機器翻譯團隊:國際冠軍的誕生
    繼2017年摘取國際頂級機器翻譯評測大賽桂冠之後,搜狗又一次在國際大賽拔得頭籌,且是在更為前沿的口語機器翻譯領域。 近日,國際頂級口語機器翻譯評測大賽(International Workshop on Spoken Language Translation,以下簡稱IWSLT)落下帷幕。
  • 人工遭遇AI挑戰,阿里搜狗展示新能力,翻譯有了最強競爭者
    人工遭遇AI挑戰,阿里搜狗展示新能力,這個行業有了最強競爭者機器的發明讓我們擁有了更強的能力,可以完成更多以前不可能完成的工作。隨著人類科技的不斷進步,現在甚至發明了可以解放人類雙手和大腦的機器,這些聰明的機器被稱為人工智慧(AI)。
  • 搜狗獲全球口語翻譯大賽冠軍 多模型融合細節打磨成制勝法寶
    【TechWeb】11月7日,在2018IWSLT(International Workshop on Spoken Language Translation)全球頂級口語機器翻譯評測大賽上,搜狗憑藉BLEU(BLEU是機器翻譯自動評價方法,其數值越大意味著越準確)值28.09的成績奪得冠軍,超過第二名
  • 阿里獲WMT國際機器翻譯大賽5項冠軍
    圖為阿里巴巴達摩院獲得5個項目自動評測第一名。供圖中新網杭州5月24日電 (黃慧)在WMT2018國際機器翻譯大賽上,阿里巴巴達摩院機器智能-NLP翻譯團隊在提交的5項比賽中全數獲得冠軍。在本屆大賽上,阿里達摩院機器智能技術實驗室資深算法專家陳博興帶領達摩院機器翻譯團隊參賽。他們基於業界最新的Transformer結構進行了網絡結構的改進和對詞語位置信息的充分利用,全面改進了機器翻譯的性能。陳博興曾任加拿大國家研究委員會研究員,擔任過NLP領域所有頂級會議和期刊的審稿人,並曾多次在各類機器翻譯評測中取得優異成績。
  • 對話搜狗口語機器翻譯團隊:全球奪冠只為驗證技術,更看重落地商用
    邊策 發自 凹非寺 量子位 報導 | 公眾號 QbitAI就在上周,搜狗又拿下一項機器翻譯國際冠軍。在今年的國際頂級口語機器翻譯大賽IWSLT上,搜狗戰勝科大訊飛、阿里等眾多國內外好手,一舉奪魁。加上去年獲得WMT2017機器翻譯頂級評測大賽中英和英中第一名,這已是搜狗連續兩年,在全球性機器翻譯大賽中刷榜。而且這一次還是中國公司不常遇到的「英德互譯」比拼,更顯技術實力。在此之前,搜狗更多展現的是輸入法、搜索等方面的技術,但現如今,AI翻譯,也正在成為搜狗技術、產品和品牌的新標識,大有不鳴則已一鳴驚人的態勢。
  • 突破小語種機器翻譯,阿里獲WMT國際大賽5項冠軍
    來源:環球網在剛剛結束的WMT2018國際機器翻譯大賽上,阿里巴巴達摩院機器智能-NLP翻譯團隊打敗多個國外巨頭與研究機構,在所有提交的5項比賽中,全數獲得冠軍,成為此次比賽的最大贏家。圖片說明:達摩院獲得5個項目自動評測第一名WMT全稱Workshop on Machine Translation,是國際公認的頂級機器翻譯賽事之一,也是各大科技公司與學術機構展示自身機器翻譯實力的平臺。2018年更吸引了包括翰霍普金斯大學、愛丁堡大學、亞琛工業大學、馬裡蘭大學、微軟、騰訊等幾十個海內外團隊參與。
  • 第五屆世界網際網路大會上的神翻譯:搜狗翻譯寶Pro圈粉無數
    一位記者表示:「搜狗翻譯寶Pro真的很強大,有了它,終於可以無視語言屏障,採訪任何想要採訪的外國嘉賓了。」據了解,搜狗翻譯寶Pro是世界網際網路大會舉辦以來的首個官方指定翻譯機。而搜狗翻譯寶Pro能夠受到本屆大會官方及記者的青睞,與其強大的功能密不可分。
  • WMT2017國際翻譯大賽,搜狗獲得中英/英中翻譯雙向冠軍
    語音翻譯,無疑是一個很好的突破口。擁有深度學習算法的加成,人工智慧讓機器學習變得更加「聰明」,足以打破語言文化的交流壁壘。從這一點來看,中國的科技公司已是佔據了領先地位。擁有語音技術積累的搜狗知音,在前幾天的WMT 2017國際評測中,獲得中英和英中翻譯雙向冠軍,機器翻譯的準確率和速度震動了整個業界。搜狗,已經跑在了人工智慧隊伍的前列。
  • 阿里達摩院打敗微軟等巨頭 獲WMT機器翻譯大賽5項冠軍
    參考消息網5月24日報導在剛剛結束的WMT2018國際機器翻譯大賽上,阿里巴巴達摩院機器智能-NLP翻譯團隊打敗多個國外巨頭與研究機構,在所有提交的5項比賽中,全數獲得冠軍,成為此次比賽的最大贏家。這5個項目包括英文-中文翻譯、英文-俄羅斯語互譯、英文-土耳其語互譯,達摩院在這幾個項目的自動評測指標BLEU都位居第一。達摩院獲得5個項目自動評測第一名。WMT全稱Workshop on Machine Translation,是國際公認的頂級機器翻譯賽事之一,也是各大科技公司與學術機構展示自身機器翻譯實力的平臺。
  • 騰訊推出機器人翻譯,翻譯將下崗,2018年將迎來BAT和科大訊飛的翻譯...
    基於深度神經網絡算法上的創新和突破,科大訊飛在2014年國際口語翻譯大賽IWSLT上獲得中英和英中兩個翻譯方向的全球第一名;在2015年又在由美國國家標準技術研究院組織的機器翻譯大賽中取得全球第一的成績。
  • 烏鎮世界網際網路大會首次啟用官方翻譯機 搜狗翻譯寶Pro成唯一贏家
    (搜狗翻譯寶Pro)在會務服務方面,本屆大會將啟用來自搜狗的人工智慧翻譯機——搜狗翻譯寶Pro,幫助參加會議的中外人士自由深入交流,充當他們的「貼身翻譯」。此外,搜狗翻譯寶Pro還支持中英、中日、中韓4種語言離線翻譯,且翻譯結果與在線翻譯無異常,即使沒有網絡信號,也可以為與會嘉賓提供精準的翻譯結果。
  • 從智能語音到機器翻譯,解讀搜狗的人工智慧進擊之路
    智東西文 | 寓揚8月初,搜狗CEO王小川的一封內部郵件講到,搜狗即將赴美IPO,也將搜狗帶到了網際網路圈議論的焦點。而近期搜狗語音交互中心機器翻譯團隊也取得了優異的成績,在國際頂級機器翻譯比賽WMT(Workshop on Machine Translation) 2017種獲得人工評測的中英和英中機器翻譯比賽雙向冠軍。
  • 搜狗翻譯寶Pro煥新升級 詮釋智能化硬體翻譯新概念
    9月26日,搜狗官方發布消息稱,旗下AI智能設備搜狗翻譯寶Pro迎來全新功能升級。據悉,煥新版本搜狗翻譯寶Pro最顯著的更新是離線拍照翻譯支持語種新增了越南語並融入菜單模式特色功能,硬體交互界面擴展了對更多語種的系統兼容性。整體而言,新版的搜狗翻譯寶Pro為用戶提供了更加人性化和便捷高效的智能翻譯體驗。
  • 科大訊飛首推「維漢口語即時翻譯」軟體 為維漢交流搭建「橋梁」
    日前,在新疆大學舉辦的「多語種信息處理新技術及產品展示會」上,科大訊飛與新疆大學語音實驗室聯合發布「維漢口語即時翻譯軟體」,這也是全球首款實現維吾爾語與漢語之間即時翻譯的應用。該軟體基於科大訊飛與新疆大學語音實驗室聯合研發的維漢語音翻譯技術,可以準確識別維吾爾語和漢語,實現維漢語音即時互譯、情景例句學習、維漢詞典互譯等。
  • 翻譯家族再添新成員,科大訊飛翻譯機3.0震撼發布
    說到翻譯機,很多人都會異口同聲的說出訊飛翻譯機,毋庸置疑,科大訊飛翻譯機不僅是翻譯產品市場上的領軍品牌,同時還不斷升級產品,性能和性價比更是超越了其他同類產品,實力不容小覷。在近日舉辦的科大訊飛2019新品發布會上,訊飛翻譯機3.0正式上市,售價3499元,意味著其翻譯家族再添悍將。
  • 搜狗首創語境引擎:AI同傳最強進化,PPT翻譯正確率猛升40%
    「全球95%的信息是用英文所寫的,100%的國際商貿活動是用英文的,因此如何幫助中國人跟外國人進行更好的交流,這變成了一個重大的技術課題。」搜狗公司CEO王小川的這席話道出了多少中國人的心聲?在與搜狗AI交互技術部總經理陳偉和項目負責人趙超溝通後我們得知,在2016年「網際網路大會」上,搜狗同傳1.0首次亮相時語音識別準確率已經達到97%,機器翻譯準確率達到90%。
  • 翻譯之王感受果然不同 科大訊飛翻譯機3.0震撼發布
    提到翻譯機,很多朋友首先會想到科大訊飛旗下產品。毋庸置疑,憑藉在國內中文智能語音領域及人工智慧領域的領軍地位,訊飛翻譯機無論是在翻譯準確度、支持翻譯的語言種類還是方言翻譯方面,都有著不可小覷的實力。翻譯機的核心在於"翻譯",在這一點上科大訊飛有著濃厚的技術沉澱,相關資料表明,科大訊飛至今連續十三年蟬聯國際語音合成大賽冠軍;連續兩屆獲CHiME Challenge(國際多通道語音分享和識別大賽)冠軍;三次刷新機器閱讀理解領域權威評測SQuAD世界記錄;2014年、2018年兩次斬獲國際口語機器翻譯評測比賽IWSLT冠軍。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    其中,作為自然語言處理領域頂級國際會議之一的 EMNLP 2017 將於今年 9 月在丹麥首都哥本哈根舉行,與此同時,第二屆機器翻譯大會(WMT 2017)將會作為本次會議的分論壇同時召開。今年的一大亮點是,WMT 首次增設了中文和英文間的新聞數據翻譯任務。