搜狗獲WMT2017國際翻譯大賽雙向冠軍 可滿足多種場景下的實時翻譯...

2020-12-05 每日經濟新聞

搜狗獲WMT2017國際翻譯大賽雙向冠軍 可滿足多種場景下的實時翻譯需求

每日經濟新聞 2017-09-19 00:05:43

在AI機器翻譯這條賽道上,國內外的科技巨頭都在虎視眈眈,不遺餘力地推進深度學習在機器翻譯領域的研發和應用。而在這場以語音翻譯為突破口的人工智慧技術的較量中,中國的網際網路公司已經佔據了領先地位。

近期獲悉,搜狗語音交互技術中心代表搜狗參加了含金量極高的WMT2017國際評測比賽,該中心研發的搜狗神經網絡機器翻譯(Sogou Neural Machine Translation)系統獲得中英/英中翻譯的雙向冠軍。

能夠識別語音的機器翻譯正在逐漸從實驗室走向普羅大眾,搜狗語音交互中心技術總監陳偉表示,機器翻譯在搜狗輸入法上的語音翻譯、中譯英功能和搜狗同傳已經應用,流量已超過200多萬。可滿足多種移動場景下的實時翻譯需求,為用戶提供「口袋裡的翻譯專家」。而作為搜狗人工智慧重要布局,未來圍繞著語音交互入口,搜狗在更多領域都會有進一步的進展。

搜狗語音翻譯技術邁入世界頂尖

每年的第三季度都是機器學習相關的高端學術會議密集召開的時期,今年也不例外。其中,作為自然語言處理領域高端國際會議之一的EMNLP 2017將於今年9月在丹麥首都哥本哈根舉行。其中,同期召開的第二屆機器翻譯大會(WMT 2017)是機器翻譯領域的國際高端評測比賽之一。

近年來,幾乎所有的研究機構在發表關於機器翻譯新方法的論文時,都會以WMT數據集作為實驗數據,並以BLEU評分來衡量方法的有效性,給出一個量化的、可比的翻譯質量評估,當前WMT數據集已經成為機器翻譯領域公認的主流數據集。

從2006年開始到2017年,WMT一共舉辦了12屆機器翻譯比賽,每一屆的角逐,都代表著全球翻譯尖端水準的較量。今年的一大亮點是,WMT首次增設了中文和英文間的新聞數據翻譯任務。

因此,此次獲得雙向冠軍的搜狗機器翻譯,在比賽中表現出的準確率和速度震動了整個業界。這也意味著中國的語音翻譯技術,已經邁入世界最前端的頂尖領域。

在深耕技術的同時,搜狗也在積極推進產品落地,目前機器翻譯技術已經成功應用於搜狗同傳和搜狗輸入法中語音和文本翻譯產品中。其中,搜狗同傳技術於2016 年11月17日在第三屆世界網際網路大會上完成首次演示,目前已經在多場重要會議場中使用,支持了數十場機器同傳演示,輸入法中的語音翻譯和文本翻譯上線以來日均流量已達200萬次。

對於AI技術能夠快速在搜狗生態體系中被落地應用,在陳偉看來,有兩個方面的原因。陳偉表示,目前AI技術逐漸越來越相通,很多方向可以跟翻譯形成很好的交叉,翻譯將會被快速地推起來。而另一方的源於搜狗,搜狗在輸入法的場景下面,積累了有大量的用戶數據,可以快速把數據壁壘做起來,而算法是很難形成壁壘的。

不難看出,搜狗的機器翻譯團隊在自然語言處理和深度學習方面有非常深厚的積累。系統中用到的許多技巧,追本溯源,都有相應的自然語言處理領域的經典方法,同時也緊跟機器翻譯領域的前沿趨勢。

因此,搜狗機器翻譯團隊的獲獎代表著搜狗在人工智慧方面的最新進展,同樣,今年也是搜狗人工智慧技術從前沿科技到走向實用的重要一年。

可滿足多種移動場景下的實時翻譯需求

與谷歌用人工智慧做翻譯「秀肌肉」的方式不同。搜狗是實實在在希望通過翻譯技術把搜索做得更好,將翻譯和搜索做出聯動,應用到各類場景中,形成差異化競爭優勢。

而此前搜狗CEO王小川談及搜狗AI的未來時也指出,語言上是搜狗最需要做的,因為搜狗主業做輸入法和搜索都是和文字信息打交道,而人工智慧真正重要的方向是讓機器做準確決策。

場景中的語音識別最考驗技術的紮實度,用戶最關心的也是語音轉寫準確率。據了解,目前搜狗的語音識別率已達97%,而且在業務層面,搜狗已經接入UTH國際的多語言大數據中心,後者擁有近百億垂直領域高質量語料句對的大數據積累。

而你可能不知道的是,搜狗正在通過翻譯技術,讓華語世界與全世界連接。搜狗輸入法中「語音翻譯」和「文本翻譯」兩個非常強大的翻譯功能,可以幫助你在微信聊天、出國遊玩等各種需要英語的場景下,隨時隨地張口就來,瞬間變身英語達人。

該功能採用了搜狗自研的機器同聲傳譯技術,實現了輸入法與機器翻譯的完美結合,你只需對著手機說中文就可以實時翻譯成英文。而為了保證在各種複雜場景下都能精準翻譯轉寫,搜狗採用了大量的前沿技術,與業內領先的端到端深度神經網絡技術深度整合。

業內認為,機器翻譯是搜狗重點布局的一個方向,也是一個差異化的優勢所在。但搜狗的人工智慧並未止步於此,圍繞著語音交互入口,搜狗在更多領域都會有進一步的進展。目前搜狗技術落地的產品主要包括搜狗輸入法、搜狗同傳、搜狗聽寫等產品。

相關焦點

  • WMT2017國際翻譯大賽,搜狗獲得中英/英中翻譯雙向冠軍
    擁有語音技術積累的搜狗知音,在前幾天的WMT 2017國際評測中,獲得中英和英中翻譯雙向冠軍,機器翻譯的準確率和速度震動了整個業界。搜狗,已經跑在了人工智慧隊伍的前列。機器翻譯,挑戰傳統行業9月7 日至8日兩天,在丹麥首都哥本哈根舉行的WMT2017會議,是全球範圍內最具權威的國際評測大賽。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    其中,作為自然語言處理領域頂級國際會議之一的 EMNLP 2017 將於今年 9 月在丹麥首都哥本哈根舉行,與此同時,第二屆機器翻譯大會(WMT 2017)將會作為本次會議的分論壇同時召開。今年的一大亮點是,WMT 首次增設了中文和英文間的新聞數據翻譯任務。
  • 微信AI首次奪冠WMT2020國際機器翻譯大賽中英方向
    作為全球學術界最具權威的機器翻譯比賽,近日,WMT2020國際機器翻譯大賽的榜單停止提交結果並發布排名,其中騰訊微信AI團隊在「中文-英文」翻譯任務上奪得冠軍。提交結果BLEU評分第一,微信AI斬獲中英翻譯方向冠軍WMT 是機器翻譯領域的國際頂級評測比賽之一,自2006年創辦至今,WMT已經成功舉辦15屆。大賽每年都吸引了眾多來自全球的企業、科研機構和高校所組成的頂尖團隊,包括微軟、Facebook、百度、金山、日本情報通信研究機構(NICT)。
  • 2020國際機器翻譯大賽:火山翻譯力奪五項冠軍
    在11月下旬結束的自然語言處理頂級學術會議EMNLP2020上,國際機器翻譯大賽(WMT20)公布了賽事最終結果,來自字節跳動火山引擎旗下的火山翻譯(Volctrans)在39支參賽隊伍中殺出重圍,以顯著優勢在「中文-英語」語向翻譯項目上拿下了冠軍。
  • 揭秘:搜狗語音實時翻譯是怎麼煉成的
    今年的網際網路大會現場,搜狗 CEO 王小川將自己的演講內容用搜狗語音實時翻譯成中英對照的形式,「技驚四座」的同時,也讓各位看官們覺得代替同傳的工具要來了。谷歌和訊飛對機器翻譯與語音翻譯新進展的披露也是如此。近日,搜狗語音交互中心開了一場媒體溝通會,向大家對搜狗語音翻譯技術進行了解析。據搜狗語音交互中心技術負責人陳偉介紹,搜狗實時翻譯技術是搜狗知音引擎技術框架的新能力,按照量化的指標,準確率可以達到90%。此外,搜狗語音識別請求規模現在達到了1.84 億次左右,語料達到了16萬小時,在使用場景方面,主要集中在車載、智能家居和可穿戴設備。
  • 搜狗錄音翻譯
    採用業界最先進的神經網絡機器翻譯技術(NMT),更懂國人語言,翻譯結果更加準確。通過將搜狗速記翻譯筆與手機APP連接,可實現遠比手機出色的遠距離拾音。
  • 深度體驗搜狗翻譯寶:離線翻譯+實景拍照翻譯很實用
    ware-搜狗公司並不是第一家推出旅行翻譯工具的公司。隨著出境遊日益升溫,人們對實時翻譯工具的需求也在不斷增加,應運而生的有手機翻譯軟體,以及翻譯硬體。然而,在實際使用過程中,這些產品都或多或少的讓使用者陷入尷尬。
  • 搜狗旅行翻譯寶評測 能拍照翻譯的掌上神器
    ,在無網絡連接的環境下可以直接實現中英互譯,在關鍵時刻還是可以發揮一定的作用,雖然說沒有在線語音翻譯的準確率高,但是滿足日常的普通交流還是不在話下的。目前能夠支持離線翻譯的智能設備,市面上還是很少見到的,畢竟實現這一功能還是需要很多技術支持才能完成的。這裡需要注意的是,搜狗旅行翻譯寶除了英文之外其他語言暫時無法支持無網絡環境下翻譯,在之後可能會通過軟體更新來完善這一功能,讓離線語音翻譯的準確率得到進一步提升。
  • 搜狗AI矩陣全面出擊,亮相世界人工智慧大會
    大會以「城市智腦、智能核芯、創新算法」為AI精品展的主題,來自谷歌、微軟、騰訊、搜狗等數十家國際公司通過AI產品,向參會者展示出它們的「中國方案」和「世界智慧」。一直以來,搜狗人工智慧戰略以語言為核心,布局「自然交互+知識計算」,在語音、圖像、對話、翻譯、問答等技術和應用水平上全球領先。本次大會,搜狗帶來了一系列的AI產品,呈現了人工智慧領域的技術變革與創新。
  • 搜狗2016財報解讀:對話、問答、翻譯 將AI武裝到牙齒
    2017年2月21日,搜狗公布了2016全年財報及2016第四季度財報。財報顯示,2016年全年,搜狗營收44億元人民幣,同比增長19%。在持續加大研發和品牌投入的情況下,繼續維持良好的利潤水平,非美國會計準則下的淨利潤達6.4億元人民幣。綜觀營收和利潤情況,截至2016年底,搜狗已經連續12個季度實現了持續盈利,並且保持良好的增長態勢。
  • 搜狗手機瀏覽器上線新功能,提供全方位智能翻譯服務
    近日,針對以上這些常見的問題,搜狗手機瀏覽器安卓版全新推出了集語音對話翻譯、AR實時翻譯、拍照翻譯和全文翻譯於一體的智能翻譯功能。無需額外安裝插件,即可隨時隨地在關鍵時刻為你解決語言難題。相比需要其他翻譯軟體,搜狗手機瀏覽器的對話翻譯結果準確度更加高,操作也更加簡單方便。AR實時翻譯&拍照翻譯:所拍即所譯在國外的餐廳用餐,面對看不懂的全英文菜單常常會點錯餐,用搜狗手機瀏覽器的AR實時翻譯功能就可避免尷尬。只需點擊搜索欄右側的 「相機」即可進入AR實時翻譯和拍照翻譯的界面。
  • 百度機器翻譯五大領域實現新突破 獲WMT2019中英翻譯冠軍
    8月1日,WMT2019國際機器翻譯大賽研討會在義大利佛羅倫斯召開。本屆大賽,百度機器翻譯團隊在中文-英文翻譯任務上獲得冠軍。圖1 人工評價結果  WMT全稱是Workshop on Machine Translation,是業界公認的國際頂級機器翻譯比賽之一,其中中文-英文翻譯任務是歷年參賽隊伍最多
  • 百度機器翻譯團隊獲得WMT2019中英翻譯冠軍
    8月1日,WMT2019國際機器翻譯大賽研討會在義大利佛羅倫斯召開。本屆大賽,百度機器翻譯團隊在中文-英文翻譯任務上獲得冠軍。圖1 人工評價結果WMT全稱是Workshop on Machine Translation,是業界公認的國際頂級機器翻譯比賽之一
  • 搜狗訊飛分獲IWSLT2018評測第一,到底哪個冠軍更有份量
    10月31日上午,科大訊飛和搜狗兩家公司幾乎在同一時間,都表示自己獲得了IWSLT2018國際口語機器翻譯評測比賽的第一名。看到這個奪冠「撞車」的消息,讓網友們不禁產生了強烈的疑惑:又不是並列第一名(搜狗明確說明了擊敗訊飛),這一個比賽裡為什麼會有兩個世界冠軍呢?
  • 以語言為核心,除了識音識圖搜狗還推出了旅行翻譯寶
    6、2017年Q3搜狗營收2.57億美金(根據搜狗招股書,截止2017年6月30日,搜狗上半年總營收為3.73億美元)。而作為全球首個跨語言搜索信息的輸入法,搜狗輸入法除了英語如今還支持韓語、日語等搜索結果顯示,以及這兩種語言的輸入實時翻譯。
  • 盤點FINA遊泳世界盃四大亮點,AI同傳提供實時翻譯C位搶鏡
    值得一提的是,由於本站比賽是2018年國際泳聯短池遊泳世錦賽的達標賽,除了來自27個國家和地區(包括中國和中國臺北)的113名運動員參賽外,我國13個地方隊的131名運動員也參與了此次比賽。此外,本站比賽還將以往為期2天的比賽延長到了3天,一方面是考慮到參賽人數較多,另一方面,則是為了有更加充裕的時間為觀眾呈現全部36個項目的精彩競技。
  • 搜狗旅行翻譯寶新增6種語言翻譯
    搜狗旅行翻譯寶在升級前(18種語言互譯)便已經覆蓋全球200多個國家和地區,升級後支持24種語言互譯,更將繼續開拓人們的出遊半徑,滿足更豐富的翻譯需求。新增日文在線 拍照翻譯再升級搜狗旅行翻譯寶的拍照翻譯功能一直是一大亮點。此次更新中,拍照翻譯新增日文在線,支持中日英互譯。
  • 不懂中文的外國人:押注搜狗翻譯寶Pro 血拼雙11
    「這是我剛從網上買的一款翻譯產品,叫搜狗翻譯寶Pro,非常好用。」李允珠通過翻譯機告訴記者,9月份才入學的她還不怎麼會說中文,英文也說的不好。在中國同學的指導下,她剛剛網購了這款翻譯機。她告訴記者,她親自體驗了這款翻譯機後,發現其翻譯結果十分準確。「雖然我的中文說的不錯,但有時候出去吃飯,一些菜單一樣看不懂。用這款翻譯機的拍照翻譯功能拍一下,就行了。即使沒有網絡,也一樣可以用。」金麗說,她也下單訂購了搜狗翻譯寶Pro。和李允珠一樣,來自俄羅斯的伊萬也訂購了搜狗翻譯寶Pro,並由此開啟了自己的網購之路。
  • 實時翻譯水準高 科大訊飛翻譯機在線翻譯水平達到英語專業八級
    實時翻譯水準高 科大訊飛翻譯機在線翻譯水平達到英語專業八級時間:2020-07-17 19:01   來源:搜狐   責任編輯:青青 川北在線核心提示:原標題:實時翻譯水準高,科大訊飛翻譯機在線翻譯水平達到英語專業八級 很多人從小就有一個環遊世界的夢想,可等到自己長大成人時才發現,原來環遊世界還真不是一件簡單的事
  • 阿里升級機器翻譯,48種語言方向,雙11全球買賣無障礙
    隨著雙11的到來,未來三周內,預計有超過3億用戶訪問面向全球在線交易平臺速賣通,對機器翻譯的需求倍增。阿里巴巴賣家端的調研顯示,約96%的中外中小賣家對小語種無能為力,全球範圍內也缺乏相應語種的翻譯人才。為此,阿里巴巴達摩院在雙11之前升級了機器翻譯技術,幫助速賣通平臺上的中國及全球中小賣家,將產品詳情與評論自動翻譯成當地語言,還實現了實時AI語言翻譯的客戶服務與業務諮詢。