邊看PPT邊思考!搜狗「AI翻譯官」同傳3.0逆天了

2020-12-14 智東西

智東西(公眾號:zhidxcom)

文| 李水青

近日,搜狗推出了業內首個帶有「語境引擎」的同聲傳譯系統3.0版,新增多模態和自主學習能力。以大會同傳為例,搜狗同傳3.0系統在聽聲的過程中,還能夠實時閱讀PPT,並將它所看到的內容拓展成知識網絡,從而經「思考」後讓實時翻譯變得更準確。

據統計,針對演講核心內容,搜狗同傳3.0識別正確率提升了21.7%,翻譯正確率提升了40.3%。

隨著國際交流日趨頻繁,國際交流中的現有同聲傳譯服務成本高、人才不足,難以滿足需求。搜狗CEO王小川說,全球20%的人口是說中文,但是全球95%的信息是用英文所寫的,因此如何幫助中國人跟外國人進行更好的交流,變成了一個重大的技術課題。

在同傳行業中,翻譯從業者並沒有減少,但滿足專業同傳需求的人才卻更加稀缺。面對大會傳譯中專業術語識別和翻譯,許多英語出身的普通翻譯工作者難以駕馭,現有的同傳機器也大多採用通用模型,因此許多醫療、物理、經濟、人工智慧領域的專業術語及新興概念翻譯成為一大難點,弄不好就「驢頭不對馬嘴」。

其實,針對這些行業痛點,搜狗早在2018年推出的同傳2.0就具備了「個性化定製」功能。同傳2.0通過對大會嘉賓的文稿、PPT、百科知識進行提前學習,使得現場傳譯更加準確。

但是,現實很骨感。當真正一場大會舉辦起來時,一些演講人的PPT和材料很難提前獲取,因此定製環節也變得難以在會前完成。搜狗同傳3.0由此應運而生。3.0版本通過實時捕捉PPT上的內容,進而發揮「語境引擎」作用優化翻譯效果。

一、「投子」、「羅輯思維」都能翻對,與人工差距縮短60%

以大會同傳為例,當嘉賓說出「投子」,機器很可能識別為「投資」,但是搜狗同傳3.0通過識別PPT上的「阿爾法狗」和「李世石」,能夠擴展出「投子」這樣的術語;

當聽到「羅輯思維」,搜狗同傳3.0會根據PPT上的「羅振宇」進行知識圖譜擴展,從而直到此「羅輯」非彼「邏輯」;

當聽到「INI」,人們不太熟悉這個縮寫,搜狗同傳3.0會查詢中英文知識庫後,把相應的中文解釋「國際神經科學研究所」給翻譯出來。

▲搜狗同傳3.0的對眾多易錯詞彙的翻譯準確率大大提高

從某權威論壇的數據評測得分上可以看到,相比於人工同傳4.08的得分,3.0版本的系統得分從2.0版本的3.41分上升為3.82分,與人工同傳的差距縮短60%左右。

除了大會演講的同傳之外,搜狗同傳3.0作為一套完整的技術體系,在眾多場景中都有用途。比如記者採訪、跨國辦公會議、中英文視頻直播、字幕翻譯、法院庭審等等,都可以在搜狗語境引擎的輔助下完成更簡單的表達和信息獲取。

二、語境引擎、知識圖譜加持,5步優化翻譯

簡單來說,搜狗語境引擎最主要的創新是為同傳系統增加了視覺通道。同樣以大會同傳為例,利用「語境引擎」進行「邊聽邊看邊思考」地翻譯大致包括以下5個步驟:

1、通過OCR技術識別PPT頁面上的內容;

2、針對識別結果,生成與PPT對應的領域詞彙表;

3、利用領域詞彙表進行知識圖譜的擴展,從而形成擴展詞彙表;

4、針對擴展詞彙表,查詢搜狗中英專業術語庫;

5、在語音識別端和機器翻譯端使用擴展詞彙表進行增強,提升整體翻譯效果。

通過語境引擎技術,搜狗將能「視聽合一」的多模態思路應用到新的同傳系統,它帶有一些簡單的思考能力,通過知識圖譜能夠實時地把它看到的東西拓展成知識網絡,放到同傳生態系統中去,從而優化翻譯效果。

▲搜狗同傳3.0技術架構圖

三、三年上千場大會,搜狗同傳「過三關」

早在2016年,搜狗就在第三次世界網際網路大會上發布了大會同傳1.0。在當時,語音識別準確率便超過97%,機器翻譯準確率達90%。

但是,搜狗AI交互技術部總經理陳偉告訴智東西,當時的準確率是在一定的測試集上測出來的,但當面臨實踐中的方言口音、專業術語、中英混說等問題,系統的波動性很大。

而這種只有深入行業後才能真實體會到的行業痛點,也成為搜狗同傳產品不斷迭代的動力。

2018年,搜狗同傳進入2.0的階段,可以實時根據用戶語料進行定製;而近日推出的同傳3.0,主要強調的是多模態和自主學習的過程,能聽會看,能理解和推理大會場景下演講人到底在說什麼。

從搜狗同傳3.0技術框圖可知,搜狗同傳系統主要包括語音識別、機器翻譯和語音合成。

從語音識別模塊的演進來看,1.0系統僅僅輸入語音;2.0的時候開始做到語音+個性化,以及說話人的語境背景輸入;3.0的時候則加入了知識圖譜,把這些信息作為語音識別的輸入。

AI交互技術部總經理陳偉說,目前,行業內傳統的AI同傳的運作方式仍介於1.0和2.0之間,我們根據圖譜方式,已經到3.0時代了。

從機器翻譯模塊來看,1.0的時候採用RNN的模型結構,這種模型結構的問題是只能記憶低至10字左右;2.0版本則升級為Transformer翻譯模型,從而解決了對歷史的依賴;現在,3.0又升級了翻譯系統,採用基於上下文流式解碼方式和基於搜狗百科知識圖譜的方式。

結語:找準行業痛點,開闢機器同傳新路徑

搜狗同傳3.0在業內首次推出音視覺結合的語境引擎,為同傳行業中的機器參與實踐開闢了新思路。從僅依賴語音進行識別和翻譯,到利用PPT等場景視覺載體,並通過知識圖譜、流式解碼等技術實現知識推理、優化翻譯,搜狗帶來了具有行業「Know How」的新路徑。

搜狗同傳的技術迭代和翻譯準確率提升,來自於上千場同傳會議的實踐中對應用場景的深入洞察,也來自於搜狗國內首屈一指的輸入法和搜尋引擎為其帶來的海量網際網路數據和語言基因。

對於同傳行業來說,機器翻譯在短期內仍然難以實現人工翻譯的「信達雅」的「雅」,甚至在「達」上也還欠缺火候。但是,通過音視結合的多模態技術、知識圖譜等知識計算技術,機器能夠率先攻破一些涉及專業知識的特定應用場景,做得比普通翻譯人員更好。

相關焦點

  • 搜狗首創語境引擎:AI同傳最強進化,PPT翻譯正確率猛升40%
    【新智元導讀】手握搜尋引擎和輸入法兩張王牌,搜狗在AI同傳領域又放出大招——搜狗同傳3.0驚豔亮相。基於搜狗獨創的「語境引擎」,搜狗同傳3.0以「多模態」和「自主學習「為核心,加入視覺和思維能力,讓AI同傳不僅會聽,還首次具備了會看、能理解會推理的能力。搜狗一小步,同傳一大步。戳右邊連結上 新智元小程序 了解更多!
  • AI同傳再進化:看懂PPT會思考,專業術語翻譯準確率大幅提升40%
    經過了3年的迭代升級,搜狗同傳3.0,集成了哪些最新的技術突破呢?近日,在搜狗同傳的一場交流會上,搜狗AI交互技術部總經理陳偉告訴我們,之前的AI同傳都只是聽,而搜狗同傳3.0是目前業內首個推出的多模態同傳技術,在同行中處於領先地位。多模態同傳,即AI獲取信息的渠道不再是語音,還包含圖像等其他內容。
  • AI擔任隨身翻譯官,搜狗同傳支持2019 CES「中國之夜」
    首頁 > 傳媒 > 關鍵詞 > AI最新資訊 > 正文 AI擔任隨身翻譯官,搜狗同傳支持2019 CES「中國之夜」
  • 有道翻譯官3.0實測:您的「掌上同傳」已上線-有道翻譯官3.0,實測...
    這並不是誇張,而是有道翻譯官3.0的全新功能升級。日前,有道翻譯官3.0版在各大應用市場上線,主打107種語言的「全語種」翻譯以及優化後的實時翻譯功能,這也就是上文中所提到的:零等待、實時同步的「掌上同傳」體驗,這一功能在有道翻譯官的拍照翻譯、語音翻譯以及實時輸入翻譯中都有所體現。
  • 搜狗同傳助力《商學院大百科》與國際經濟學家展望2020
    搜狗同傳為本次講座提供了全程中英文雙語的在線直播,並以準確高效的翻譯水準,為訪談增添了一抹科技色彩。  作為西班牙IE商學院教授、著名經濟學家Gonzalo Garland,他在講述具有宏觀高度的國際經濟學內容時,時常涉及到不少專業的生僻詞彙,這很容易讓一些觀眾們腦中的「同傳系統」突然宕機,導致可能錯過演講時的精彩部分。
  • 中網結束後AI同傳火了,國際賽事首次使用機器翻譯是種什麼體驗?
    其中最特別的,是中網這次全程採用了搜狗的AI同傳技術,從賽前的媒體發布會到決賽結束的冠軍採訪,這位人工智慧翻譯官的出現,打破了語言之間的障礙,來自49個國家的運動員以及數以萬計的中國觀眾,就此融為一爐。
  • 搜狗翻譯獨家支持PBIC 2020國際挑戰賽,展現優異AI同傳能力
    搜狗翻譯鼎力支持PBIC 2020賽事,為現場提供了精準流暢的AI同傳服務,通過架起語言溝通橋梁、助力公益無國界。助力國際公益賽事,搜狗翻譯讓跨語言溝通無障礙青少年公益創新國際挑戰賽始於2017年,在聯合國機構的指導下積極踐行「一帶一路」與中非合作倡議,著眼於中非之間民心相通和人文交流。
  • 全能翻譯 一機兩用,搜狗發布首個支持自由對話翻譯的AI錄音筆
    發布會播出過程中,S1就因其在業內首創的自由對話翻譯及個人同傳功能而引發不少網友關注,「原來S1不止是『速記師』,還是一個『翻譯官』!」率先將同傳服務個人化,人人都有翻譯官搜狗新款AI錄音筆S1和E1,也是首個具備個人同傳能力的錄音筆。搜狗是國內領先的以語言為AI核心的人工智慧企業,語音同傳技術一直處於業內領先地位,先後為蘋果產品發布會直播、世界物聯網博覽會、前哨大會等國際性活動提供過同傳服務,早已得到市場的廣泛認可。
  • 股價逆勢上漲,搜狗的AI戰略想像空間有多大?
    搜狗是一個值得拿來聊聊的公司。昨日美股經歷了活久見的熔斷一夜,而搜狗成為中概股中為數不多股價飄紅的公司,甚至一度拉到超15%的漲幅。因為搜狗昨天發布了它2019年Q4和全年業績報告。那麼財報裡究竟有什麼樣的內容,才讓資本市場如此看好。接下來,我們一起來看下搜狗這份財報。
  • 盤點FINA遊泳世界盃四大亮點,AI同傳提供實時翻譯C位搶鏡
    首次啟用AI擔任現場翻譯官,科技與體育跨界碰撞作為本次賽事的獨家合作夥伴,搜狗同傳為大賽提供了全程現場AI同傳翻譯服務,首次登陸水立方國際賽事就大展身手。以前看賽事直播,外國的選手接受記者採訪,由於語言的限制,中國觀眾們「只聞其聲不解其義「,只能等待後期媒體的轉述。
  • AI翻譯帶你看懂蘋果發布會:搜狗同傳全程提供中英雙語直播
    AI翻譯帶你看懂蘋果發布會:搜狗同傳全程提供中英雙語直播     9 月 11 日凌晨, 2019 蘋果秋季新品發布會在美國加州庫比蒂諾賈伯斯劇院舉辦,搜狗同傳提供了發布會全程的中英雙語字幕直播
  • 錄音+翻譯雙管齊下,搜狗AI錄音筆S1讓你從容面對各種會議
    因此,搜狗錄音筆也在語言方面精心鑽研,將多種語言內置在搜狗AI錄音筆S1中,大大解決了職場精英在錄音和交流過程中遇到的難題,讓這款錄音筆在錄音轉寫強大的基礎上,優化了語言功能,使其與國際化接軌,符合現代化職場精英的辦公需求。
  • 訊飛AI同傳被指造假:同傳譯員親自揭發,訊飛用人類翻譯冒充AI
    但會後,會議現場的人類同傳譯員不幹了:哪有什麼AI同傳,明明是剽竊我這個人類同傳譯員!究竟是怎麼一回事?但是左側的中文,表達清晰,用詞準確,簡直流暢到逆天啊!這訊飛聽見是怎麼在聽不懂英文原文的情況下,如此流暢的翻譯出日本教授的英文演講呢?難道這個AI會讀取意念嗎?當然不,所有的中文翻譯,都是Bell同學女搭檔現場翻譯的。這裡壓根沒有人工智慧翻譯,都是人類智能翻譯。
  • 搜狗AI錄音筆S1多語言轉寫翻譯,專治低效工作和語言不通
    因此,搜狗錄音筆也在語言方面精心鑽研,將多種語言內置在搜狗AI錄音筆S1中,大大解決了職場精英在錄音和交流過程中遇到的難題,讓這款錄音筆在錄音轉寫強大的基礎上,優化了語言功能,使其與國際化接軌,符合現代化職場精英的辦公需求。
  • 多語言轉寫翻譯,搜狗AI錄音筆S1讓你參加跨國會議也不愁
    因此,搜狗錄音筆也在語言方面精心鑽研,將多種語言內置在搜狗AI錄音筆S1中,大大解決了職場精英在錄音和交流過程中遇到的難題,讓這款錄音筆在錄音轉寫強大的基礎上,優化了語言功能,使其與國際化接軌,符合現代化職場精英的辦公需求。
  • 邊聽邊看風光無限! 百度全新發布語音到語音的同傳AI小程序
    5月26日,2019自然語言處理前沿論壇上百度人工智慧技術委員會主席何中軍博士帶來「機器同傳:進展與展望」的主題演講,並現場使用了「百度翻譯AI同傳」這一語音到語音的全新同傳產品。  據介紹,全新百度翻譯AI同傳小程序僅需掃碼即可使用,同傳直播頁支持邊聽邊看,體驗更實時、流暢。採用雲端接入方式,無需傳統的同傳設備,降低會議成本。此外,會後同傳記錄還可以一鍵同步網盤,方便隨時查看。
  • 助力2020運聯峰會 搜狗同傳讓世界重新認識中國物流
    本次峰會聚集了中國物流產業鏈的諸多優秀企業,基於領先AI翻譯技術的搜狗同傳以高效、精準的翻譯效果將最具前瞻性的觀點呈現給現場觀眾。  全程提供AI同傳服務,見證行業破局與創新  搜狗同傳作為此次峰會的獨家同傳合作夥伴,為現場嘉賓觀眾提供了專業的同傳服務,助力大會獲得圓滿成功。
  • 你需要翻譯官+速記師?搜狗AI錄音筆S1一機搞定
    而搜狗AI錄音筆S1作為搜狗AI錄音筆的旗艦產品,集錄音轉寫、智能整理、高效翻譯、同聲傳譯、多屏共享於一體,打破了傳統錄音筆的功能限制,進一步提升了職場人的工作效率,更符合商務精英的個性化需求,成為記者、記錄員、文字工作者、律師等職場人的必備記錄利器。
  • 川妹子做同傳翻譯:日進萬元是真的
    作為兼職同傳,秋天旺季時一個月最多可以接七八場同傳翻譯   ■天府早報記者王亞楠   熱播電視劇《親愛的翻譯官》已經迎來大結局,但關於翻譯這個職業的討論卻還在熱火朝天中   對於近期收視火熱的電視劇《親愛的翻譯官》中的內容,李硯穎表示自己並沒有特別關注過,「畢竟我是做英漢同傳,和電視劇中楊冪飾演的法語同傳是有差異的。」   據了解,因為同傳對譯者要求極高,所以專業的全職翻譯在二線城市並不多,因此這個職業對外人來說非常神秘。李硯穎說:「我在大學的時候因為英語口語好,就被老師叫去做一些簡單的口譯工作,後來對同聲傳譯慢慢才有了了解。」
  • 年中最頂尖AI論壇4天19場!百度翻譯同傳堪稱「超級翻譯官」
    百度翻譯同傳現場效果展示人工同傳專業性強,難度極高同傳是一項專業性極強、難度極大、耗腦又耗嗓的工作。除了深厚的語言能力外,還需要極強的反應能力,邊說邊聽,精力高度集中,對譯員的腦力和體力都是極高的挑戰。因此往往一場會需要兩個甚至多個譯員共同完成同傳。