數博會前沿 | 搜狗IoT產品總監李健濤:搜狗AI翻譯駛入實用化快車道

2020-12-13 砍柴網

誰是大數據賽道上的「最強大腦」?人工智慧領域高端對話聚焦於哪些話題?一年一度的國家級博覽會——貴陽數博會正如火如荼得舉行。作為全球首個大數據主題的博覽會,數博會已經成為權威的研討平臺,不僅雲集了國內各大網際網路公司、科技公司掌門人,來自全球的業界頂尖專家也應邀參會。搜狗IoT產品總監李健濤作為AI創新的翹楚,在數博會上進行了主題為《搜狗AI進擊之路》的演講,向全球的參會嘉賓展示了搜狗在AI翻譯領域的前沿科技成果。

他表示,搜狗在搜索和輸入法領域的業務已持續十三、四年的時間,擁有龐大的數據積澱,搜狗以「語言」為核心的AI布局具備強大的競爭力。搜狗的語音和圖像識別技術的日趨成熟、從搜索到問答的變化、從輸入法到對話的發展、以及搜狗在AI翻譯領域的推陳出新,都代表著搜狗在AI領域的創新和「進擊」。

  做「語言」,搜狗比其他公司更專業

在演講的開篇,搜狗IoT產品總監李健濤介紹道:搜狗是中國用戶數第四大的網際網路公司,搜狗輸入法市場佔有率多年蟬聯第一,搜狗搜尋引擎市場份額穩居第二位。他認為:「搜狗是中國搜索行業的挑戰者,是AI領域的創新者。」搜狗輸入法和搜尋引擎十幾年的積累,為搜狗在AI領域的發展,提供了大量的文字和語音數據支持,搜狗每日語音調用次數超3億,峰值超3.6億次以上,這些數據背景是其他公司所不具備的。

為什麼數據對人工智慧至關重要?李健濤對相關技術了如指掌:「對人工智慧來說,有兩個重要的影響,一個是算法,一個是數據。在算法方面,行業裡面各家的差異並不大。但是人類需要通過數據訓練機器,讓機器懂得識別到底是什麼處理機制。所以數據是很多人工智慧公司能否產生重大技術突破的一個關鍵因素。」

所以,對搜狗的人工智慧算法來說,多年積累的海量數據是得天獨厚的深度學習資料,幫助AI在語音識別、圖像識別、機器翻譯等方面日漸趨於精準、接近真人水平。

李健濤介紹道:「搜狗整體人工智慧布局圍繞『語言』展開。主要是兩大方面——語言的兩種載體,一種是語音,一種是圖像。」

搜狗的AI語音技術,融合了語音識別、語義理解和語音合成三個密不可分的部分,將傳統機器的識別和運算能力升級,成為了「更靈敏的耳朵」和「更聰明的大腦」。目前,搜狗語音識別準確率已達97%。

搜狗的圖像識別技術同樣不可小覷,它收集了數十萬張圖像進行系統訓練,最終實現了80%的圖像識別高準確率,可完成對犬類、花卉等類似圖片的識別。更加「黑科技」的點在於,搜狗還實現了唇語的識別,支持10萬+非特定人詞彙量、口語測試集60%以上準確率,在車載或智能家居等垂直場景的命令集中,準確率超過90%以上。

此外,李健濤透露,搜狗輸入法加入了「機器輔助對話」元素,具備詞補全、智能回復、智能分享等多個實用功能;搜狗搜索也會向「問答」方向發展,搜狗問答機器人汪仔、搜狗答題助手、搜狗立知等產品就是「問答」的落地應用。

  AI翻譯在硬體上的施展機會更多

李健濤在AI翻譯技術方面有著深入的了解:「在翻譯方面,我們認為技術程度已經達到臨界點,可以真正的大眾民用化。」 搜狗獨創的基於神經網絡的機器翻譯技術 ,實現了語音翻譯、對話翻譯、文字翻譯、圖像翻譯等豐富的交互翻譯方式,可完成61種語言互譯。優秀的技術能力,也收穫了市場的廣泛認可,李健濤提到:「搜狗翻譯相關產品日均翻譯請求已超1.5億次,覆蓋全球超過1000萬用戶。」 在國際學術賽事WMT 2017中,搜狗機器翻譯獲得了人工評價指標的雙向第一名。

基於神經網絡機器翻譯技術,搜狗輸入法已上線翻譯功能,用戶可在聊天場景中進行中、英、日、韓等語言的翻譯;搜狗搜索中上線了英文搜索頻道,幫助用戶用中文搜索全世界,現在還支持對日語、韓語信息的檢索。此外,搜狗還上線了翻譯App,在不同場景下進行聲音、圖片和文字的翻譯;搜狗機器同傳是全球首個商用機器同傳,在達沃斯、世界網際網路大會等百餘場國際化會議中被廣泛應用,同樣也被本次數博會聘為同傳指定服務商之一,為發言人和演講者提供了準確的同傳服務,獲得了與會嘉賓的交口稱讚。

李健濤著重介紹了搜狗旅行翻譯寶和搜狗錄音翻譯筆,這兩款智能硬體翻譯產品,針對了不同的場景和群體。李健濤著重對它們進行了區分:搜狗旅行翻譯寶首創離線翻譯模式,翻譯效果與在線效果持平,同時具備實景拍照翻譯,「解決了不會說、聽不懂、看不懂的痛點。」而搜狗錄音翻譯筆主要面向學生、記者和商務人士,不僅支持實時錄音轉文字,還可以完成同傳翻譯、對話翻譯功能。「語音識別準確率超過97%,每分鐘400字的轉寫速度, 支持分享給朋友和社交平臺。」

最後,李健濤表示,搜狗的使命是讓人們表達和獲取信息更簡單,「萬物互聯時代到來,搜狗在AI方面會繼續探索,未來會不斷將人工智慧技術落地,真正做到民用化。」作為開拓者和領軍者,搜狗還將為行業帶來突破,為大眾創造驚喜,讓我們拭目以待。

相關焦點

  • 智能語音顛覆傳統錄音行業 搜狗智能錄音筆一體化解決案頭工作
    近日,搜狗開始發售全新智能硬體「搜狗智能錄音筆C1」,該設備通過採用搜狗知音深度卷積神經網絡ASR能力,語音轉文字識別準確率高達95%。值得注意的是,搜狗智能錄音筆C1融合了包括語音識別、語音合成、機器翻譯等各種技術,是搜狗以語言為核心進行人工智慧布局的重要一環。
  • 連續推出兩款翻譯類產品,搜狗做硬體的核心邏輯仍是AI
    從今年第一季度開始到現在,搜狗已經連續發布了兩款基於AI技術的翻譯類硬體產品,搜狗旅行翻譯寶和搜狗錄音翻譯筆。論產品的顛覆性,搜狗旅行翻譯寶並非行業首創,科大訊飛、網易、準兒等廠商此前都有過同類產品問世,但它對於搜狗的意義在於找到了一個讓自身AI技術和具體應用結合的最佳載體,使其一舉登上了AI戰略高地。
  • 從技術到產品,搜狗為我們解讀了神經機器翻譯的現狀
    在深度學習快速發展的今天,機器翻譯系統的能力究竟達到了什麼樣的水平?機器翻譯是否已經可以代替人類翻譯?3 月 17 日,機器之心與搜狗共同舉辦的 INTERFACE 線下分享中,搜狗語音交互技術中心研發總監陳偉、搜狗 IOT 事業部產品負責人李健濤,從技術和產品兩個方面為我們回答了這些令人感興趣的問題,解讀了搜狗,以及業內目前機器翻譯技術的現狀。
  • 搜狗發布智能錄音筆C1,聲紋識別講話人,實時轉文字
    搜狗AI硬體事業部首席產品經理李健濤表示,「搜狗的智能硬體均以智能語音為核心。」具體這款硬體的轉寫準確率為95%(0.3-2米範圍)。李健濤在發布會上一共強調了幾個重點。實時語音轉錄。李健濤表示,搜狗智能錄音筆C1通過搭配手機APP可以實現錄音內容實時轉錄(文字)。此外,與傳統語音軟體服務收費模式不同,搜狗智能錄音筆C1語音轉錄為免費功能。Smart Voice數字降噪算法。
  • 2018搜狗合作夥伴大會召開:AI賦能助力搜狗創新與共贏
    作為中國人工智慧的創新者,搜狗以「語言」處理為核心,目前已先後將自研AI技術落地於搜狗搜索與輸入法等核心產品中。而在全球化的浪潮中,是否能用中文打通全球信息將成為至關重要的一步。  「對話和問答以外,語言處理技術今天90%-95%的實用集中在翻譯領域。翻譯技術走向實用化的歷史意義,不亞於人類發明了電。
  • 機器翻譯的巨輪勢不可擋,搜狗正在嘗試引領航向
    在和搜狗IOT事業部首席產品經理李健濤的交流裡,他將臨界點標註於神經網絡的大規模訓練開始成為網際網路公司的突破日程上,它意味著只要給予足夠豐富的學習資源和能夠自主運行的智能程序,加上遠遠小於代際尺度的時間成本,調教出能夠滿足日常會話的即時翻譯產品已經不是難以企及的預期。
  • 搜狗翻譯APP做「同行」 翻譯專家如何看待AI落地翻譯領域?
    面對具有深度學習能力的AI,翻譯領域成為大家眼中最可能被「攻陷」的行業之一。人們在問,離人工智慧獨立、完整、成熟地翻譯一部文學作品還需要多久?如此一來,是否意味著大多數譯者將面臨失業?近日,在搜狗搜索舉辦的「打破信息的邊界,和世界溝通」產品體驗季主題分享會上,中英同聲傳譯專家Jonathan Rechtman表示看好機器翻譯「進入」翻譯領域。
  • 搜狗發布翻譯領域新動態 未來AI布局重在語言
    AI賦能 搜狗多款重磅翻譯產品落地  2017年搜狗成功赴美IPO, 成為「中國赴美上市AI第一股」,不過王小川在演講開篇卻說到,「IPO只是搜狗新的開始。」通過14年的積累,目前搜狗已成長為用戶規模僅次於BAT的網際網路公司,搜狗搜索為中國第二大搜尋引擎,輸入法為全球第一大中文輸入法 。
  • 搜狗翻譯APP亮相 可同步呈現中英雙語頁面
    分享會上,在對搜狗英文搜索進行全面介紹之外,搜狗搜索發布創新產品搜狗翻譯APP,展示了其人工智慧技術在翻譯領域的最新研究成果。搜狗英文搜索產品負責人趙絢給出了答案。趙絢指出,中文資訊只佔全球信息的10%,各領域最前沿的學術信息、購物資訊、時尚知識等大量優質內容都集中在英文世界。全球化趨勢下,國人在旅遊、留學、海淘等各場景中對英文資訊的需求增長迅猛,卻面臨著語言障礙等眾多門檻。基於此,搜狗搜索早在2016年就推出搜狗英文搜索垂直頻道。
  • 搜狗副總裁吳滔:巨頭紛紛布局的AI翻譯市場 搜狗如何做到業內第一?
    在認知基礎上,我們將產品發展為對話和問答,中間還包括翻譯,希望能夠做到了解用戶意圖,並能夠回答用戶的問題。」對於搜狗正在做的AI翻譯,吳滔表示,搜狗的海量用戶和大數據積累為搜狗AI翻譯奠定了雄厚基礎。作為中國用戶數量第四大的網際網路公司,每日搜索和輸入法都能積累大量的語料資源用於機器學習。「目前,我們能從自己的搜尋引擎裡挖掘上億的語料,這對我們訓練模型非常有益。」
  • 搜狗英文搜索、翻譯APP亮相體驗季,與人類翻譯專家同臺論道
    分享會上,在對搜狗英文搜索進行全面介紹之外,搜狗搜索發布創新產品搜狗翻譯APP,展示了其人工智慧技術在翻譯領域的最新研究成果。(圖:搜狗英文搜索產品負責人趙絢現場介紹英文搜索垂直頻道)  趙絢指出,中文資訊只佔全球信息的10%,各領域最前沿的學術信息、購物資訊、
  • 搜狗翻譯API上線日韓法俄新語種 為開發者提供高質高效的翻譯服務
    如今,搜狗搜索已將前沿的人工智慧技術應用於翻譯領域,為身處全球各地的開發者提供高質量機器翻譯服務,語言的藩籬逐漸被打破。  近日,搜狗機器翻譯API接口新增小語種,支持日、韓、法、俄與中文互譯,其翻譯質量均處於業內領先水平。與此同時,搜狗翻譯還上線SDL trados機器翻譯插件——Sogou Translate Plugin,幫助用戶在翻譯過程中憑藉機器翻譯結果實現批量翻譯。
  • TechCrunch對話搜狗副總裁吳滔:智能翻譯硬體 助搜狗開拓「AI疆土」
    作為中國用戶量第四大的網際網路公司,搜狗移動搜索用戶數5. 11 億,搜狗輸入法覆蓋 5 億用戶,每日中文輸入 900 億次,搜狗核心業務線早已深入千家萬戶。而事實上,搜狗在翻譯領域也在不斷積聚實力,搜狗翻譯相關產品日均翻譯請求約1. 5 億次,覆蓋全球超過 1000 萬用戶。隨著不斷在AI翻譯領域實現技術突破和場景化落地,「翻譯」儼然已經成為搜狗 2018 年新的關鍵詞之一。
  • 搜狗翻譯APP創新升級:AI+AR實景技術加持,中英文菜單「秒翻秒懂」
    新版搜狗翻譯APP的最大亮點,是將前沿的AR實景技術應用於翻譯領域,在拍照翻譯的結果呈現上,可對角度、透視、畸形有更好的包容度,並能實現結果與原圖更加「嚴絲合縫」的效果,讓翻譯結果「所見即所得」。同時,在「拍照翻譯」功能界面裡,新增了創新的「菜單翻譯」功能。
  • 搜狗英文搜索及翻譯APP亮相 可同步呈現中英雙語頁面
    「打破信息的邊界,和世界溝通」為主題的產品體驗季分享會,與中英同聲翻譯專家Jonathan Rechtman、「非主流翻譯家」谷大白話等共同探討人工智慧加持下,如何打破語言壁壘,與世界無界溝通。分享會上,在對搜狗英文搜索進行全面介紹之外,搜狗搜索發布創新產品搜狗翻譯APP,展示了其人工智慧技術在翻譯領域的最新研究成果。
  • AI成果橫跨五大領域 第三方機構權威報告公認搜狗搜索行業第二
    作為人工智慧帶路黨,搜狗以「自然交互+知識計算」為核心戰略,著力於AI前沿技術的研發,並已將領先的研發成果落地到了問答、翻譯、醫療、圖片、法律服務等眾多領域,為用戶帶來了更加多元、精準、便捷、實用的應用體驗。
  • 搜狗手機瀏覽器全新上線智能翻譯功能
    近日,針對以上這些常見的問題,搜狗手機瀏覽器安卓版全新推出了集語音對話翻譯、AR實時翻譯、拍照翻譯和全文翻譯於一體的智能翻譯功能。無需額外安裝插件,即可隨時隨地在關鍵時刻為你解決語言難題。當你需要與外國人進行對話時,只需按住藍鍵說中文,或按住紅鍵讓對方說英文,語音對話翻譯功能將你們說的話翻譯後,會以對方的語言說給對方聽,同時屏幕上也會顯示對話的文字記錄和翻譯結果。相比需要其他翻譯軟體,搜狗手機瀏覽器的對話翻譯結果準確度更加高,操作也更加簡單方便。
  • 實時轉寫率達98%,搜狗新款錄音筆首創AI降噪功能,可自動提煉錄音...
    26日,搜狗就推出了S1、E1兩款錄音新品,還與故宮宮廷文化合作推出了S1和C1 Pro兩款產品的故宮宮廷聯名款。在原有錄音筆C1的基礎上實現了進一步升級,通過賦予產品超強拾音、準確轉寫、高效整理以及全能翻譯等能力進一步提升使用體驗。
  • 搜狗與vivo聯手合作 AI翻譯重構NEX3手機的跨語言體驗
    在這款新品中,搜狗翻譯繼續與vivo進行合作,讓vivo NEX3的用戶可以體驗搜狗最新的翻譯技術,感受更加便捷、優質的翻譯服務。這也是繼去年搜狗首次牽手vivo,開啟智慧型手機AI翻譯新紀元後,又一次為vivo用戶帶來的全新升級。
  • 搜狗手機瀏覽器上線新功能,提供全方位智能翻譯服務
    近日,針對以上這些常見的問題,搜狗手機瀏覽器安卓版全新推出了集語音對話翻譯、AR實時翻譯、拍照翻譯和全文翻譯於一體的智能翻譯功能。無需額外安裝插件,即可隨時隨地在關鍵時刻為你解決語言難題。相比需要其他翻譯軟體,搜狗手機瀏覽器的對話翻譯結果準確度更加高,操作也更加簡單方便。AR實時翻譯&拍照翻譯:所拍即所譯在國外的餐廳用餐,面對看不懂的全英文菜單常常會點錯餐,用搜狗手機瀏覽器的AR實時翻譯功能就可避免尷尬。只需點擊搜索欄右側的 「相機」即可進入AR實時翻譯和拍照翻譯的界面。