搜狗王小川:2020年 機器翻譯的某些指標可以趕上人類翻譯

2020-12-19 中文科技資訊

  北京時間5月20日,2018全球人工智慧技術大會(GAITC)在北京召開。作為中國人工智慧技術和產業領域規模最大、影響力最強的專業會議之一,GAITC邀請到了中國工程院院士李德毅、圖靈獎得主姚期智、歐洲科學院院士漢斯·烏思克爾特等數十位業界專家,共同獻上了數場精妙絕倫的主題演講和對話。搜狗CEO王小川應邀在活動上發表了主題為《語言AI之路與挑戰》的演講。他回顧了人工智慧在語言領域取得的進展,並指出「到2020年,機器翻譯在一些指標上可以趕上人類翻譯。」

  作為國內用戶量第四大的網際網路公司,搜狗多款產品獲得了市場的認可,搜狗輸入法市場佔有率多年保持第一的位置,搜狗搜尋引擎市場份額為中國第二。基於在語言領域積累的海量數據和領先能力,搜狗率先布局了以語言為核心的人工智慧戰略。

  從軟體到硬體,搜狗讓AI技術能夠融入每個人的生活,構建起翻譯、問答、輔助對話等使用場景。

  搜狗翻譯:讓華語世界連接全世界

  翻譯是搜狗近兩年來著力發展的方向。搜狗CEO王小川介紹道:「搜狗機器翻譯是以搜狗獨創的基於神經網絡的機器翻譯技術為算法;同時,憑藉搜狗輸入法、搜狗搜尋引擎多年用戶使用積累,產生了豐富語料供AI自主學習。」經過大量的訓練和積累後,搜狗神經網絡機器翻譯的準確率愈發提高,屢獲國際大獎。在國際學術賽事WMT 2017中,獲中譯英系統八項機器評價指標中的七項第一。

  神經網絡機器翻譯技術,目前已經在搜狗的核心產品中進行應用:搜狗輸入法上線翻譯功能,用戶可在聊天場景中進行中、英、日、韓等語言的翻譯;搜狗搜索中的英文搜索頻道,可以幫助用戶用英文搜索全世界。此外,搜狗還上線了翻譯App,幫助有專業需求的用戶進行聲音、圖片和文字的翻譯。

  2018年,搜狗的兩款智能硬體——旅行翻譯寶、錄音翻譯筆正式發售。這兩款產品是搜狗神經網絡機器翻譯技術、語音識別技術、OCR圖像識別等高精尖技術的集合性落地,讓AI機器翻譯技術融入到生活和工作場景中,讓每個人都可以享受AI技術給生活帶來的便利。

  值得一提的是,本次大會的所有中英互譯同傳字幕均由搜狗機器同傳提供。隨著演講者的話語,字幕條即刻滾動更新,因其迅速的反應、準確的翻譯,獲得了參會嘉賓的認可。王小川表示:「機器和翻譯人員還是有距離的。我們內部研發人員認為,在2020年時,可以在一些指標上趕上真人翻譯,一些地方甚至會更好,一些地方還有不足。」

  搜索的未來是問答 讓回答一步到位

  作為國內第二大搜尋引擎公司,搜狗一直致力於搜索技術的深耕和應用。去年,搜狗問答機器人汪仔參加《一站到底》,與節目中頂尖選手同場競技並取得勝利;今年的搜狗答題助手也幫許多人在「直播答題」類競賽中獲得了名次和獎金。但王小川顯然並不滿足於現有成績,他斷言:「搜索的未來是問答。未來搜尋引擎不應該只給用戶一個網頁,而是給用戶直接提供答案,這中間包含著知識推理和檢索的能力。」

  對此,他進行了更多的闡釋:「搜尋引擎所做的不僅僅是搜索、檢索,更需要完成閱讀理解,因為用戶輸入的關鍵詞五花八門,問題的真實意思是機器所不能確定的。」比如,有網友搜索「王者榮耀排位上分最好的時間段」而最佳答案其實是「需要組隊、有給力的隊友」。這些語言的多樣性、問題的不確定性,都是搜尋引擎、問答產品在未來需要面臨的問題。在這個方面,搜狗和學界持續合作,共同搭建資料庫、解決更多的問題。在雙方的通力合作下,相信搜狗會帶來更加貼合用戶心理的問答產品。

  AI輔助對話:不炒「自動回復」冷飯

  日前,在谷歌I/O大會上,主講人請虛擬語音助手Duplex自行預約理髮,測試中的Duplex在思維邏輯、對答正確性和速度方面,甚至還有極其類似真人的語音語調,都令業界驚嘆。

  與這款虛擬語音助手類似的「搜狗輔助對話」,或許是被大多數人忽略的一項功能,它不同於以往的「任務型對話」如siri,「聊天機器人」如微軟小冰,不再是機器按照模板對人類的問題進行反饋,而是基於大數據,對人類對話時最可能出現的回覆進行提示,由人類來掌控最終決定權,敲定最終回復的話語。機器所做的是為人類提高效率,而不是代替人類去回復、去思考。

  而人類點選的動作和主動輸入的動作,也是對機器提供答案的評價,這類評價數據,可以為機器的自主學習、自主更新提供資料,便於機器輔助對話性能的優化提升。如今,機器輔助對話的應用場景已由手機簡訊擴展到聊天軟體,針對用戶多樣化、趣味性、個性化的表達需求,搜狗也在持續研究更複雜的檢索模型、深度學習模型,讓「搜狗輔助對話」實現更好的效果。

  在演講的最後,搜狗公司CEO王小川透露,搜狗輸入法致力於自然交互,搜狗搜索則以知識計算為主,搜狗會考慮將二者的功能結合——「搜狗將不斷研發新的智能硬體產品,會在各種垂直領域推出虛擬個人助理,幫助用戶更好地表達和獲取信息。」

相關焦點

  • 搜狗王小川:機器翻譯,我們有信心做得比Google更好
    搜狗輸入法每天會被用戶調用 2 億次,所以當搜狗思考人工智慧的意義時,「照進現實」才是最強的使命感。在極客公園 GIF2017 的現場,搜狗 CEO 王小川全球首發了他們的新產品「海外搜索」,希望能讓搜狗在人工智慧領域的積累變成中國網際網路用戶和英語世界更快連接的工具。Google 退出了很可惜,但中文和英文的搜索世界依然需要一座「通天塔」。
  • 王小川WIC演講秀搜狗實時機器翻譯技術 準確率90%有望取代人類同傳
    第三屆世界網際網路大會於11月16日至18日在浙江烏鎮舉行,移動網際網路論壇上,搜狗CEO王小川與臉譜公司副總裁石峰、史丹福大學客座教授傑瑞·卡普蘭等人同臺論道,並發表了主題為《人工智慧的未來之路》的演講。
  • 搜狗發布翻譯領域新動態 未來AI布局重在語言
    1月24日,搜狗在北京舉行了2018合作夥伴大會。會上,王小川對搜狗的AI戰略及布局進行了詳細闡釋,公布了搜狗在翻譯領域的最新動作,同時發布兩件重磅智能硬體新品。  AI賦能 搜狗多款重磅翻譯產品落地  2017年搜狗成功赴美IPO, 成為「中國赴美上市AI第一股」,不過王小川在演講開篇卻說到,「IPO只是搜狗新的開始。」通過14年的積累,目前搜狗已成長為用戶規模僅次於BAT的網際網路公司,搜狗搜索為中國第二大搜尋引擎,輸入法為全球第一大中文輸入法 。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    神經機器翻譯在大規模翻譯任務上第一次獲得超越統計機器翻譯(SMT)的效果不過是 2014 年的事情(著名的 RNN encoder-decoder 結構就發表在 2014 年的 EMNLP 上),如今三年過去了,機器翻譯頂級論文中已經幾乎難以見到統計機器翻譯的身影,神經機器翻譯已經成為了機器翻譯領域的主流。
  • 搜狗翻譯API上線日韓法俄新語種 為開發者提供高質高效的翻譯服務
    如今,搜狗搜索已將前沿的人工智慧技術應用於翻譯領域,為身處全球各地的開發者提供高質量機器翻譯服務,語言的藩籬逐漸被打破。  近日,搜狗機器翻譯API接口新增小語種,支持日、韓、法、俄與中文互譯,其翻譯質量均處於業內領先水平。與此同時,搜狗翻譯還上線SDL trados機器翻譯插件——Sogou Translate Plugin,幫助用戶在翻譯過程中憑藉機器翻譯結果實現批量翻譯。
  • 王小川亮相「新聲實驗室」 帶來科技「新聲」
    王小川以《聖經》中巴別塔的故事為例:人類希望通過建造一個通天塔來與上帝對話,上帝卻認為建造通天塔是藐視他的權威。因此上帝讓不同人、不同民族開始說不同的語言,通天塔計劃因此失敗。他認為,語言是人類在思想交流、溝通合作中最關鍵的一個環節。
  • 搜狗英文搜索、翻譯APP亮相體驗季,與人類翻譯專家同臺論道
    基於此,搜狗搜索早在2016年就推出搜狗英文搜索垂直頻道。經過兩次產品升級後,目前搜狗英文搜索已成為全球首個跨語言搜尋引擎,實現使用戶直接輸入中文內容,就能搜索到相應英文資訊。同時,系統同步呈現英文原文、中文譯文、中英雙語三個結果頁面,方便用戶根據自身英文水平選擇查閱,打破語言的無形界限。
  • 機器翻譯的巨輪勢不可擋,搜狗正在嘗試引領航向
    事實上,讓科技解決語言障礙——而不必使用成本極其不划算的人力中介——一直以來都是一種頗具未來感的期待,早在上世紀九十年代初,聯合國就將計算機翻譯技術的開發(在當時被稱作是多語種通信環境工程)列為全球性的計劃,鼓勵各國投入研究,而中國亦在1997年成立了機器翻譯委員會,把程式設計師和翻譯員兩種可能「風馬牛不相及
  • 王小川發布搜狗新品:讓你不懂英文也能讀懂全世界
    搜狗輸入法每天會被用戶調用 2 億次,所以當搜狗思考人工智慧的意義時,「照進現實」才是最強的使命感。在極客公園 GIF2017 的現場,搜狗創始人、CEO 王小川全球首發了他們的新產品「海外搜索」,希望能讓搜狗在人工智慧領域的積累變成中國網際網路用戶和英語世界更快連接的工具。Google 退出了很可惜,但中文和英文的搜索世界依然需要一座「通天塔」。
  • 機器翻譯正在消除語言障礙,人類專業翻譯會下崗嗎?
    它可以做到雙方交流時,會對所講的話進行翻譯,並在智慧型手機上大聲播放。手持手機的人回應後,回答被翻譯,然後在耳塞中播放,該技術還能實時翻譯,適用於多種語言,使用方便。工業界對於機器翻譯已經開始摩拳擦掌。近日,微軟宣布自己的機器翻譯系統達到了人類專業翻譯的水平。
  • 業界| 搜狗知音引擎再進一步,實現語音實時翻譯
    機器之心原創作者:趙雲峰搜狗在烏鎮網際網路大會上發布了實時翻譯技術,此後,搜狗語音交互中心技術負責人陳偉詳細介紹了背後的技術框架和搜狗的多項核心技術。從 2012 年開始,搜狗開始組建語音團隊,使用的聲學建模技術一直在演進,目前比較穩定的線上系統是 CLDNN 系統,陳偉說:「它集合了三種不同結構,是一個複合的神經網絡結構。CNN 可以對變換起到不變性的作用,因此它能夠比較穩定地提取出一些恆定的特徵。第二塊是長短時記憶模型,能夠把非常長的上下文,歷史或者未來的信息融入到當前的識別中來。還有一塊是 DNN,可以提取深層的抽象的特徵。
  • WMT2017國際翻譯大賽,搜狗獲得中英/英中翻譯雙向冠軍
    語音翻譯,無疑是一個很好的突破口。擁有深度學習算法的加成,人工智慧讓機器學習變得更加「聰明」,足以打破語言文化的交流壁壘。從這一點來看,中國的科技公司已是佔據了領先地位。擁有語音技術積累的搜狗知音,在前幾天的WMT 2017國際評測中,獲得中英和英中翻譯雙向冠軍,機器翻譯的準確率和速度震動了整個業界。搜狗,已經跑在了人工智慧隊伍的前列。
  • 搜狗首創語境引擎:AI同傳最強進化,PPT翻譯正確率猛升40%
    搜狗公司CEO王小川的這席話道出了多少中國人的心聲?近日,王小川在某科技大會的演講中談到了「語言AI的未來構想」:我們作為做輸入法、搜索以語言為核心的公司,投了很多的力量來做相關的積累。在與搜狗AI交互技術部總經理陳偉和項目負責人趙超溝通後我們得知,在2016年「網際網路大會」上,搜狗同傳1.0首次亮相時語音識別準確率已經達到97%,機器翻譯準確率達到90%。
  • 中到英新聞翻譯媲美人類,微軟機器翻譯新突破
    「機器翻譯達到人類水平是我們所有人的夢想,」黃說道,「我們只是沒想到這麼快就實現了。」黃學東也領導了最近在對話語音識別任務中達到人類水平的研究組,他認為取得機器翻譯任務的這一裡程碑尤其令人高興,因為它可以幫助人們更好地理解彼此。
  • 王小川:「搜狗就是我的老婆」
    搜狗搜尋引擎一直沒有什麼市場,之後的一段日子裡,發展速度極為緩慢,王小川帶領的團隊拿到的薪水一直很低。到了2006年,品牌急劇滑落,士氣渙散。瞧,這並不是一個勵志故事。2013年,與騰訊戰略合作是王小川與搜狗一個重要轉折點。
  • 以語言為核心,除了識音識圖搜狗還推出了旅行翻譯寶
    而提供這一黑科技的便是搜狗。本次會議搜狗CEO王小川、CMO洪濤、COO茹立雲、CTO楊洪濤以及副總裁李剛皆出席了會議,據悉,這是第一個搜狗高管們集體亮相的會議。2014年5月接入了微信後,2015年1月,搜狗搜索推出了微信頭條,2015年11月,搜狗搜索接入了知乎,2016年5月上線搜狗名醫,同月上線搜狗學術以及搜狗英文,2017年1月,搜狗搜索上線英文搜索功能。
  • 機器翻譯人機PK實況:谷歌、有道、百度、搜狗,哪個像專業譯員?
    新智元報導 作者:胡祥傑【新智元導讀】 不得不說,機器翻譯已經和人類水平相差無幾,現在要判斷一段文字是機器翻譯的還是人類翻譯的,難度越來越大了。不信?去試試。最近,我們注意到,有一個叫做「試譯寶」的微信公眾號發布了一個機器翻譯人機PK:具體規則是給出三道題,每道題包含對一句話的四個版本的翻譯(其中有一個答案是人類譯員給出),參與者需要從這四個選項中選出一個自己認為最可能是人類譯員提供的答案,選對了為人類加一顆星,選錯了機器加一顆星。
  • 數博會前沿 | 搜狗IoT產品總監李健濤:搜狗AI翻譯駛入實用化快車道
    但是人類需要通過數據訓練機器,讓機器懂得識別到底是什麼處理機制。所以數據是很多人工智慧公司能否產生重大技術突破的一個關鍵因素。」所以,對搜狗的人工智慧算法來說,多年積累的海量數據是得天獨厚的深度學習資料,幫助AI在語音識別、圖像識別、機器翻譯等方面日漸趨於精準、接近真人水平。李健濤介紹道:「搜狗整體人工智慧布局圍繞『語言』展開。
  • 搜狗翻譯獨家支持PBIC 2020國際挑戰賽,展現優異AI同傳能力
    8月15日,主題為「創新實踐,公益非洲」的PBIC 2020 (第四屆) 青少年公益創新國際挑戰賽總決賽在北京舉辦。搜狗翻譯鼎力支持PBIC 2020賽事,為現場提供了精準流暢的AI同傳服務,通過架起語言溝通橋梁、助力公益無國界。
  • 機器翻譯革命強勢來襲 人類翻譯將無路可走?
    這一切都源於一項近年來不斷取得突破的技術——機器翻譯。人工智慧推波助瀾全球知名翻譯公司「一小時翻譯」執行長奧弗·紹尚日前警告說,未來1至3年內,基於神經網絡翻譯技術的機器翻譯將會承擔價值400億美元翻譯市場上的近一半工作,預計會導致50萬名翻譯失業。