百度發布即時翻譯「神器」 遠高於人類譯員的60%-70%

2020-12-25 硬派科技

百度發布即時翻譯「神器」 遠高於人類譯員的60%-70%

來源:中國新聞網 2018-10-24 16:09:52

人工智慧領域,兩種語言的「即時互譯」是一項難以攻克的技術問題,其主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。近日,百度研發了具備預測能力和可控延遲的即時機器翻譯系統,可實現兩種語言之間的高質量、低延遲翻譯。這是自然語言處理方面的重大技術突破,將對機器即時筆譯和口譯的發展起到極大地推動作用。

機器同傳利用語音識別技術自動識別演講者的講話內容,將語音轉化為文字,然後調用機器翻譯引擎,將文字翻譯為目標語言,顯示在大屏幕或者通過語音合成播放出來。相比人類譯員,機器最大的優勢是不會因為疲倦而導致譯出率下降,能將所有「聽到」的句子全部翻譯出來,這使得機器的「譯出率」可以達到100%,遠高於人類譯員的60%-70%。同時,在價格上也佔有優勢。

在機器同傳領域,百度聯合語音技術、機器翻譯技術,從語音識別、翻譯質量、時延、融合領域知識等方面推出了「一攬子」解決方案。

在語音識別方面,區別於傳統的上下文相關建模技術,百度提出了上下文無關音素組合的中英文混合建模單元,包含1749個上下文無關中文音節和1868個上下文無關英文音節。該方法具有泛化性能好、對噪聲魯棒、中英文混合識別等特點。

在翻譯質量方面,提出了「語音容錯」的對抗訓練翻譯模型,根據語音識別模型常犯的錯誤,在訓練數據中有針對性的加入噪聲數據,使得模型在接受到錯誤的語音識別結果時,也能夠在譯文中糾正過來。比如,語音識別系統將「大堂」錯誤的識別為「大唐」,這一對噪聲詞將被自動收錄到訓練數據中,並將源語言句子「我們在酒店大堂見面吧」替換為「我們在酒店大唐見面吧」,而保持目標語言翻譯不變「Let's meet at the lobby of the hotel」,同時將這兩個中文句子用於訓練,進而獲得具有更強的容錯能力模型。

為了降低時延提升翻譯質量,人類譯員通常對演講內容進行合理預測,百度開發人員從人類譯員身上獲得啟示,研發了「wait-k words」模型,可以根據歷史信息,直接預測翻譯中目標語言詞彙。該模型在翻譯質量和翻譯延遲之間做出了很好的平衡,用戶可通過根據實際需求設定延遲時間(例如延遲1(k=1)詞或延遲5(k=5)詞)。比如,法語和西班牙語這種較為接近的語言,延遲可設置在比較低的水平;但是,對於英語和漢語這種差異較大的語言,以及英語和德語這種詞序不同的語言,延遲應當設置為較高水平,以便於更好的應對差異。

在同聲傳譯時,經常會遇到不同領域的專業知識,這就要求同傳人員在短時間內吸收大量相關領域的內容,這對他們也是極大地挑戰。基於此,百度模仿人類同傳的準備過程,提出了快速融合領域知識策略。該策略依託百度海量的網際網路大數據,訓練得到的具有通用翻譯能力的模型;當它接到某一個領域的同傳翻譯任務時,系統會收集該領域數據並在通用模型的基礎上進行增強訓練,得到相應領域增的強模型;最後對該領域術語庫進行強制解碼,使專業術語翻譯得準確可靠,且提升翻譯效率。

作為對外開放和商業國際化的需求之一,同聲傳譯被廣泛應用於政府間的峰會、多邊談判和其他商業場合,但是同傳人員稀缺也成為了當前的棘手問題。為了解決全球範圍內同傳譯員人數少、費用高等難題,越來越多開發者專注於機器同傳的研發,百度也希望通過研發高質量機器同傳技術和系統解決即時翻譯難題。

雖然機器同傳有了新的突破,但它與經驗豐富的同傳人員相比,依然存在一定差距。百度翻譯技術負責人表示,同傳的目的並不在於取代人類譯員,而是為了降低同傳成本,讓同傳的應用範圍更加廣泛,也希望世界各地的人在AI的助力下早日實現「無障礙」交流。

相關焦點

  • 百度發布即時翻譯「神器」 突破自然語言處理重大難關
    中新網10月24日電 人工智慧領域,兩種語言的「即時互譯」是一項難以攻克的技術問題,其主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。近日,百度研發了具備預測能力和可控延遲的即時機器翻譯系統,可實現兩種語言之間的高質量、低延遲翻譯。
  • 出海記|臺媒稱百度AI即時翻譯工具實現突破:挑戰谷歌
    據臺灣中時電子報網站10月24日報導,許多在線翻譯服務允許用戶說或寫一句話,但翻譯的過程會延遲。相比之下,百度即時翻譯工具可以在句子說出來的同時進行翻譯。該產品是百度的一大突破,在過去幾年將重金投資人工智慧,希望構建公司的未來業務。
  • 百度發布AI同傳,詳解人工同傳與機器同傳優劣勢
    2)譯出率不高:據統計,同傳譯員的譯出率一般在60%-70%左右。譯出率不高的原因,一般由於未聽清或者難翻譯,人類譯員通常會選擇性的忽略某些句子,保證總體上的準確率和實時性。(譯出率:指實際翻譯的句子個數佔演講者總句子個數的比例,比如演講者說了100個句子,同傳實際翻譯了60個句子,則譯出率為60%。)
  • 機器翻譯人機PK實況:谷歌、有道、百度、搜狗,哪個像專業譯員?
    新智元報導 作者:胡祥傑【新智元導讀】 不得不說,機器翻譯已經和人類水平相差無幾,現在要判斷一段文字是機器翻譯的還是人類翻譯的,難度越來越大了。不信?去試試。最近,我們注意到,有一個叫做「試譯寶」的微信公眾號發布了一個機器翻譯人機PK:具體規則是給出三道題,每道題包含對一句話的四個版本的翻譯(其中有一個答案是人類譯員給出),參與者需要從這四個選項中選出一個自己認為最可能是人類譯員提供的答案,選對了為人類加一顆星,選錯了機器加一顆星。
  • 百度為AI界打造「同傳高手」或將緩解同傳人員稀缺問題
    近日,百度研發了具備預測能力和可控延遲的即時機器翻譯系統,可實現兩種語言之間的高質量、低延遲翻譯。這是自然語言處理方面的重大技術突破,將對機器即時筆譯和口譯的發展起到極大地推動作用。機器同傳利用語音識別技術自動識別演講者的講話內容,將語音轉化為文字,然後調用機器翻譯引擎,將文字翻譯為目標語言,顯示在大屏幕或者通過語音合成播放出來。
  • 百度機器翻譯現在都能預測你未來幾秒要說的話了!
    先給大家看一張動圖:上面的中文是人類說的話,下面的英文是百度 AI 給出的實時翻譯。可以看到,沒等說到「莫斯科」的時候,AI 自動翻譯的英語就已經出現了「meet」,也就是漢語句末的「會晤」。難道現在 AI 已經掌握了讀心術?
  • 前方高能,同聲翻譯的福音來了!
    但是在人工智慧領域,兩種語言的「即時互譯」是一項難以攻克的技術問題,主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。我們從這張動圖上可以看到,上面的中文是人類說的話,下面的英文是百度 AI 給出的實時翻譯。可以看到,沒等說到「莫斯科」的時候,AI 自動翻譯的英語就已經出現了「meet」,也就是漢語句末的「會晤」。
  • 百度發布AI同傳,有哪些核心技術?
    AI同傳的技術難點在於機器翻譯如何實現實時翻譯,以及當語音識別出現錯誤時,機器翻譯如何能夠容錯。PZdednc人工智慧領域,兩種語言的「即時互譯」是一項難以攻克的技術問題,其主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。百度研發了具備預測能力和可控延遲的即時機器翻譯系統,可實現兩種語言之間的高質量、低延遲翻譯。
  • 前方高能,同聲翻譯的福音來了
    我們從這張動圖上可以看到,上面的中文是人類說的話,下面的英文是百度 AI 給出的實時翻譯。可以看到,沒等說到「莫斯科」的時候,AI 自動翻譯的英語就已經出現了「meet」,也就是漢語句末的「會晤」。
  • 百度推出AI即時翻譯 同聲傳譯要失業了?
    【環球網智能綜合報導】百度公司於24日當日發布了一款人工智慧(AI)即時翻譯工具,可識別200萬對英中對應語句,擁有將英語即時翻譯為漢語和德語的能力。谷歌已於去年發布了自家的AI即時翻譯工具,百度此舉意在挑戰谷歌在AI即時翻譯領域的領先地位。之前,人們只需要說一句話或寫下一個句子就可以通過眾多的在線翻譯服務得到譯文,但是給出譯文前會有一段延遲。而相比較之下,百度的這款同聲傳譯工具可以做到幾乎沒有延遲的句子翻譯,像極了一位數字版的口譯員。
  • 翻譯「人文性」,或成人類譯員的核心競爭力
    自從人工智慧技術及產品逐漸進入大眾視野,機器翻譯在大數據以及人工智慧的支持下,正步入全新的發展階段,並逐漸引起全社會的廣泛關注。從2018年3月份,美國微軟公司宣布,其研發的機器翻譯系統首次在通用新聞的漢譯英上達到人類專業水平,實現自然語言處理的又一裡程碑突破。當然隨著大量AI翻譯產品的出現,「未來人工智慧是否會取代人類?」的問題再次出現。
  • AI同傳效果媲美人類,百度翻譯出品全球首個上下文感知機器同傳模型
    魚羊 發自 凹非寺  量子位 報導 | 公眾號 QbitAI  AI同傳領域又有新進展,這次突破來自百度。  百度機器翻譯團隊創新性地提出了全球首個感知上下文的機器同傳模型,並基於此發布了最新的語音到語音的機器同傳系統:DuTongChuan(度同傳)。
  • 網絡時代的譯員,不能不知道哪些翻譯技術?
    不少商業公司競相建設多種雙語句庫(如有道、句酷、CNKI、Bing、百度等)。據《中國地區譯員生存狀況調查報告》的統計,80%的譯員使用在線查詞工具(如愛詞霸、中國譯典、海詞等)。    語料庫解決了大規模語料存儲的問題,已成為現代譯員必不可少的參考資源,譯員可隨時查詢、對比、驗證海量的語言資源,提升翻譯質量。
  • 神器:百度翻譯APP翻譯方向擴充至136個
    出國旅遊固然瀟灑,但是身處異國他鄉,面對語言不通這個大問題,翻譯軟體「責無旁貸」地擔當起現代人們出行的必備利器,不僅「說段語音」、「拍張照片」就能翻譯,一些翻譯軟體更是「穿越古今」,譯出「富賈可為吾友乎」、「吾和吾庶士伴皆驚愕」的種種神文,「神翻譯」的話題一度引發網友廣泛熱議。近日,曾以實物翻譯、文言文翻譯等功能受到網友熱捧的「翻譯神器」百度翻譯再次更新換代,推出安卓V4.3版。
  • 「翻譯神器」在中國市場被看好 語言庫仍需豐富
    【本報記者 邢曉婧 本報駐美國特約記者 陳 洋】由於全球範圍的海外旅遊和商務活動日益旺盛,翻譯神器即具備即時翻譯能力的軟體和裝備受到矚目。目前國外所開發的翻譯神器,基本實現從語音到語音的翻譯能力,可直接接收語音並迅速分析翻譯,然後再以語音形式播出來。
  • 人工智慧即時翻譯「走俏」 口譯員要失業了?
    日前,百度發布了一款人工智慧即時翻譯工具,能夠支持中英互譯以及英語到德語的單向翻譯。隨著谷歌、亞馬遜、百度等科技巨頭陸續進場,人類口譯員真的要被人工智慧取代了麼?其中,自然語言處理是讓機器了解、學習人類語言的關鍵技術,目前已經實現了廣泛應用,特別是催生了一系列智能語音助手產品。作為人工智慧主要的商業化場景之一,智能語音助手已經成為谷歌、蘋果、亞馬遜、百度等科技具有競相布局的主要戰場。為了爭奪語音翻譯這一龐大市場,科技巨頭們把「戰火」燒到人工智慧即時翻譯領域。
  • 谷歌該擔心了:百度發布人工智慧「內置翻譯」系統
    如果有人讓我列出我認為最不容易被機器人取代的工作清單,我會將「同聲傳譯員」排在第一。作為一個長期受苦的日語和普通話學生,我知道嘗試用外語立即找到合適的單詞的惡劣難度。在財富,我們經常在會議上使用同聲傳譯員。
  • 百度聽清亮相2018百度世界大會 化身為李彥宏的「AI專屬翻譯」
    這也是百度聽清第二次承擔起百度世界大會中英文「直播」工作,從現場可以看到,即使語速較快或混雜著英文、專業名詞,它也能準確識別並翻譯出來,伴隨演講者的演講節奏實時上屏,智能且精準,絲毫不遜色於專業同傳人員。據介紹,百度聽清搭載了百度全新推出的即時機器翻譯系統。
  • 利用「AI+譯員+網際網路服務」 語翼在線人工翻譯平臺火了
    在《聖經》故事中,逃過了大洪水一劫的人類決定修起通天塔。這一舉動惹惱了上帝,他大手一揮,讓修塔的人使用不同的語言。人們的溝通受阻,修塔最終只得作罷。如何打破人類語言之間的圍牆,讓人類能無障礙溝通,是人類一直希望解決的問題。
  • 中國翻譯協會發布《譯員職業道德準則與行為規範》等三項標準規範
    中國翻譯協會發布《譯員職業道德準則與行為規範》《翻譯服務培訓要求》及《翻譯服務採購指南 第2部分:口譯》授牌筆譯服務認證機構 與中國標準化研究院籤約成立語言服務標準化工作委員會中國網11月9日訊(記者戚易斌)為進一步規範語言服務市場,推進行業標準化建設