出海記|臺媒稱百度AI即時翻譯工具實現突破:挑戰谷歌

2020-12-06 參考消息

參考消息網10月26日報導臺媒稱,百度推出一款人工智慧工具,可以即時將英語翻譯成中文和德語,以挑戰谷歌(Google)的競爭產品。

據臺灣中時電子報網站10月24日報導,許多在線翻譯服務允許用戶說或寫一句話,但翻譯的過程會延遲。相比之下,百度即時翻譯工具可以在句子說出來的同時進行翻譯。該產品是百度的一大突破,在過去幾年將重金投資人工智慧,希望構建公司的未來業務。

人工智慧領域,兩種語言的「即時互譯」是一項難以攻克的技術問題,其主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。

參考消息網-出海記記者了解到,近日,百度研發了具備預測能力和可控延遲的即時機器翻譯系統,可實現兩種語言之間的高質量、低延遲翻譯。

機器同傳利用語音識別技術自動識別演講者的講話內容,將語音轉化為文字,然後調用機器翻譯引擎,將文字翻譯為目標語言,顯示在大屏幕或者通過語音合成播放出來。相比人類譯員,機器最大的優勢是不會因為疲倦而導致譯出率下降,能將所有「聽到」的句子全部翻譯出來,這使得機器的「譯出率」可以達到100%,遠高於人類譯員的60%-70%。同時,在價格上也佔有優勢。

為了降低延時提升翻譯質量,人類譯員通常對演講內容進行合理預測,百度開發人員從人類譯員身上獲得啟示,研發了「wait-k words」模型,可以根據歷史信息,直接預測翻譯中目標語言詞彙。該模型在翻譯質量和翻譯延遲之間做出了很好的平衡,用戶可通過根據實際需求設定延遲時間(例如延遲1(k=1)詞或延遲5(k=5)詞)。比如,法語和西班牙語這種較為接近的語言,延遲可設置在比較低的水平;但是,對於英語和漢語這種差異較大的語言,以及英語和德語這種詞序不同的語言,延遲應當設置為較高水平,以便於更好地應對差異。

在同聲傳譯時,經常會遇到不同領域的專業知識,這就要求同傳人員在短時間內吸收大量相關領域的內容,這對他們也是極大的挑戰。基於此,百度模仿人類同傳的準備過程,提出了快速融合領域知識策略。該策略依託百度網際網路大數據,訓練得到的具有通用翻譯能力的模型;當它接到某一個領域的同傳翻譯任務時,系統會收集該領域數據並在通用模型的基礎上進行增強訓練,得到相應領域增的強模型;最後對該領域術語庫進行強制解碼,使專業術語翻譯得準確可靠,且提升翻譯效率。

作為對外開放和商業國際化的需求之一,同聲傳譯被廣泛應用於政府間的峰會、多邊談判和其他商業場合,但是同傳人員稀缺也成為了當前的棘手問題。為了解決全球範圍內同傳譯員人數少、費用高等難題,越來越多開發者專注於機器同傳的研發,百度也希望通過研發高質量機器同傳技術和系統解決即時翻譯難題。

雖然機器同傳有了新的突破,但它與經驗豐富的同傳人員相比,依然存在一定差距。百度翻譯技術負責人表示,同傳的目的並不在於取代人類譯員,而是為了降低同傳成本,讓同傳的應用範圍更加廣泛,也希望世界各地的人在AI的助力下早日實現「無障礙」交流。

相關焦點

  • 百度發布即時翻譯「神器」 突破自然語言處理重大難關
    中新網10月24日電 人工智慧領域,兩種語言的「即時互譯」是一項難以攻克的技術問題,其主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。近日,百度研發了具備預測能力和可控延遲的即時機器翻譯系統,可實現兩種語言之間的高質量、低延遲翻譯。
  • 百度與谷歌角逐在線翻譯市場
    首頁 > 動態 > 關鍵詞 > 百度最新資訊 > 正文 百度與谷歌角逐在線翻譯市場
  • 百度手機輸入法語音翻譯
    在此基礎上,突破地域限制、實現毫無障礙的自由交談成為了全人類的共同夙願,因此,實時翻譯成為了人工智慧領域一個新的突破點。  作為全球最早進軍人工智慧領域的公司之一,百度早在2014年就發布了第一代深度語音識別系統Deep Speech,該系統使用了端對端的深度學習技術,在噪音環境下,Deep Speech語音系統表現要比谷歌、微軟以及蘋果的語音系統更好。
  • 百度翻譯打造定製化翻譯服務、AI同傳等全產品矩陣 企業效率工具擔當
    自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面進行了系統而深入的研究,取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 百度推出AI翻譯工具 邊說邊譯類同傳
    10月24日消息,百度推出了一款AI翻譯工具,可以實時將英語翻譯成中文和德語。到目前為止,許多在線翻譯服務允許用戶說或寫一句話,但翻譯的過程仍有滯後。相比之下,百度的即時翻譯工具可以在句子說出來的同時進行翻譯,類似同聲傳譯。目前,該工具只能互譯英語和中文,或者互譯英語和德語。但百度承認了該翻譯工具的局限性,表示暫時還無法做到取代人類口譯員。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    何中軍在會上詳解了機器翻譯技術的發展歷程,並通過一系列實際應用場景案例,詳解了百度翻譯全面的產品布局和服務方式。自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面進行了系統而深入的研究,取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 百度地圖出海完勝,谷歌Map難防
    而百度則繼續圍繞智能語音,先是推出了全球首個地圖語音定製功能,後又在國慶期間又推了一波人工智慧語音功能,從數據來看,效果很好。國慶當天,百度地圖公布,截至 10 月 1 日18:00,百度地圖智能語音功能用戶量已突破 3 億。
  • 全球首個突破200種語言互譯的翻譯引擎 百度翻譯打破世界溝通壁壘
    自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面進行了系統而深入的研究,取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 百度聽清亮相2018百度世界大會 化身為李彥宏的「AI專屬翻譯」
    這也是百度聽清第二次承擔起百度世界大會中英文「直播」工作,從現場可以看到,即使語速較快或混雜著英文、專業名詞,它也能準確識別並翻譯出來,伴隨演講者的演講節奏實時上屏,智能且精準,絲毫不遜色於專業同傳人員。據介紹,百度聽清搭載了百度全新推出的即時機器翻譯系統。
  • 谷歌翻譯是如何藉助多項新興AI技術提高翻譯質量的
    谷歌稱,它在翻譯領域所取得的突破並不是由單一技術驅動的,而是針對低資源語言、高資源語言、總體質量、延遲和整體推理速度的多項技術共同作用產生的。在2019年5月到2020年5月之間,根據人工評估和BLEU(基於翻譯系統翻譯和人工參考翻譯之間相似性的衡量標準),谷歌翻譯在所有語言中平均提高了5分以上,在50種語料資源最少的語言中平均提高了7分以上。
  • 將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」
    百度從 2015年5月發布了基於深度學習的在線翻譯系統,在翻譯模型、解碼算法、大規模語料訓練等方面取得突破性進展,融合統計與深度學習的方法,通過優化的搜索算法,利用優先隊列及候選翻譯表,突破了翻譯速度限制;使用從網際網路獲取的大數據語料訓練,已知的最大規模的訓練深度神經網絡翻譯系統的語料,突破了訓練語料規模限制;這種翻譯方法的最大優勢在於譯文流暢,更加符合語法規範,容易理解。
  • 中國涉足衛星地圖 稱挑戰谷歌地位
    而對這一領域的涉足,也標誌著中國在衛星地圖領域的最新突破,對此外媒紛紛給予關注,每日郵報便以《中國針對競爭對手谷歌推出自己的網絡衛星地圖服務》為題予以關注,稱這一舉措將與谷歌地圖形成競爭關係。外媒稱「天地圖」挑戰谷歌的傳統地位說也不無道理。據知情人士介紹說,「天地圖」使各類進行專題信息服務的商業地圖網站(如導航、餐飲、賓館酒店)能夠在這些公共地理信息基礎上進行專題信息加載、增值服務功能開發。國家測繪局副局長閔宜仁介紹,「天地圖」以門戶網站和服務接口兩種形式為用戶提供服務。門戶網站是公眾地理信息服務的總入口、主節點,免費向公眾提供服務。
  • 谷歌表示新的AI模型可以實現「近乎即時」的天氣預報
    谷歌是最新涉足的公司,本周在博客中分享了一項新研究,稱可以實現「近乎即時」的天氣預報。這項工作尚處於早期階段,尚未集成到任何商業系統中,但早期結果似乎很有希望。在未經同行評議的論文中,谷歌的研究人員描述了他們如何能夠以僅數分鐘的計算,以1公裡的解析度提前六小時生成準確的降雨預測。
  • 百度翻譯上新!桌面端1.0讓工作學習「輕+快」
    但由於信息渠道多樣,在翻譯過程中需頻繁切換工具,導致信息翻譯速度和理解效率低下,這也成為當前電腦工作、學習時使用翻譯的痛點。近日,百度翻譯全新發布桌面端1.0,支持200多個語種互譯,內含海量中英詞典,並重磅推出「極簡模式」、「劃譯」與「快捷鍵發起翻譯」三大核心功能,盡顯其「輕·快」特性,幫助用戶即時翻譯陌生詞句,高效便捷地理解、獲取信息。
  • 重磅| 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot...
    》,介紹了谷歌的神經機器翻譯系統(GNMT),該系統實現了機器翻譯領域的重大突破,參見報導《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》。昨日,谷歌再發論文宣布了其在多語言機器翻譯上的突破:實現了 zero-shot 翻譯!昨天,谷歌在其官方博客上宣布其在谷歌翻譯(Google Translate)上再次取得重大進展。
  • 巨頭扎堆的小市場:不學外語,機器翻譯搞定一切?
    機器翻譯的繁榮景象與各家產品對比在機器替代人類勞動力的徵途裡,翻譯界無疑首當其衝。機器翻譯技術很早就存在,但真正的實現大規模產品化,是出現在谷歌發布翻譯產品之後的半年中,谷歌、微軟、有道、科大訊飛、百度、搜狗等均上線或更新了翻譯產品,各大廠商都想在這個備受關注的機器翻譯領域裡分得一杯羹。你可能會覺得奇怪,為何大型技術公司都熱衷於扎堆做機器翻譯?
  • 人工智慧領域突破百度發布在線翻譯系統
    日前,百度在機器翻譯技術上取得重大突破,發布了融合統計和深度學習方法的在線翻譯系統。該系統藉助海量計算機模擬的神經元,模仿人腦「理解語言,生成譯文」,同時結合百度已有的統計機器翻譯技術,使得機器翻譯質量實現了質的飛躍。百度,再一次站到網際網路前沿技術的領先位置。  機器翻譯一直被公認為是人工智慧領域最難的課題之一。
  • 有道nmt神經網絡_有道神經網絡翻譯(nmt) - CSDN
    不得不提,在機器翻譯進化史中,最具裡程碑式的突破之一就是谷歌翻譯在2016年推出的神經網絡翻譯(GNMT),相比於谷歌之前基於短語的機器翻譯(PBMT: Phrase-Based Machine Translation),GNMT所需要設計的工程量更少,同時翻譯效果更好,可見GNMT 的技術將把機器翻譯帶到一個全新的紀元。
  • AI 如何成為百度翻譯 DAU 高速增長的引擎?
    根據其官方透露的數字,2020 年第一季度,百度翻譯產品的 DAU(日活躍用戶數量)環比增長 10%,同比更是增長了 40%,在行業增長整體放緩的大環境下,百度翻譯實現了逆勢增長。2010 年代,隨著深度神經網絡在圖像、語音領域的突破,以 Google、百度、微軟為代表的科技巨頭,開始將神經網絡引入機器翻譯系統中,無論是在實驗室還是工業落地的產品上,都取得非常不錯的結果,由此也將機器翻譯帶入到神經網絡翻譯的新時代。
  • 谷歌機器翻譯取得顛覆性突破 到底幾分真假?
    所以重大突破並不僅僅是上了深度神經網絡,而是以句子為單元。最近,做機器翻譯的同志們一打開朋友圈,猛然發現好像飯碗沒了,谷歌爸爸大力出奇蹟,提高了機器翻譯87%的水平。結果打開人家原文一看,原來虛驚一場,只是現有工作的整合,一篇完美的工程論文,並沒有新的模型提出。不禁長舒一口氣,呼~飯碗還在。