百度領銜舉辦首次機器同傳講習班 詳解機器同聲傳譯技術演進

2020-12-10 每日科技資迅

近日,自然語言處理頂級學術會議之一EMNLP 2020在線上舉行。EMNLP由國際計算語言學學會(ACL)旗下SIGDAT組織,會議涵蓋語義理解、文本理解、信息提取、信息檢索和機器翻譯等主題。會上,由百度聯合Google舉辦的首次機器同聲傳譯學術講習班(Tutorial)召開,圍繞機器同傳的背景、挑戰、模型、數據集、實用系統和產品、未來研究方向等展開報告和研討,吸引了數百位國際學者參會。

(EMNLP2020同聲傳譯學術報告會)

同聲傳譯一直都被學界和工業界廣泛認為是自然語言處理最難的問題之一。從翻譯模式看,相比傳統的文本翻譯,同聲傳譯對翻譯時延和準確率要求極高,這使得翻譯模型總是需要在信息不充分的情況進行翻譯,因而較之傳統機器翻譯,同聲傳譯難度又翻倍;從譯員角度看,同傳專業性極強、難度極大、耗腦又耗嗓,對同傳譯員要求極高,除了深厚的語言能力外,還需要極強的反應能力,邊說邊聽,精力高度集中,對譯員的腦力和體力都是極高的挑戰。因此往往一場會需要兩個甚至多個譯員共同完成同傳。

近年來,隨著語音處理、機器翻譯等人工智慧技術的快速進步,機器同傳成為學術研究前沿課題,既取得了很大進步,同時也仍然面臨諸多挑戰。基於此,由百度聯合Google主辦的前沿講習班圍繞機器同傳展開了深入剖析,從機器同傳的發展背景、面臨挑戰展開,詳細介紹了機器同傳的發展現狀和技術演進,同時介紹了實用系統研發麵臨的實際問題以及目前同傳的多種產品形式,最後對機器同傳未來的發展方向進行了探討。據悉,這是國際上首次舉辦的有關機器同聲傳譯的學術講習班。

此次報告會指出,人類同傳員的稀缺和人腦能力極限,正凸顯了自動同傳系統的必要性和相比人類同傳的優勢。在此現狀下,機器同傳開始逐步應用於大型國際會議,並在翻譯策略上持續演進。同時,會上還深入淺出地介紹了機器同傳技術在文本和語音翻譯層面的演變方向,從固定翻譯策略模型朝動態翻譯策略改進,再到業界新近提出的增量式語音合成模型(incremental TTS)。

作為此次學術報告會的領銜舉辦方,百度分享了其目前在同傳方向、不同場景下的實際落地的產品和使用效果。據介紹,百度AI同傳先後提出集成預測與可控時延的翻譯模型、語義單元驅動的上下文感知翻譯模型、融合音節與文本的聯合編碼模型、基於知識蒸餾的端到端同傳模型、語音識別與翻譯交互解碼等一系列創新技術。同時,還發布了覆蓋線下會議、遠程會議、線上線下融合會議,以及主題演講、多人討論等全場景、高質量、低時延的同傳解決方案。

(百度AI同傳解決方案)

目前,百度AI同傳技術已廣泛服務於中國國際服務貿易交易會、全球人工智慧技術大會、第三屆中國國際進口博覽會等多個國家級大型會議,幫助數千萬海內外觀眾實時了解會議內容。其中,在服務第三屆中國國際進口博覽會中,百度AI同傳技術還實現了產品層面的突破,提供了"大屏+手機"的創新雙模式,使得與會人員能夠通過會議大屏"看同傳",也能夠通過手機端的AI同傳服務 "聽同傳"。

針對當前面臨的挑戰,百度希望可以聯合學界、工業界共推同傳技術進步。明年將繼續舉辦機器同傳國際研討會和機器同傳評測,希望更多單位參與進來,一起推動技術進步。

隨著全球貿易發展的提速和跨國學術商業交流的頻繁開展,AI同傳的作用將持續放大。而百度AI同傳憑藉先進的技術、完整的解決方案和不斷創新的產品體驗,將在其中扮演重要角色,助力國際會議、講座培訓、內部會議、商業洽談等多場景下的跨語言交流,打破語言障礙,讓溝通更便捷。

相關焦點

  • 百度聯合谷歌主辦同傳學術講習班 創新技術+產品助力跨語言交流
    EMNLP由國際計算語言學學會(ACL)旗下SIGDAT組織,會議涵蓋語義理解、文本理解、信息提取、信息檢索和機器翻譯等主題。會上,由百度聯合Google舉辦的首次機器同聲傳譯學術講習班(Tutorial)召開,圍繞機器同傳的背景、挑戰、模型、數據集、實用系統和產品、未來研究方向等展開報告和研討,吸引了數百位國際學者參會。
  • 百度聯合谷歌、Facebook、Upenn等舉辦ACL 2020同聲傳譯研討會
    近日,國際頂會ACL官網披露大會議程,由百度領銜,聯合Google、Facebook、Upenn、清華大學等海內外頂尖企業及高校專家們共同申辦的首屆同聲傳譯研討會(The 1st Workshop on Automatic Simultaneous Translation),將在自然語言處理領域國際頂級學術會議
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。
  • 機器翻譯應用價值凸顯 百度翻譯豐富產品矩陣助力企業智能化升級
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。而基於神經網絡機器翻譯NMT( Neural Machine Translation )技術已成為主流,伴隨著翻譯規模化的需求,機器翻譯在保障流暢性和準確性的同時也將越來越實時化,並為大中小企業及個人提供不同的部署服務。  何中軍在會上詳解了機器翻譯技術的發展歷程,並通過一系列實際應用場景案例,詳解了百度翻譯全面的產品布局和服務方式。
  • 百度翻譯打造定製化翻譯服務、AI同傳等全產品矩陣 企業效率工具擔當
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。而基於神經網絡機器翻譯NMT( Neural Machine Translation )技術已成為主流,伴隨著翻譯規模化的需求,機器翻譯在保障流暢性和準確性的同時也將越來越實時化,並為大中小企業及個人提供不同的部署服務。何中軍在會上詳解了機器翻譯技術的發展歷程,並通過一系列實際應用場景案例,詳解了百度翻譯全面的產品布局和服務方式。
  • 百度機器翻譯現在都能預測你未來幾秒要說的話了!
    其實這是百度在機器同傳中研發的最新技術,有預測和可控延遲能力,能實現兩種語言之間的高質量、低延遲翻譯。它的出現讓機器同傳又有了新進展!在我們了解機器同傳之前,首先要知道人類同傳是什麼。在會場的同聲傳譯(圖片來自網絡)同聲傳譯工作通常在一句話的話音剛落,2-3秒之內就要立即傳譯出來,是一份高壓力、
  • 全球首個突破200種語言互譯的翻譯引擎 百度翻譯打破世界溝通壁壘
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。而基於神經網絡機器翻譯NMT( Neural Machine Translation )技術已成為主流,伴隨著翻譯規模化的需求,機器翻譯在保障流暢性和準確性的同時也將越來越實時化,並為大中小企業及個人提供不同的部署服務。何中軍在會上詳解了機器翻譯技術的發展歷程,並通過一系列實際應用場景案例,詳解了百度翻譯全面的產品布局和服務方式。
  • 同聲傳譯收入揭秘
    這時,夏方耘迅速在一張白紙上記錄,幾乎就在吳教授張嘴的同時,馬上翻譯出致辭的中文意思,「尊敬的市長閣下,中國朋友們……」語調、語速、停頓被「翻譯」得毫不走樣,當吳教授的致辭結束,夏方耘的同聲傳譯也戛然而止——這是12日,記者在武漢大學外國語學院所見的一段精彩的同聲傳譯表演。
  • 小度真無線耳機+百度AI同傳解決方案 打造耳邊「翻譯官」
    9月15日,「萬物智能——百度世界2020」大會首次由百度與央視新聞聯合呈現,在3小時的直播互動中,百度創始人、董事長兼 CEO 李彥宏和中央廣播電視總臺央視主持人康輝跨界組合,將 AI 賦能下的社會生活全貌搬上央視新聞直播間,為億萬觀眾奉上一場包羅萬象的 AI 立體科普。
  • 百度翻譯同傳頻現國際會議 搭建中外溝通橋梁
    本次大會共吸引了超過1100萬人次在線觀看,為了讓國內外觀眾第一時間了解大會內容,百度翻譯為大會提供了機器同傳服務。據不完全統計,2019年在中國舉辦的國際會議超過13000場,而國際會議口譯員協會(AIIC)——會議口譯唯一的全球性專業協會——僅有約3000名會員,其中漢語普通話會員只有51人。在供需嚴重不平衡的情況下,能力日益增強的機器同傳在國際會議場景下身影頻現。面對領域多樣、需求複雜、實時性高的會議場景,百度翻譯提供了全面高效的機器同傳解決方案。
  • 打破語言壁壘,百度翻譯同傳為智源大會構建跨國溝通橋梁
    為了更好的幫助國內外觀眾理解報告內容,百度翻譯為本次大會提供了機器同傳服務。百度翻譯同傳現場效果展示人工同傳專業性強,難度極高同傳是一項專業性極強、難度極大、耗腦又耗嗓的工作。機器同傳成研究熱點,百度翻譯提出多項創新近年來,得益於人工智慧技術的綜合進步,結合語音技術和機器翻譯技術的機器同聲傳譯成為國際前沿研究的熱點。機器同傳面臨一系列國際公認的難題,如語音識別錯誤傳遞、翻譯質量與時間延遲難以平衡等。
  • 2019 自然語言處理前沿論壇,百度NLP技術全揭秘
    雷鋒網 AI 科技評論按,近日,由百度聯合中國計算機學會中文信息技術專委會、中國中文信息學會青工委舉辦的「2019 自然語言處理前沿論壇」上,來自百度和各大高校的嘉賓們分享了關於 NLP 技術研究的心得體會。
  • 機器翻譯進化史:用計算機取代同聲傳譯?
    瓦倫·韋弗(1947)出於對資訊理論的研究、二戰時期密碼破譯的推動以及「大同語言」的理想,瓦倫·韋弗(Warren Weaver)在 1949 年發表的備忘錄《翻譯》中首次建議將計算機應用於翻譯。5 年後美國喬治敦大學(Georgetown University)在 IBM 公司協同下,以 IBM-701 計算機首次完成了機器翻譯試驗。
  • 騰訊AI翻譯野心:遠不止免費向博鰲提供同聲傳譯
    本文首發於澎湃新聞文:Paul Smith / 誰是獨角獸2018年博鰲亞洲論壇上,騰訊無償向大會部分論壇提供了人工智慧同聲傳譯(以下簡稱「AI同傳」)雙語內容會議現場投屏、翻譯結果語音收聽的服務,並允許場外觀眾在微信小程序查看同傳內容
  • 同聲傳譯到底是一份什麼樣的工作
    而在翻譯行業中,難度最高,也承載了人們最多讚許與好奇的,莫過於同聲傳譯。所謂同聲傳譯,是指譯員以幾乎與講者同時的方式做口語翻譯。也就是在講者仍在說話時,同聲傳譯員便同時進行翻譯。尤其對於同聲傳譯來說,需要在電光火石之間迅速將講者的話翻譯成另一種語言,其難度可想而知。接受澎湃新聞記者採訪的三位譯員除了同聲傳譯也經常接受交替傳譯的工作。所謂交替傳譯是指在講者說完每句話停頓的間隙,逐字逐句地翻譯他/她的講話內容。雖不如同聲傳譯燒腦,但相對而言與合作對象的溝通更為直接細緻,需要承擔很多其他的工作,甚至要負責帶領整支團隊。
  • Gartner最新報告:百度翻譯整合多項AI能力 多模態翻譯助跨國交流
    自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面均進行了系統而深入的研究,並取得重大技術突破,研製了具有完全自主智慧財產權、技術領先、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。同時,通過公有雲、私有雲、本地化等靈活的部署方式,滿足用戶不同場景的應用需求。
  • 騰訊同傳首次代替人類上崗博鰲論壇
    隨著機器翻譯技術的成熟,人工翻譯失業不再是危言聳聽,而是既定事實。4月8日,騰訊同傳在博鰲亞洲論壇正式上崗,為論壇提供獨家AI同聲傳譯服務。這也是博鰲論壇創辦17年來,首次嘗試現場用機器同傳代替人工同傳。區別於以往的單主講人會議,此次也是AI同傳類產品首次公開支持討論型會議。現場,AI同傳服務會覆蓋到會議現場投屏、小程序查看、語音收聽、會議紀要回放等多個渠道。
  • 翻譯金字塔塔尖的同聲傳譯 兩種語言間熟練跳舞
    ,「一心二用」是同聲傳譯的看家本領,對於同聲傳譯來說,聽入和譯出自有幾秒鐘時間,在這短短幾秒鐘時間裡,同聲傳譯既要有對一種語言良好的聽覺解意能力,同時又要有用另一種語言組織句子連續準確表達的能力。「優秀的同聲傳譯要有在兩種語言間熟練跳舞的能力。」一位同傳這樣說,一心二用需要排除雜念聚精會神,「每次只能連續工作二十分鐘,時間長受不了。」            同聲傳譯 最怕什麼?
  • 百度入圍Gartner全球AI翻譯服務代表企業 打造企業智能升級新引擎
    實際上,自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面均進行了系統而深入的研究,並取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 出海記|臺媒稱百度AI即時翻譯工具實現突破:挑戰谷歌
    相比之下,百度即時翻譯工具可以在句子說出來的同時進行翻譯。該產品是百度的一大突破,在過去幾年將重金投資人工智慧,希望構建公司的未來業務。人工智慧領域,兩種語言的「即時互譯」是一項難以攻克的技術問題,其主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。