打破語言壁壘,百度翻譯同傳為智源大會構建跨國溝通橋梁

2020-12-11 砍柴網

6月21日至24日,2020北京智源大會盛大開幕,五位圖靈獎得主、十多位院士、一百多位專家學者齊聚一堂,共同探討人工智慧的下一個十年。受疫情影響,本屆大會以在線直播的形式舉行,吸引了全球學術界、產業界超過2.5萬人報名參會。為了更好的幫助國內外觀眾理解報告內容,百度翻譯為本次大會提供了機器同傳服務。

百度翻譯同傳現場效果展示

人工同傳專業性強,難度極高

同傳是一項專業性極強、難度極大、耗腦又耗嗓的工作。除了深厚的語言能力外,還需要極強的反應能力,邊說邊聽,精力高度集中,對譯員的腦力和體力都是極高的挑戰。因此往往一場會需要兩個甚至多個譯員共同完成同傳。

國際會議口譯員協會(International Association of Conference Interpreters,簡稱AIIC)作為會議口譯職業全球唯一專業協會,全球會員僅有約3000人,其中漢語普通話會員僅50人。而據不完全統計,僅中國每年需要同傳的國際會議就有上萬場。巨大的市場需求與譯員的稀缺形成強烈反差。

機器同傳成研究熱點,百度翻譯提出多項創新

近年來,得益於人工智慧技術的綜合進步,結合語音技術和機器翻譯技術的機器同聲傳譯成為國際前沿研究的熱點。機器同傳面臨一系列國際公認的難題,如語音識別錯誤傳遞、翻譯質量與時間延遲難以平衡等。

針對這些難題,百度翻譯團隊展開攻關,先後提出了集成預測與可控時延的翻譯模型、語義單元驅動的上下文感知翻譯模型、融合音節與文本的聯合編碼模型、基於知識蒸餾的端到端同傳模型、語音識別與翻譯交互解碼等一系列創新技術,在語音容錯、平衡質量與時延、語篇翻譯連貫性和端到端同傳模型等方面取得突破,研發了高質量、低時延的機器同傳系統。在2018《麻省理工科技評論》十大技術突破中,百度被列為語音翻譯領域「Key Player」,成為國內唯一上榜單位。

遠程直播會議新形式,百度同傳研發新方案

全球疫情使得大量會議改為了線上進行。此次智源大會採取演講人遠程接入,觀眾通過直播平臺觀看的形式舉行。這種形式進一步加重了同傳的難度:

一是語音識別難度增大。為了適應網絡帶寬,在線會議軟體對聲音信號進行壓縮編碼處理,同時傳輸過程中易受多種信號幹擾,原始聲音信號不穩定,對語音識別挑戰極大。

二是多場會議並行,對系統穩定性要求高。以往的會議往往都是一場會議發言人順序進行,而本次會議共有19個分論壇,最多的時候同時並行6場,系統部署難度超過以往。

三是領域龐雜,專業性強。本次大會涵蓋智能體系架構、智能晶片、認知神經、機器感知、人工智慧倫理、AI醫療、AI交通等多個領域,每一個領域都極具專業性,專業術語和領域知識翻譯難度大。

針對以上難題,百度研發了創新的機器同傳解決方案。搭載百度語音自研的SMLTA聲學建模技術,並通過對音頻信號的加強處理,提升了識別的魯棒性;採用雲端在線部署,極大降低了部署難度和成本,可根據需求迅速擴容,高效滿足不同形式的同傳需求;通過遷移學習、預訓練加精細化訓練等技術,可以迅速提升領域模型的翻譯效果,滿足多領域翻譯需求。

新機遇新挑戰促發展

目前,機器同傳已在許多國際會議上嶄露頭角,它的優勢在於可以藉助強大的AI技術和資料庫作為後盾,掌握並調取更多資料和專業領域的知識,持續工作,不知疲倦。

同時,也需要清醒的認識到,機器同傳仍面臨多項國際公認難題,如語音容錯、數據稀缺、評價困難等,需要多學科、多技術深入交叉融合,共同進步。基於此,在今年即將召開的領域頂級會議ACL上,百度聯合谷歌、臉書、賓夕法尼亞大學、清華大學等國內外著名公司和高校,舉辦首屆機器同傳研討會,邀請了多名人類同傳專家、機器翻譯專家共同探討機器同傳技術進展、面臨挑戰及未來發展。

未來,百度將持續進行技術創新,推動機器同傳技術邁向新的階段,構築跨語言溝通橋梁,促進全球協作。

相關焦點

  • 打破溝通壁壘 百度翻譯斬獲韓國K-DESIGN設計大獎
    讓我們趕緊通過下面的短片來一睹真容吧~為了傳遞「打破溝通壁壘」這一願景,在品牌創意宣傳片中,一隻破殼而出的小雞,衝破了語言的壁壘,進入了各種語言可以無障礙溝通的次元時空。這隻憨厚可愛的形象就是百度翻譯的品牌 IP——翻譯雞。
  • 百度翻譯同傳服務2020全球人工智慧技術大會 搭建中外溝通橋梁
    本次大會共吸引了超過1100萬人次在線觀看,為了讓國內外觀眾第一時間了解大會內容,百度翻譯為大會提供了機器同傳服務。 針對以上問題,百度翻譯提出業界首個"語義信息單元驅動的機器同傳模型"(效果如下圖),實時判斷演講者所講內容是否形成了完整的語義單元,判斷為是則進行翻譯
  • 百度翻譯同傳頻現國際會議 搭建中外溝通橋梁
    7月25日-26日,2020全球人工智慧技術大會在杭州正式拉開帷幕,近160位國內外人工智慧領域的專家、學者匯聚杭州,圍繞AI學科前沿和尖端技術展開研討,共話AI未來。本次大會共吸引了超過1100萬人次在線觀看,為了讓國內外觀眾第一時間了解大會內容,百度翻譯為大會提供了機器同傳服務。
  • 陪伴、智能、可依賴……百度「翻譯雞」以AI之力打破跨語言溝通障礙
    讓我們趕緊通過下面的短片來一睹真容吧~   為了傳遞「打破溝通壁壘」這一願景,在品牌創意宣傳片中,一隻破殼而出的小雞,衝破了語言的壁壘,進入了各種語言可以無障礙溝通的次元時空。這隻憨厚可愛的形象就是百度翻譯的品牌IP——翻譯雞。
  • 200種語言互譯,百度翻譯打破世界溝通壁壘
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。2015年5月,百度發布全球首個網際網路神經網絡翻譯系統,領先谷歌1年4個月;2019年在國際權威機器翻譯評測 WMT 中,百度超越國內外知名企業,在中英翻譯位列第一;而在多語言翻譯方面,針對語言數量多,分布不均衡,實現難度大的難題,百度研發了基於神經網絡的多語言翻譯統一框架,世界範圍內首次突破200種語言互譯,翻譯質量業內領先。
  • 同傳學術講習班聚焦翻譯技術演進 百度AI同傳已多次服務大型會議
    近日,自然語言處理頂級學術會議之一EMNLP 2020在線上舉行。EMNLP由國際計算語言學學會(ACL)旗下SIGDAT組織,會議涵蓋語義理解、文本理解、信息提取、信息檢索和機器翻譯等主題。從翻譯模式看,相比傳統的文本翻譯,同聲傳譯對翻譯時延和準確率要求極高,這使得翻譯模型總是需要在信息不充分的情況進行翻譯,因而較之傳統機器翻譯,同聲傳譯難度又翻倍;從譯員角度看,同傳專業性極強、難度極大、耗腦又耗嗓,對同傳譯員要求極高,除了深厚的語言能力外,還需要極強的反應能力,邊說邊聽,精力高度集中,對譯員的腦力和體力都是極高的挑戰。因此往往一場會需要兩個甚至多個譯員共同完成同傳。
  • 全球首個突破200種語言互譯的翻譯引擎 百度翻譯打破世界溝通壁壘
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。2015年5月,百度發布全球首個網際網路神經網絡翻譯系統,領先谷歌1年4個月; 2019年在國際權威機器翻譯評測WMT中,百度超越國內外知名企業,在中英翻譯位列第一;而在多語言翻譯方面,針對語言數量多,分布不均衡,實現難度大的難題,百度研發了基於神經網絡的多語言翻譯統一框架,世界範圍內首次突破200種語言互譯,翻譯質量業內領先。
  • 百度聯合谷歌主辦同傳學術講習班 創新技術+產品助力跨語言交流
    會上,由百度聯合Google舉辦的首次機器同聲傳譯學術講習班(Tutorial)召開,圍繞機器同傳的背景、挑戰、模型、數據集、實用系統和產品、未來研究方向等展開報告和研討,吸引了數百位國際學者參會。(EMNLP2020同聲傳譯學術報告會)同聲傳譯一直都被學界和工業界廣泛認為是自然語言處理最難的問題之一。
  • 韓國K-DESIGN設計大獎競爭激烈 百度翻譯精準打造品牌IP脫穎而出
    讓我們趕緊通過下面的短片來一睹真容吧~   為了傳遞「打破溝通壁壘」這一願景,在品牌創意宣傳片中,一隻破殼而出的小雞,衝破了語言的壁壘,進入了各種語言可以無障礙溝通的次元時空。這隻憨厚可愛的形象就是百度翻譯的品牌IP——翻譯雞。
  • 小度真無線耳機+百度AI同傳解決方案 打造耳邊"翻譯官"
    9月15日,"萬物智能——百度世界2020"大會首次由百度與央視新聞聯合呈現,在3小時的直播互動中,百度創始人、董事長兼 CEO 李彥宏和中央廣播電視總臺央視主持人康輝跨界組合,將 AI 賦能下的社會生活全貌搬上央視新聞直播間,為億萬觀眾奉上一場包羅萬象的 AI 立體科普。
  • 百度世界2020小度新品亮相:AI同傳解決方案打造耳邊「翻譯官」
    9月15日,"萬物智能——百度世界2020"大會首次由百度與央視新聞聯合呈現,在3小時的直播互動中,百度創始人、董事長兼 CEO 李彥宏和中央廣播電視總臺央視主持人康輝跨界組合,將 AI 賦能下的社會生活全貌搬上央視新聞直播間,為億萬觀眾奉上一場包羅萬象的 AI 立體科普。
  • 小度真無線耳機+百度AI同傳解決方案 打造耳邊「翻譯官」
    9月15日,「萬物智能——百度世界2020」大會首次由百度與央視新聞聯合呈現,在3小時的直播互動中,百度創始人、董事長兼 CEO 李彥宏和中央廣播電視總臺央視主持人康輝跨界組合,將 AI 賦能下的社會生活全貌搬上央視新聞直播間,為億萬觀眾奉上一場包羅萬象的 AI 立體科普。
  • 烏鎮網際網路大會官方首次使用AI同傳,搜狗為雷軍提供機器翻譯
    11月7日-9日,第五屆世界網際網路大會在浙江烏鎮召開值得一提的是,搜狗同傳作為本屆大會智慧化應用的重要組成部分,是世界網際網路大會有史以來,AI同傳首次服務官方主議程。作為大佬雲集的科技盛典,本次會議的對話內容涉及到多個領域的高端技術詞彙,翻譯難度飆升。搜狗同傳不僅將這些詞彙各個擊破,並且隨時聯繫上下文調整翻譯結果,在準確還原語義的基礎上,讓語句更加符合口語習慣,便於人們理解。這是連續五屆世界網際網路大會以來,官方首次使用AI同傳,具有十分重要的意義。以
  • 百度領銜舉辦首次機器同傳講習班 詳解機器同聲傳譯技術演進
    從翻譯模式看,相比傳統的文本翻譯,同聲傳譯對翻譯時延和準確率要求極高,這使得翻譯模型總是需要在信息不充分的情況進行翻譯,因而較之傳統機器翻譯,同聲傳譯難度又翻倍;從譯員角度看,同傳專業性極強、難度極大、耗腦又耗嗓,對同傳譯員要求極高,除了深厚的語言能力外,還需要極強的反應能力,邊說邊聽,精力高度集中,對譯員的腦力和體力都是極高的挑戰。因此往往一場會需要兩個甚至多個譯員共同完成同傳。
  • Transn傳神攜手阿里雲、釘釘,在線同傳翻譯服務重磅上線
    而隨著後疫情時代的新變局,會議場景的用戶習慣正在改變,更多的會議都選擇在線進行,「雲端會議」成為跨國會議的主流,對遠程、實時、精準的語言服務需求更為迫切。我們真的可以做到足不出戶而精通天下事嗎?跨城市、跨區域、跨國的雲端會展已成大勢,這對多語種線上無礙溝通提出了更高的要求與挑戰。
  • 百度翻譯每天響應超千億字符翻譯請求 跨越世界自由溝通的「語言...
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。2015年5月,百度發布全球首個網際網路神經網絡翻譯系統,領先谷歌1年4個月; 2019年在國際權威機器翻譯評測WMT中,百度超越國內外知名企業,在中英翻譯位列第一;而在多語言翻譯方面,針對語言數量多,分布不均衡,實現難度大的難題,百度研發了基於神經網絡的多語言翻譯統一框架,世界範圍內首次突破200種語言互譯,翻譯質量業內領先。
  • 支持近30種語言智能翻譯,百度如流讓跨語言溝通零障礙
    隨著全球貿易體系的加深,各國間跨語言溝通需求持續增長,而今年疫情的全球蔓延,更激發了在線交流的需求猛增。因語言不通帶來的溝通問題既影響著各國企業間的商務合作與貿易往來,也阻礙了跨境企業的全球業務拓展。如何打破這種溝通壁壘?
  • 百度翻譯八周年 全新版本發布「YOUNG溝通,更多彩」
    「打破語言障礙,使人們隨時隨地與世界自由溝通」是百度翻譯一直以來的願景。2011年6月30日,百度正式推出web端百度翻譯,百度翻譯網頁版正式發布,無數使用百度搜索的網友開啟了網上翻譯的新時代。2013年2月28日,百度翻譯發布?
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。2015年5月,百度發布全球首個網際網路神經網絡翻譯系統,領先谷歌1年4個月; 2019年在國際權威機器翻譯評測WMT中,百度超越國內外知名企業,在中英翻譯位列第一;而在多語言翻譯方面,針對語言數量多,分布不均衡,實現難度大的難題,百度研發了基於神經網絡的多語言翻譯統一框架,世界範圍內首次突破200種語言互譯,翻譯質量業內領先。
  • 搜狗翻譯獨家支持PBIC 2020國際挑戰賽,展現優異AI同傳能力
    8月15日,主題為「創新實踐,公益非洲」的PBIC 2020 (第四屆) 青少年公益創新國際挑戰賽總決賽在北京舉辦。搜狗翻譯鼎力支持PBIC 2020賽事,為現場提供了精準流暢的AI同傳服務,通過架起語言溝通橋梁、助力公益無國界。