同聲傳譯——解密搜狗同傳

2020-12-15 愛好者網站

關注國際新聞的朋友可能已注意到,每次的聯合國大會上,很多外交官都會頭戴耳機認真聆聽其他國家外交官的發言,這裡應用的就是同聲傳譯技術,它讓收聽者可以快速理解不同國家的語言。以前的同聲傳譯基本上靠人來快速翻譯,而隨著智能技術的發展,智能機器翻譯開始越來越多的應用到同傳的領域中。

同聲傳譯,並不是一次簡單的機器翻譯

說到機器翻譯,相信很多朋友都在使用百度、有道等公司提供的在線翻譯。我們只要打開在線翻譯頁面,然後輸入需要翻譯的語句,選擇輸出翻譯語言即可快速完成翻譯。如果再藉助語音輸入完成需翻譯語句的輸入,這就是一次簡單的同聲傳譯模型(圖1)。

圖1 同聲傳譯模型

不過在線機器翻譯準確度不高、機械性強、語義歧義等一直受人詬病,而要實現同聲傳譯,一是要求「同聲」,也就是可以同步識別發言者的語音,實現儘可能短的延遲;二則是「傳譯」,要求翻譯儘可能的準確。隨著人工智慧和深度學習技術的發展,同聲傳譯技術逐漸實現上述兩個要求,比如搜狗的「搜狗同傳」技術就可以很好實現「同聲」和「傳譯」(圖2)。

圖2 「搜狗同傳」技術展示

同聲+傳譯,搜狗同傳背後的秘密

如上所述,同聲傳譯技術並非簡單的語音輸入和機器翻譯的結合體。同聲傳譯講究的是「同聲」+「傳譯」,那麼搜狗同傳這類技術是怎麼實現這些要求?

首先是同聲,在王小川演講的演示中可以看到,在演講者完成一句話的演講後,背後的大屏幕幾乎在同一時間完成了語音和文字轉換。這看似簡單的語音到文本的轉換,實則是搜狗強大語音識別技術的實際體現。

要對某個人說出的語句進行實時、高效的識別,搜狗同傳先要實現精準的語音斷句,也就是對用戶說的每一句話進行判斷,從而可以準備識別用戶真正的表達意圖。因為用戶的演講是連貫的,如果無法實現準確的語音斷句,那麼就很容易出現識別的偏差。舉個簡單的例子,「小王打敗了小李得了冠軍」這樣一句話,用戶在表述中不同的停頓就有完全不同的意思,如「A:小王打敗了,小李得了冠軍」,「B:小王打敗了小李,得了冠軍」。

為了提高語音斷局的能力,搜狗同傳算法通過能量檢測和基於深度學習模型的方式,對語音信號進行語音和靜音的判斷,這樣可以跳過對靜音片段的處理以提升解碼效率,同時語音片斷可以分割成多句並行識別,大大提高語音識別的效率。藉助深度學習模式,搜狗同傳就可以準確識別語音斷句,比如上述例子,如果前文表達的是小王的實力強大,這樣通過上下文關係搜狗同傳就會使用A的短句理解用戶輸入(圖3)。

圖3 語音短句圖解

在語音識別部分,搜狗同傳使用了CLDNN+CTC結合的聲學模型和RNNLM語言模型,把經過語音斷句後的片段,通過聲學模型和語言模型轉化成文本。這樣藉助「語音斷句算法+聲學模型+RNNLM語言模型」,搜狗同傳就可以準確識別用戶的演講,從而實現高效的「同聲」輸入識別(圖4)。

圖4 同聲輸入圖解

其次是「傳譯」,在完成對用戶語音的識別後就需要進行同步的翻譯。要完成文本的準確翻譯,其中的關鍵是文本斷句。搜狗同傳的文本短句模塊藉助內容平滑技術去掉無意義詞語,使句子變得通順,然後通過規則和模型兩種方法進行語句劃分並加標點。這裡還運用到了雙向GRU技術構建編碼端的結構。通過Attention機制在源端和目標端文本間進行對齊並生成當前時刻的句子級向量表示,並送至解碼端,解碼端逐詞解碼輸出翻譯結果。這樣翻譯後的語句通暢,可以很好讓傾聽者看明白其他語言發言者要表達的意思(圖5)。

圖5 傳譯模式圖解

這樣通過「同聲」(語音短句+識別輸入)和「傳譯」(文本短句+逐詞解碼),搜狗同傳可以讓不同語言的演講者和傾聽者都可以看懂彼此的發言,實現全人類之間的順暢交流(圖6)。

圖6 同聲傳譯圖解

同聲傳譯,讓我們溝通更便捷

隨著對外開放力度的加強,無論是對外貿易(如和國外合作廠商的協作),還是普通用戶的對外交往(如和國外網友的skype交流)。我們都需要和不同語言的用戶進行交流,但是由於語言的障礙,使得這些交流變得異常困難。

不過隨著類似搜狗同聲傳譯技術的發展,接著這些技術我們就可以和國外網友,同事進行無障礙的交流,這極大提高我們之間的溝通效率。比如對於國外有分部的公司,通過會議室投影儀的展示,不同國家的員工可以無障礙瀏覽和理解一種語言的製作的PPT。對於希望學習其他語言的網友,藉助同聲傳譯遠程在線課堂,即使身在中國,也不會由於母語的限制而看不懂國外教師的演示,大大提高在線學習的效率。

正是看到同聲傳譯發展潛力,目前各大IT巨頭也在發展各自的同聲傳譯技術,比如谷歌在開發神經網絡機器翻譯技術,並且在YouTube視頻使用即時同聲傳譯字幕(圖7)。

圖7 谷歌神經網絡機器翻譯

騰訊公司則推出的人工智慧同聲傳譯解決方案「騰訊同傳」,科大訊飛推出的智能語音翻譯機,隨著AI技術的發展,這些同聲傳譯技術必將會給我們和世界的交流帶來更多的便利(圖8)。

圖8 騰訊同傳

 

相關焦點

  • 同聲傳譯高效溝通 搜狗AI錄音筆E1
    【天極網家電頻道】搜狗AI錄音筆E1擁有8麥陣列人聲純淨、AI降噪清晰聽感、多語言轉寫、智能摘要精煉要點、同聲傳譯高效溝通、雲端存儲、32G大內存、支持wifi聯網等特點,目前京東售價1218元。
  • 百睿德啟動遠程同聲傳譯會議視頻同傳租賃解決方案
    疫情之前,遠程同傳(非現場同聲傳譯)技術被視為用來解決在線多方視頻會議語言溝通障礙的最優解決方案,令人略感欣慰的是,經此一「疫」,視頻會議及同聲傳譯提供商們開始意識到數位化技術是會議會展中翻譯服務市場增強風險抵禦能力。拓寬未來同聲傳譯視頻會議道路的同時具有無可替代的重要性,同聲傳譯遠程數位化建設的重要性已經成為共識。
  • 楊冪:做好同聲傳譯真的不容易,新聞同傳更難!
    所謂「同傳」,全稱是同聲傳譯,又稱同步口譯,是譯員在不打斷講話者的同時,不停地講其講話內容翻譯給聽眾的一種口譯方式,同聲傳譯按照領域又可以進行精細劃分,今天知行翻譯小編就為大家講一下新聞領域的同聲傳譯。
  • 同聲傳譯要點_同聲傳譯服務類型_專聯譯盟網
    同聲傳譯應用領域同聲傳譯除了廣泛應用於國際會議之外,也在外交外事、會晤談判、商務活動、新聞傳媒、培訓授課、電視廣播、國際仲裁等諸多領域被廣泛使用。同聲傳譯翻譯類型包括但不限於:會議同聲傳譯、會晤談判同傳、耳語同傳、國際交流遠程同傳等諸多領域。
  • 同聲傳譯、實時翻譯?搜狗這支筆大有乾坤
    33種語言實時翻譯、中英同聲傳譯、錄音速記,今天小蟹就帶大家走進這支神奇的筆——搜狗速記翻譯筆,看看它是如何獲得我們青睞的吧。輕按底部的電源將會打開搜狗速記翻譯筆,之後上方的電源指示燈將會被點亮。通過這6枚指示燈,你可以得知搜狗速記翻譯筆的工作狀態和剩餘電量。細心的你會發現,在指示燈的兩邊有兩個小口,這裡便是搜狗速記翻譯筆的兩個麥克風。
  • 百度領銜舉辦首次機器同傳講習班 詳解機器同聲傳譯技術演進
    會上,由百度聯合Google舉辦的首次機器同聲傳譯學術講習班(Tutorial)召開,圍繞機器同傳的背景、挑戰、模型、數據集、實用系統和產品、未來研究方向等展開報告和研討,吸引了數百位國際學者參會。(EMNLP2020同聲傳譯學術報告會)同聲傳譯一直都被學界和工業界廣泛認為是自然語言處理最難的問題之一。
  • 探訪同聲傳譯訓練室 本網記者為你揭露「同傳」的秘密
    原標題:探訪同聲傳譯訓練室 本網記者為你揭露「同傳」的秘密   中國江蘇網7月3日訊(通訊員 饒雨夏 記者 袁濤)世界盃激戰正酣,中國的球迷在盡情歡呼的同時,背後少不了同聲傳譯工作人員的辛勤付出。這項看似神秘,且被很多人認為高大上的工作,需要經過哪些特殊訓練?
  • 同聲傳譯收入揭秘|翻譯|夏方耘|吳鍾明|翻譯資格|同聲傳譯
    這時,夏方耘迅速在一張白紙上記錄,幾乎就在吳教授張嘴的同時,馬上翻譯出致辭的中文意思,「尊敬的市長閣下,中國朋友們……」語調、語速、停頓被「翻譯」得毫不走樣,當吳教授的致辭結束,夏方耘的同聲傳譯也戛然而止——這是12日,記者在武漢大學外國語學院所見的一段精彩的同聲傳譯表演。
  • 同聲傳譯收入揭秘
    這時,夏方耘迅速在一張白紙上記錄,幾乎就在吳教授張嘴的同時,馬上翻譯出致辭的中文意思,「尊敬的市長閣下,中國朋友們……」語調、語速、停頓被「翻譯」得毫不走樣,當吳教授的致辭結束,夏方耘的同聲傳譯也戛然而止——這是12日,記者在武漢大學外國語學院所見的一段精彩的同聲傳譯表演。
  • 同聲傳譯(SI)的自我訓練方法
    儘管他們目前承擔著口譯教學工作,但卻從未接受過任何形式的同傳訓練,也不曾有過任何同傳實踐,所以對同聲傳譯非常陌生急需「脫盲」,否則將難以勝任同傳教學。除了師資原因之外,還由於課時、設備、學生素質、教學方法、課程設置、培養規模等條件的限制,各院校基本上只教交替傳譯,同聲傳譯則教得很少或者不教,有的即使教了,也只用幾周時間一帶而過。
  • 口譯 同聲傳譯
    同聲傳譯,又稱同步口譯,是譯員在不打斷講話者演講的情況下,不停地將其講話內容傳譯給聽眾的一種口譯方式。
  • 西安同聲傳譯翻譯及設備租賃的發展前景
    在陪伴螢屏上翻譯官喜怒哀樂的同時,人們也將目光投向「同聲傳譯」(簡稱「同傳」)這一神秘職業。同傳,指譯員在口譯過程中,持續同步地為聽眾提供翻譯。因門檻高、壓力大,同傳譯員常被貼上「多金」「早衰」等標籤。這是現實,還是迷思?記者特地採訪了一名國內資深英語同傳。
  • 我是某跨國公司中國總部的同傳譯員,關於同聲傳譯、交替傳譯等翻譯...
    我是某跨國公司中國總部的同傳譯員
  • 搜狗「AI翻譯官」同傳3.0逆天了
    「語境引擎」的同聲傳譯系統3.0版,新增多模態和自主學習能力。以大會同傳為例,搜狗同傳3.0系統在聽聲的過程中,還能夠實時閱讀PPT,並將它所看到的內容拓展成知識網絡,從而經「思考」後讓實時翻譯變得更準確。據統計,針對演講核心內容,搜狗同傳3.0識別正確率提升了21.7%,翻譯正確率提升了40.3%。隨著國際交流日趨頻繁,國際交流中的現有同聲傳譯服務成本高、人才不足,難以滿足需求。
  • 澳洲同聲傳譯華裔第一人:多次擔任領導人同傳
    中新網3月15日電 據澳洲新快網報導,來到澳洲生活和學習的華人中,不乏經過努力使自己的英語能力達到極高水平的人士,但修煉到能夠從事同聲傳譯工作的人卻並不多。秦先生(Charles)在澳洲從事了多年的翻譯工作,並且是國際會議口譯員協會(AIIC)會員。據Charles介紹,他是澳洲地區第一位加入AIIC的華人。
  • 你猜猜同聲傳譯工作者一個月多少錢?
    同聲傳譯,簡稱「同傳」,又稱「同聲翻譯」、「同步口譯」,是指譯員在不打斷講話者講話的情況下,不間斷地將內容口譯給聽眾的一種翻譯方式,同聲傳譯員通過專用的設備提供即時的翻譯,這種方式適用於大型的研討會和國際會議,通常由兩名到三名譯員輪換進行。
  • 同聲傳譯會議系統開創數位技術新紀元
    中國同聲傳譯人才更是緊缺。據不完全統計,專業的同聲傳譯人才僅2530人左右,大多在北京、上海和廣州這些國際交往頻繁的大都市。近幾年來,同聲傳譯已被列為緊缺人才之一。由於粥多僧少,供不應求,處於買方市場的同傳自然薪酬不菲,據專業人士透露,優秀的翻譯每天能賺800美元,一般水平的翻譯也能掙到4000元人民幣。同傳被大家稱為含金量最高的「金領」行業之一。
  • 什麼叫同聲傳譯,同聲傳譯設備組成
    首先,我們得清楚認識,什麼叫同聲翻譯。同聲翻譯俗稱同步口譯,是翻譯者在不打斷演講人的情況下,不間斷的將所聽語言翻譯成另一種需要的語種給所需人聽的一種翻譯方式。同傳譯員通過專用的會議設備提供即時的同步翻譯。這種翻譯方式,適用於大型的研討會、峰會論壇和國際性會議。
  • 寶鋼建立全國首個行業內同聲傳譯團隊 同傳:國際會場的「隱身人」
    徐辰和他的搭檔就是在這個玻璃房裡為國際會議提供同聲傳譯服務的。他們「只聞其聲不見其人」,在大型會議現場,他們得心應手地運轉著語言。人類尖端的智慧,沿著語言的脈絡,傳遞到世界各地。
  • 【方法】同聲傳譯自我訓練的5個經典方法!
    但是令人擔憂的是:目前在我國高校任教的口譯教師絕大多數都屬於「半路出家」,他們既非專業譯員出身,又非口譯專業畢業。儘管他們目前承擔著口譯教學工作,但卻從未接受過任何形式的同傳訓練,也不曾有過任何同傳實踐,所以對同聲傳譯非常陌生急需「脫盲」,否則將難以勝任同傳教學。