Skype Translator實時語音翻譯技術原理

2020-11-28 IT168

  【IT168 評論】近日,微軟正式宣布在中國市場推出Skype Translator實時語音翻譯技術的中文預覽版。對於英文不好的小夥伴們,這無疑是個利好,從此中英文溝通無障礙。

  Skype Translator是由Skype和微軟機器翻譯團隊聯合開發,整合了微軟Skype語音和聊天技術、機器翻譯技術、神經網絡語音識別打造了一款面向消費者用戶的產品。

  自2014年12月Skype Translator 推出英文和西班牙文之間的實時語音翻譯之後,此次在中國市場的發布Skype Translator無疑將微軟語音翻譯技術能力和Skype的未來應用前景推升到新的裡程碑。

  Skype Translator預覽版適用於Windows 8.1或Windows 10技術預覽版的客戶端或平板電腦客戶端。除了英文和中文普通話的語音翻譯之外,還支持四十多種語言的即時文本翻譯。 

  眾所周知,中文是一門極具挑戰性的語言,中文有大約一萬個常用漢字以及多種多樣的語音、語調,這對於母語為英語的學習者來說是最大的困難之一,有類似困難的語言還有阿拉伯語、日語和韓語。

  微軟在2012年首次演示了英文和中文普通話之間的實時語音翻譯技術原型。經過多年的研究和投入,完成了普通話的語言模型,使Skype Translator的中文語音翻譯在今天變為現實。不僅如此,得益於深層神經網絡與微軟成熟的統計機器翻譯技術的結合,語音識別能力被進一步提高,翻譯結果將更加準確。

  Skype Translator實時語音翻譯技術原理

  Skype Translator構建於強大的機器學習平臺之上。機器學習是指軟體學習訓練數據的能力。通過在預覽版階段獲取的訓練數據,加之其中的細微差別,軟體就能夠針對真實使用者的不同話題、口音與語言轉換進行學習,實現更好的識別和翻譯。

  Skype Translator的機器學習協議訓練並優化語音識別和機器翻譯任務,就像黏住這些元素的膠水一樣,該協議促進對被識別的文本進行更好的翻譯。這個過程包括去除造成不流利的字詞(例如「啊」「嗯」以及重複措辭)、將文本分解成句子、添加標點符號和大小寫識別。

  語音識別和機器翻譯的訓練數據來源多種多樣,包括翻譯的網頁、配有字幕的視頻,以及預先翻譯且轉錄成文字的一對一談話。Skype Translator通過記錄這些對話來分析對話文本並訓練系統更好地「學習」各種語言。統計模型教會語音識別和機器翻譯引擎如何將收集到的語音轉換為文本信息,然後將文本信息轉換為另一種語言。使用Skype Translator的用戶都會在對話開始前得到清晰的系統提示,即對話將被錄製並用於提高微軟翻譯和語音識別服務的質量。

  在準備好的數據被錄入機器學習系統後,機器學習軟體會在這些對話和環境涉及到的單詞中搭建一個統計模型。當用戶說話時,軟體會在該統計模型中尋找相似的內容,之後應用到預先「學到」的轉化程序中,使得音頻轉換為文本再從文本轉換成另一種語言。

  雖然語音識別一直是近幾十年來的重要研究課題,但是該技術的發展普遍被錯誤率高、麥克風敏感度差異、噪音環境等因素阻礙。微軟研究院將深層神經網絡(DNNs)技術引入語音識別,極大程度地降低了錯誤率,提高了可靠性,最終使這項語音翻譯技術得以更廣泛地應用,包括Skype Translator。

  Skype Translator的機器翻譯部分負責將文本從一種語言翻譯成另一種語言。它採用了和必應在線翻譯同樣的技術:開創性地結合了句法和統計模型,此外更加有針對性地訓練對話性語言。這點非常有挑戰性,因為現在用來搭建文本翻譯系統的典型訓練數據都是優化過的清晰、結構嚴謹的書面語言。Skype Translator系統在包含必應翻譯的豐富語言知識的同時,還額外加入了口語對話中出現的單詞及短語。

  另外,Skype Translator創造了一個定製化的機器人程式來協調整個產品體驗。如電話中的第三方一樣,它負責建立電話連接、發送音頻流至語音引擎獲取翻譯文本,並分別在雙方結束說話時翻譯其所說的內容。

  Skype Translator中文預覽版功能更新

  相較於2014年12 月推出的英文和西班牙文之間的實時語音對話,本次推出中文預覽版的功能更新如下:

  語音讀取文字信息

  用戶可以通過語音收聽到對話方發送給自己的即時消息,語音的語言可以自選。

  持續性識別

  在對方發送語音信息期間可持續性的進行文字翻譯。

  自動聲量控制

  用戶的對話方可以在實時語音翻譯期間不間斷地說話。同時,用戶可收聽到較高音量的語音翻譯,對話方本身的語音信息呈現出較低音量,所以用戶只要將注意力集中在語音翻譯上即可,這可以保證翻譯信息的收聽流暢。

  語言翻譯靜音功能

  用戶可以任意開啟或關閉語音翻譯的聲音,並直接讀取文字翻譯。

  除了語音翻譯現有的四種語言(英語,西班牙語,中文普通話,義大利語), Skype Translator 的即時通訊文本翻譯更是在原有40多種語言的基礎上加入了塞爾維亞語,波士尼亞語,克羅埃西亞語,瑪雅語和奧託米語。

相關焦點

  • Skype視頻通話開放實時翻譯功能,支持中文普通話
    昨日,微軟宣布Skype將面向所有用戶開放視頻通話的實時翻譯功能
  • 揭秘:搜狗語音實時翻譯是怎麼煉成的
    雖然搜狗語音實時翻譯將王小川說的「搜索的未來就是人工智慧時代的皇冠」準確翻譯成了「In the future, search will be the Crown of the AI Era」,但王小川坦言,在演示之前沒做預先的試驗,對效果並沒有把握,就連他也是捏著一把冷汗,也不認為機器可以把人幹掉。然而,新技術的突破總會讓人感到興奮。
  • Google翻譯將加入拍照、語音實時翻譯
    據國外媒體報導,Google翻譯App將會加入兩項全新功能——拍照翻譯和實時語音翻譯。Google今年5月收購了一款可以實現拍照快速翻譯的應用Word Lens,如今Google打算將這一功能融合到「Google 翻譯」的應用中。
  • skype是什麼?skype怎麼安裝使用?
    skype是一款國際通訊工具,通過skype可以實現免費通話,免費視頻等功能。可以使用即時消息、語音消息和發送簡訊,無論你在哪裡都可以實現隨時隨地加入聊天。如何才能註冊skype帳戶呢?並使用skype通話呢?
  • 翻譯要失業?微軟「原聲」實時語音翻譯軟體亮相
    今年早些時候,我們報導過微軟正在研發的一款「原聲」語音翻譯軟體,它能把用戶說的話翻譯成其他語言播放出來,同時保留用戶本身的口音、音色和語調,聽上去就像用戶親口說的一樣。今天,微軟發布了該軟體的最新演示視頻,微軟首席研究官瑞克•拉希德(Rick Rashid)在視頻中利用該軟體大秀還算標準的中國普通話。
  • 谷歌翻譯推出實時語音轉錄功能
    IT之家3月18日消息 據XDA報導,谷歌於幾個月前開始測試一項名為「持續翻譯(Continuous Translation)」的新功能,該功能於今年1月面向公眾,目前該功能名為「轉錄(Transcribe)」,未來幾天將向所有安卓用戶推送。
  • 能聽懂中文的Skype來了:實時翻譯現向所有用戶開放
    Skype實時翻譯界面 鳳凰科技訊 北京時間5月13日消息,據法新社報導,微軟旗下即時通訊服務Skype周四宣布,從現在起,用戶不必再註冊就可以使用預覽版Skype Translator
  • 「實時翻譯耳機」橫空出世,深度剖析三大核心技術|獨家
    不可否認的是,消費者可能每天會戴耳機聽音樂,但不會每天都有跟外國人對話的需求,這讓實時翻譯成為一種有也不錯而非必須性的附加性功能,因此耳機業者多會將其與更多功能結合,包括無線、智能語音助理等,因此實時翻譯耳機雖後端整合了許多深度學習的技術,目前看來仍是話題性遠高於實用性。
  • 百度手機輸入法語音翻譯
    文章原標題:百度手機輸入法語音翻譯 開啟人工智慧新紀元  談及語音識別,其實早已不是什麼新鮮技術了。TTS(Text To Speech)技術發展了幾十年,各種科技公司都相繼推出了語音搜索和語音助手功能,語音輸入類產品也是層出不窮。
  • 當鍵盤能聽懂人話,咪鼠語音鍵盤KB1評測:語音打字+實時翻譯
    考慮到我自己經常休息日一個人在書房碼字,於是入手了一款咪鼠智能語音鍵盤來提升打字效率,抽空也來和大家分享下這款普通而不平常的鍵盤。開箱曬物:傳統造型+四鍵賦能咪鼠智能語音鍵盤KB1發布於12月4號,算是一款剛出爐的新品,除了傳統鍵盤外,其還具有語音打字、語音翻譯、語音控制、OCR智能截圖、一鍵打開計算器等智能功能,受眾人群主要是都市白領、外貿從業者。
  • 微軟在語音翻譯領域的突破:「原聲」實時將英語轉為漢語
    微軟近日發布了一個視頻,主講人是微軟首席研究員Rick Rashid,他向大家展示了微軟在語音翻譯領域取得的新成就。 開始他展示了計算機對英語的語音識別能力,隨著演講的進行屏幕上就出現了相應的文字,接著他開始展示這些英文是如何翻譯成中文的。到這還不算什麼,但是接著,計算機開始像真正的口譯員一樣將Rick所說的話全部用中文語音說出來,而且由於此前Rick曾經給這套系統輸入過一小時自己的錄音信息,電腦的中文聲音不是機械聲,而是跟Rick本人的音調驚人的一致。
  • 語音翻譯器
    語音翻譯器作為一款功能全面的語音翻譯神器,軟體通過強大的語音識別系統,可快速完成多國語言翻譯工作,包括常見的中英翻譯、中泰翻譯、韓文翻譯、日語單詞翻譯等語言在線翻譯,成熟的語音識別技術幫助用戶在翻譯時享受良好體驗及翻譯效果
  • 實時翻譯:英語不好的人你們有福啦
    事實上,與那些讓生活變得複雜的「智能產品」不同,實時翻譯是那種讓人在直覺上理應擁有的技術,正因如此,它也一直存在於《星際迷航》《神秘博士》以及《銀河系漫遊指南》等科幻作品中。好消息是,人類似乎離這個夙願越來越近了。幾天之前,微軟旗下的Skype(聽起來很久遠的名字)宣布,具備實時語音翻譯技術的翻譯器Skype Translator中文預覽版正式在中國市場推出。
  • 計算機翻譯會取代人工翻譯嗎?
    遊客可能會接受一些誤譯,因為這種技術廉價又便捷。但在商業、法律或醫學等領域,當風險加大時,這些翻譯服務往往達不到要求。「我們將其與語音識別技術相結合,大幅提升了準確性。」「調查內容是最重複的內容之一,好的計算機輔助翻譯工具可以極大地加快翻譯過程,」她說。For meetings and conferences, wearable translators like Waverly's are undoubtedly popular.
  • 雙語閱讀:計算機翻譯會取代人工翻譯嗎?
    遊客可能會接受一些誤譯,因為這種技術廉價又便捷。但在商業、法律或醫學等領域,當風險加大時,這些翻譯服務往往達不到要求。「我們將其與語音識別技術相結合,大幅提升了準確性。」「調查內容是最重複的內容之一,好的計算機輔助翻譯工具可以極大地加快翻譯過程,」她說。For meetings and conferences, wearable translators like Waverly's are undoubtedly popular.
  • Skype 因為當地法律問題被下架,到底是因為什麼問題?
    蘋果在給《紐約時報》的郵件聲明中確認此事,「我們已接到公安部的通知,幾款在網際網路協議之上提供語音服務的應用不符合當地法律。因此,這些應用軟體已從中國區應用商店下架。這些應用軟體仍可在其他使用它們的市場上獲得。」《好奇心日報(www.qdaily.com)》今天也收到了蘋果就此事的相同聲明。
  • 英語聽力:微軟展示即時語音翻譯系統最新成果
    微軟首席研究官瑞克·拉希德(Rick Rashid)博士在會上展示了語音機器翻譯實時演示(Speech to Speech Translation),瑞克博士一邊講述英文,系統就將英文立即翻譯成中文。  這是目前微軟研究院所即時語音翻譯系統的最新研究成果,這一系統不僅可以達到即時語音識別、雙語翻譯,更牛的是可以做到即時發音,效果已經接近同聲傳譯。
  • 英文語音翻譯中文怎麼翻譯?與外國人進行交流的小妙招
    大家可以藉助一些能夠進行語音翻譯的工具,就可以語音翻譯操作了,不用擔心自己的口語差,因為藉助這種工具,大家只要說出中文,系統就會進行語音識別並翻譯,把中文翻譯成英文。我們以【錄音轉文字助手】為例子,跟大家簡單的介紹下,如何操作的!
  • 搜狗獲WMT2017國際翻譯大賽雙向冠軍 可滿足多種場景下的實時翻譯...
    而在這場以語音翻譯為突破口的人工智慧技術的較量中,中國的網際網路公司已經佔據了領先地位。近期獲悉,搜狗語音交互技術中心代表搜狗參加了含金量極高的WMT2017國際評測比賽,該中心研發的搜狗神經網絡機器翻譯(Sogou Neural Machine Translation)系統獲得中英/英中翻譯的雙向冠軍。
  • 能將手語實時翻譯成語音的智能手套|Nat. Electron.
    圖片來源:UCLA來源 UCLA翻譯 阿金審校 張之典加利福尼亞州大學洛杉磯分校(UCLA)的生物工程師們設計出一種手套狀設備,通過手機應用程式,能夠將美式手語實時翻譯成英語語音。Jun Chen 是 UCLA 薩穆埃利工程學院(Samueli School of Englineering)的生物工程學助理教授,也是該項目的 PI,他表示:「我們希望為手語使用者打開方便之門,讓其可以直接和非手語人士交談,而不需要第三人做翻譯。此外,我們也希望能幫助更多的人自學手語。」該系統包括一副手套,和沿著每根手指裝配的一根根纖薄的可伸展式傳感器。