Microsoft Translator:打破語言障礙 拓展全球溝通新機遇

2020-12-11 快科技

Olivier Fontana, 微軟研究院Microsoft Translator產品戰略總監

世界越來越小,全球協作、共同創新已經成為常態。在微軟研究院,我們對此尤為感同身受——從北京到雷德蒙,從劍橋到班加羅爾,全球範圍內的無邊界溝通與協作是我們科研合作與產品創新的關鍵基礎。全球一體化帶來的發展機遇應該屬於每個人,為了幫助全球各地的人們跨越語言的障礙,實現高效溝通與廣泛協作,我們帶來了Microsoft Translator.

Microsoft Translator是微軟以機器學習、大數據、自然語言和雲計算等前沿技術為基礎打造的自動翻譯服務,也是微軟眾多人工智慧研究成果中投入使用最早也最廣泛的應用之一。Microsoft Translator現已支持50多種語言的文本翻譯、8種語言的實時語音翻譯和18種語言的語音識別和輸出。就在2016年7月底,我們在中文簡體和繁體的基礎上,最新加入了粵語文本翻譯,進一步完善了對漢語應用環境的支持。

自我學習的智能翻譯

「統計機器翻譯」是Microsoft Translator背後的主要技術,它以微軟十幾年來在自然語言領域的研究為基礎,加入了統計學與機器學習的原理。簡單地說,這套翻譯體系將「翻譯」轉變成了一個機器學習的課題,讓計算機不斷地對訓練數據中的人工譯文和語言轉換結果進行判斷與學習,在不斷的糾錯與改正中,促進系統算法的自我完善與優化。通過統計建模技術和高效的算法,不斷學習優化的機器翻譯系統能學會根據上下文的語境,而不是單詞的意思和生硬的語法規則來匹配最恰當的翻譯結果。

要說Microsoft Translator的智能來自於機器學習、自然語言等技術,而它的可靠運行與不斷優化,則離不開微軟在各領域的資源優勢。例如,作為一項雲服務,Microsoft Translator運行於Microsoft Azure雲平臺,Azure提供了機器學習等高級分析功能的運行平臺,同時也確保了其作為SaaS雲服務的高可用性和數據安全性,並且它還可以根據需要彈性擴展運算規模。另一方面,覆蓋全球的必應搜尋引擎,也為Microsoft Translator提供了全球規模的語言素材與學習資料,讓機器學習系統得以不斷地成長和完善。

與此同時,微軟旗下多樣化的產品與服務,也為Microsoft Translator提供了施展才華的廣闊天地。從2006年起,Microsoft Translator便逐漸開始為越來越多的微軟產品提供自動文本翻譯功能,例如Office、必應搜索、IE和Edge瀏覽器、Skype、微軟小娜(Cortana)等等。或許你還沒有意識到,但它其實一直都在你身邊——在電腦的Word界面中點擊「審閱」菜單項,然後選擇「翻譯」圖標,你就能領略到Microsoft Translator的本領了。

讓你自然交流的智能語音翻譯

在2016年3月底舉辦的Build 2016微軟開發者大會上,微軟CEO薩提亞·納德拉指明了微軟乃至IT產業未來的一個發展方向:讓人類的自然語言與先進的機器智能進行交互,也就是「對話即平臺(Conversation as a Platform)」的概念,並且發布了「微軟機器人框架(Microsoft Bot Framework)」以及微軟認知服務(Microsoft Cognitive Service),用以幫助開發者打造新一代的人工智慧應用。事實上,作為一個能聽會說多種語言的人工智慧服務,Microsoft Translator在語音翻譯服務方面已經提前取得了成功的實踐。

早在2014年,Microsoft Translator即推出了語音翻譯服務,2016年3月又面向開發者開放了語音翻譯的API。目前Microsoft Translator支持對包括中文普通話在內的8種語言的實時語音翻譯(英語、法語、中文、德語、義大利語、西班牙語、阿拉伯語、葡萄牙語)。在Skype Translator以及Windows、iOS或者Android版的Microsoft Translator應用中,你都可以體驗到這項私人實時口譯服務。

語音翻譯要比文本翻譯複雜得多,需要經過自動語音識別(ASR)、TrueText智能文本校正、自動文本翻譯以及文本到語音轉換(TTS)四個步驟。


圖1:Microsoft Translator語音翻譯背後的技術

其中,自動語音識別藉助深層神經網絡,對數千小時不同語言的音頻數據進行分析和學習,以達到「聽懂」人類自然語音的目的——基於機器學習,語音識別的效果也會隨數據的積累而不斷完善。TrueText智能文本校正則負責將人們口語化的交流轉換為規範的文本,比如,去掉「嗯」、「啊」、「這個」、「那個」之類的贅詞以及重複、口吃等語病,並添加斷句、標點符號,從而讓文本更貼近用戶本來的意圖,也更易閱讀和翻譯。在文本翻譯基礎上增強的語音翻譯引擎,增加了更多口語文本語料庫,從而為口語會話類翻譯構建了更好的模型。 最後是文本到語音的轉換過程,如果翻譯的目標語言是Microsoft Translator目前所支持的 18 種轉換語言之一,那麼就能使用語音合成技術將翻譯後的文本轉換成語音播放出來。整個語音翻譯過程中,深層神經網絡(DNNs)技術的引入,則極大程度地降低了翻譯的錯誤率,提高了可靠性。

帶上你的私人翻譯,暢行天下

為了讓更多用戶可以隨時隨地、便捷地使用翻譯服務,Microsoft Translator面向不同平臺推出了移動端應用。這款應用不僅適用於Windows設備,同時還支持使用iOS、Android平臺的設備,甚至包括Apple Watch和Android Wear智能手錶。


Microsoft Translator移動端應用

運行於智能終端的Microsoft Translator經過持續的完善與升級,目前已經發展的非常成熟,不但支持眾多語言的翻譯功能,而且還可以提供離線翻譯選項。用戶既可以用鍵盤輸入或者粘貼文本,也可以利用麥克風直接錄入語音,或者是將看到的外國文字拍攝下來,讓軟體自動識別並翻譯。在最新版本中,我們還加入了支持8種語言的實時語音翻譯功能,讓語言不通的兩個人,僅憑一部手機就能進行面對面的實時語音交流。

Microsoft Translator移動端應用絕對是海外旅行必備的利器,它不但可以幫我問路,還能靠拍照辨認街道、商鋪和沒有圖片的菜單,甚至可以讓我和五湖四海的新朋友進行一次真正有意義的談話,真正體會到四海一家的暢快溝通。

在中國越來越流行的「海淘」則是Microsoft Translator的另一個用武之地。基於Microsoft Translator技術的必應翻譯(bing.com/translator)提供了在線文本翻譯和網站翻譯功能,只需輸入你的海淘網址,就能實現整個網頁的機器翻譯,並且同樣支持50多種語言,讓你的海外購物無障礙。Windows 10用戶通過添加Edge瀏覽器的Translator擴展插件,即可一鍵翻譯整個網頁或者文本。

在你最熟悉的微信中,也有Microsoft Translator的身影。只需在對話界面中,長按對話氣泡內出現的法語、日語或者阿拉伯語等文本,選擇「翻譯」,就會出現「微軟翻譯」給你帶來的中文譯文。

企業要國際化,還是本土化?我們都能幫忙

在全球市場一體化的今天,Microsoft Translator在商業領域和企業市場的應用前景也越發清晰起來。無論是海外企業拓展中國市場的本土化改造,還是中國企業出海發展的「走出去」戰略,我們都能助一臂之力。

Microsoft Translator所提供的文本和語音翻譯服務,可以幫助跨國企業實現無障礙的內部溝通和內部培訓、面向全球市場提供客戶支持、建設在線社區,並實現網站、文檔資料、商業智能的實時、雙向或多向的翻譯。相比傳統的本土化手段,作為雲服務出現的Microsoft Translator提供了按需付費的低成本、可定製的跨平臺開發和接入能力,可以確保符合企業IT的安全策略,並提供了業界唯一支持行業用戶定製的翻譯語料庫。目前,Microsoft Translator已經服務於全球上千家企業客戶,包括亞馬遜、eBay、Twitter、惠普、戴爾等,都在各自的業務全球化、本土化領域中得到了Microsoft Translator的幫助。


Microsoft Translator的客戶

在7月份剛剛結束的WPC 2016微軟合作夥伴大會上,微軟宣布將在今年年底前為Office 365企業用戶提供Skype Meeting Broadcast服務,它可以自動為網絡會議添加字幕,並將會議實時地翻譯成不同語言展現出來——這同樣都是基於Microsoft Translator實現的。

開放的API帶來開放的發展機遇

今天的微軟是一家生產力與平臺公司,我們致力於打造創新平臺,助力合作夥伴和生態系統的共同發展。在應用前景廣闊的智能文本和語音翻譯領域, Microsoft Translator也為人們帶來了創新機遇。

事實上,從2011 年起,Microsoft Translator便開放了 API,並以Azure雲平臺SaaS服務的形式向第三方提供雲端接入服務。目前,全球已有數千家客戶在使用此服務,來實現網站本地化、多語言客戶支持、電子商務、社交媒體、網路遊戲、商業智能等典型應用場景。Microsoft Translator API 可以輕鬆實現跨平臺接入第三方系統及應用,開發者只需在Azure Data Market網站 (datamarket.azure.com/browse/Data)上註冊使用,即可獲得每月200萬字符的免費翻譯服務。

微軟的使命是予力全球每一人、每一組織成就不凡。我們希望Microsoft Translator通過微軟的產品為消費者提供服務的同時,可以予力更多開發者和企業,為全球更多用戶提供多樣的翻譯服務,打破語言間的壁壘,促進世界各地人們的溝通、交流。

相關焦點

  • Microsoft Translator:消除面對面交流的語言障礙
    對於 James Simmonds-Read 而言,克服語言障礙是至關重要的。 「他們都是來尋求避難的,其中相當多數人都面臨語言障礙,」 他說,「我們不得不頻繁藉助翻譯。」 然而,人工翻譯的介入又帶來了額外的挑戰,因為它意味著這些年輕人必須面對第三方譯員說出一些敏感信息。 最近,兒童福利會找到了一個更好的解決方案。
  • Microsoft Translator發布粵語文本翻譯
    【天極網IT新聞頻道】7月21日,Microsoft Translator發布了粵語的文本翻譯,新的語言增加將繼續豐富微軟翻譯產品的生態系統*,讓更多組織和個人能夠快速且高效地實現翻譯應用。在中國,大有約5500萬人使用粵語(語言代碼YUE),而在全球其餘各地也有約2000萬的使用人口。
  • Microsoft Translator發布粵語文本翻譯—新聞—科學網
    Microsoft Translator發布粵語文本翻譯
  • 陪伴、智能、可依賴……百度「翻譯雞」以AI之力打破跨語言溝通障礙
    (原標題:陪伴、智能、可依賴……百度「翻譯雞」以AI之力打破跨語言溝通障礙)
  • 這些溝通方式才是解決語言障礙的關鍵,語言障礙矯正師如何溝通
    從事語言障礙行業,每天需要和來自天南海北的語言障礙者溝通、答疑,隨著時間的沉澱,越來越覺得自己需要改變,以往那種機械化、標準化的術語,不但外人聽了毫無溫度,連我們自己都覺得煩。自我反省一下,想達到更好的溝通,還是要從「心」做起,輔導我們的心理學教授說「你知我所想,我知你所需,心裡打破隔閡,產生信任,才會更好的溝通」。
  • 「喜歡你」與「黑鳳梨」:Microsoft Translator發布粵語文本翻譯
    在中國,大有約5500萬人使用粵語(語言代碼YUE),而在全球其餘各地也有約2000萬的使用人口。新的語言——粵語的增加將繼續豐富微軟翻譯產品的生態系統,讓更多組織和個人能夠快速且高效地實現翻譯應用。無論是商業應用還是個人應用,隨著微軟不斷增加新的語言支持,政府、社區和個人都將能夠更加便利地實現跨越國界的溝通。
  • 在線翻譯打破語言障礙,助力全球抗疫
    翻譯服務為全球各國通力合作、共同抗疫,搭建溝通橋梁,成為打贏防疫戰爭的重要法寶。  百度翻譯基於領先的翻譯技術,接連推出多項抗疫翻譯服務,支持中國多個抗疫志願者組織和全球抗疫人員防疫工作。此次,百度翻譯助力全球抗疫計劃主要涵蓋五部分:  第一,疫情發生初期,百度翻譯第一時間免費對外開放了生物醫藥垂直領域翻譯。
  • 打破語言障礙,助力全球抗疫,百度翻譯在行動
    翻譯服務為全球各國通力合作、共同抗疫,搭建溝通橋梁,成為打贏防疫戰爭的重要法寶。百度翻譯基於領先的翻譯技術,接連推出多項抗疫翻譯服務,支持中國多個抗疫志願者組織和全球抗疫人員防疫工作。此次,百度翻譯助力全球抗疫計劃主要涵蓋五部分:第一,疫情發生初期,百度翻譯第一時間免費對外開放了生物醫藥垂直領域翻譯。
  • 中文域名郵件能否打破網上語言障礙
    另外,最近也正在跟一些門戶網站和郵件提供商溝通,爭取儘快讓更多的人用上中文域名郵件。中文郵件完全符合國際標準 主持人:顯然,中文域名郵件的推出,給中國網民乃至全球華人網民提供了一個全新的選擇。但網民在使用郵件的時候,最關心的就是郵件服務的穩定性,收發郵件保證萬無一失才是最重要的,新推出的中文域名郵件怎樣滿足這個要求呢?
  • 和孩子有溝通障礙,互相不能理解?當心是語言發育遲緩
    然而,就在應該是孩子語言最密集、說話興趣最濃厚的3歲時,孩子和父母卻出現了溝通障礙,誰也不理解對方的話,並時常出現家長責罵、孩子哭鬧的不愉快景象。孩子這是怎麼了?難道真的只是想法和立場不同導致的無法互相理解?
  • 打破溝通壁壘,百度翻譯斬獲韓國K-DESIGN設計大獎
    讓我們趕緊通過下面的短片來一睹真容吧~為了傳遞「打破溝通壁壘」這一願景,在品牌創意宣傳片中,一隻破殼而出的小雞,衝破了語言的壁壘,進入了各種語言可以無障礙溝通的次元時空。這隻憨厚可愛的形象就是百度翻譯的品牌IP——翻譯雞。
  • 打破溝通壁壘 百度翻譯斬獲韓國K-DESIGN設計大獎
    讓我們趕緊通過下面的短片來一睹真容吧~為了傳遞「打破溝通壁壘」這一願景,在品牌創意宣傳片中,一隻破殼而出的小雞,衝破了語言的壁壘,進入了各種語言可以無障礙溝通的次元時空。這隻憨厚可愛的形象就是百度翻譯的品牌 IP——翻譯雞。
  • 打破溝通壁壘 百度翻譯獲韓國K-DESIGN設計大獎
    讓我們趕緊通過下面的短片來一睹真容吧~  為了傳遞「打破溝通壁壘」這一願景,在品牌創意宣傳片中,一隻破殼而出的小雞,衝破了語言的壁壘,進入了各種語言可以無障礙溝通的次元時空。這隻憨厚可愛的形象就是百度翻譯的品牌IP——翻譯雞。
  • 百度翻譯打造「翻譯雞」打破溝通壁壘 榮獲世界級設計大獎
    讓我們趕緊通過下面的短片來一睹真容吧~為了傳遞「打破溝通壁壘」這一願景,在品牌創意宣傳片中,一隻破殼而出的小雞,衝破了語言的壁壘,進入了各種語言可以無障礙溝通的次元時空。這隻憨厚可愛的形象就是百度翻譯的品牌IP——翻譯雞。
  • 在港就讀內地生:語言有障礙 打破靠自己
    在港就讀內地生:語言有障礙 打破靠自己 北青報記者隨後聯繫到幾名在香港大學及香港中文大學中文系在讀的內地學生,他們認為中文系普通話授課已是各專業最多,打破語言障礙要靠自己。  ■港大回應■  設有必修粵語增潤課程  港大發言人就港大中文系授課語言問題作出回應稱,香港大學中文學院提供的課程,範圍涉及語言文學、歷史文化和文史翻譯。
  • 跨語言溝通零障礙,如流支持近30種語言智能翻譯
    隨著全球貿易體系的加深,各國間跨語言溝通需求持續增長,而今年疫情的全球蔓延,更激發了在線交流的需求猛增。因語言不通帶來的溝通問題既影響著各國企業間的商務合作與貿易往來,也阻礙了跨境企業的全球業務拓展。如何打破這種溝通壁壘?
  • 專題筆談│孤獨症譜系障礙兒童語言和社交溝通障礙相關問題
    中國實用兒科雜誌  2019  Vol.34(8):632-637社交溝通障礙及語言障礙是孤獨症譜系障礙(ASD)兒童與其他兒童在互動上常見的障礙表現,而語言障礙常常也是評判ASD兒童嚴重程度的評判指標之一。
  • 泛自閉症(亞斯伯格)的語言溝通障礙
    泛自閉症又名亞斯伯格症候群或亞氏保加症,是屬一種發展障礙,其重要特徵是社交與非言語交際的困難,同時伴隨著興趣狹隘及重複特定行為,但相較於其他泛自閉症障礙,仍相對保有語言及認知發展。亞斯伯格症患者的智力正常,其中有許多人智商偏高具有天賦,只有極少數的人屬於高智商,經常出現肢體笨拙和語言表達方式異常等狀況,偶爾會發出怪聲音,但並不作為診斷依據。
  • 以A.I.之力打破方言溝通障礙 科大訊飛重磅發布智慧翻譯系統
    10月24日,在2020科大訊飛全球1024開發者大會上,科大訊飛重磅發布智慧翻譯系統,這意味著用戶能夠享受到更智能的翻譯服務,即使語言不通,也可以便利的進行無障礙交流。科大訊飛集團副總裁於繼棟介紹,科大訊飛智慧翻譯系統定製香港地區語音及語言模型,升級廣東話引擎,覆蓋英文混雜、特殊詞彙等表達。「隨著這一核心能力的升級應用,科大訊飛的A.I.技術會幫助用戶基本實現無障礙地看港劇、逛論壇,從而促進兩地文化進一步交流。」