必應語音API再強化 TTS支持六種新語言

2020-12-20 中關村在線

  「微軟認知服務」(Cognitive Services)整合了一系列應用程式接口(API)、軟體開發套件(SDK),以方便開發者們打造更加智能、直觀、吸引人的應用程式。此外這些機器學習 API 可以向應用程式裡添加各種智能特性,包括但不限於情感檢測,面部、語音和視覺認知,以及語音和語言理解。不過本文要向大家介紹的,卻是微軟必應搜尋引擎團隊帶來的新版 Bing Speech API 。

  Bing Speech API,支持語音-文本(語音識別)和文本-語音(語音合成)的雙向功能。前者(Speech-to-Text)可以將人類語音轉換成計算機可以識別的輸入指令,而後者(TTS)可以將文本轉成語音輸出。

  近日,微軟在一篇博客文章中宣布,Bing Speech API 已經拓展支持六種語言(目前支持的總語言數量已達 34 種):

● 保加利亞語(語言代碼為 bg-BG);

● 克羅埃西亞語(hr-HR);

● 馬來語(ms-MY);

● 斯洛維尼亞語(sl-Sl);

● 泰米爾語(ta-IN);

● 越南語(vi-VN)。

  微軟 AI Core - Speech 高級項目經理 Qingying Liao 在博客中聲稱,這 34 種語言可以在 48 種語言環境、以及 78 種口音下工作。

  這些 TTS API 可以單獨或結合其它認知服務一起使用,比如語音轉文本和語言理解 API,從而打造出一套全面的在線式(或基於設備的)語音驅動解決方案。

  最後,上述新增的 TTS 語言將於 2 月下旬在 Microsoft Translator Speech API 和微軟翻譯 app 中啟用。

本文屬於原創文章,如若轉載,請註明來源:必應語音API再強化 TTS支持六種新語言http://nb.zol.com.cn/677/6775918.html

nb.zol.com.cn true http://nb.zol.com.cn/677/6775918.html report 1401   「微軟認知服務」(Cognitive Services)整合了一系列應用程式接口(API)、軟體開發套件(SDK),以方便開發者們打造更加智能、直觀、吸引人的應用程式。此外這些機器學習 API 可以向應用程式裡添加各種智能特性,包括但不限於情感檢測,面部、語音...

相關焦點

  • 微軟翻譯新增6種語言支持文本轉發音
    IT之家3月9日消息 上月早些時候,必應發音API將其文本轉發音功能支持擴展到新的6種語言,並將在未來添加到Microsoft Translator Speech API和Microsoft Translator應用程式中。
  • AI賦能新版搜狗輸入法:語音識別支持9種語言
    AI賦能新版搜狗輸入法:語音識別支持9種語言 2020-04-26 11:53:29 據悉,新版本主要針對語音輸入和多語言輸入兩大功能進行了創新升級。  9種外語語音識別,搜狗輸入法成國內支持語種最多輸入法  首先,新版搜狗輸入法的最大亮點,就是上線了全新升級的智能語音模型,從而讓語音識別準確率獲得大幅提升。
  • 人工智慧啟用新版搜狗輸入法:語音識別支持9種語言和多種外語的...
    原標題:人工智慧啟用新版搜狗輸入法:語音識別支持9種語言、多種外語的鍵盤一鍵切換最近,搜狗輸入法已經更新到10.8版本。據悉,新版主要針對語音輸入和多語言輸入兩大功能。新功能上線後,當用戶通過語音輸入「陳杰」時,系統將為用戶提供類似的發音,如程潔、程潔、陳杰等。以便於快速更換。新推出的人工智慧語音翻譯功能支持中文和英文、日文、韓文、法文、西班牙文、俄文、德文和其他語言的實時翻譯,使用戶即使不懂外語也能與國際友人順暢交流。
  • 微軟展示最新語音翻譯機 支持中文等26種語言
    微軟上周日在微軟研究院科技節(TechFest 2012)上展示了最新開發的語音翻譯器。和其它翻譯器一樣,微軟研究院新開發的軟體允許用戶使用母語對其講話,然後使用揚聲器設備以另外一種語言輸出,比如西班牙語、法語、中文等。不過揚聲器輸出語言並不像電腦機器人替代聲音,而是近似於人類所發出聲音。
  • 語音合成(TTS:text to speech)方向一:雙重學習(Dual Learning)
    1 背景 世界存在6000多種語言,按照工業標準來製作高質量的TTS和ASR,每種語言獲取訓練語料(<speech,text>格式)的成本在10w美元以上[5],而且很多語言存在標註困難的問題,因此使用少數量的訓練語料來訓練TTS和ASR是迫切的需求。
  • 使用Python三步完成文本到語音的轉換
    P.S  本文將通過網際網路使用Google API進行文本到語音的翻譯,所以請大家保持網絡連接正常。注意:這是語言建模教程的第一部分。在本教程系列中,我們將介紹如何使用gTTS進行語音轉換,光學字符識別,深度學習模型(如序列到注意力序列模型)以及其他有趣的東西。
  • 語音合成(TTS:text to speech)方向二:魯棒TTS(Robust TTS)
    平時搜集一些資料,方便查閱學習:TTS 論文列表 http://yqli.tech/page/tts_paper.html TTS 開源數據 http://yqli.tech/page/data.html。
  • Python語音合成指北(一)
    論文連結Deep Voice 2: 多說話人神經文本語音轉換,它與DeepVoice 1類似,但它在音頻質量上卻有顯著的提高。該模型能夠從每個說話人不到半個小時的語音數據中學習數百種獨特的聲音。>缺點:合成語音效果一般2.科大訊飛科大訊飛提供豐富的發音類別來合成有特殊的語音,通過api接口進行語音合成,並且可以對多音字、靜音停頓、數字、英文讀法等提供了控制標記。
  • AI賦能新版搜狗輸入法:語音識別支持9種語言 多種外語鍵盤一鍵切換
    據悉,新版本主要針對語音輸入和多語言輸入兩大功能進行了創新升級。9種外語語音識別,搜狗輸入法成國內支持語種最多輸入法首先,新版搜狗輸入法的最大亮點,就是上線了全新升級的智能語音模型,從而讓語音識別準確率獲得大幅提升。
  • AI賦能新版搜狗輸入法:語音識別支持9種語言,多種外語鍵盤一鍵切換
    據悉,新版本主要針對語音輸入和多語言輸入兩大功能進行了創新升級。           9種外語語音識別,搜狗輸入法成國內支持語種最多輸入法          首先,新版搜狗輸入法的最大亮點,就是上線了全新升級的智能語音模型,從而讓語音識別準確率獲得大幅提升。
  • 語音技術和what3words首次推出新的語音導航API
    語音技術開發商Speechmatics和導航軟體平臺what3words本周在CES上首次展示了結合其技術的新API。該API使用Speechmatics的語音識別功能將一個口頭的三個單詞的短語通過what3words轉換為GPS坐標和地址。
  • 谷歌、微軟、蘋果、亞馬遜、三星…… 哪家的語音助手支持語言種類...
    (IT之家註:此處應為去年秋天)為什麼識別新語言的進度如此緩慢?究其原因,主要還是訓練語音識別算法的技術進度緩慢,事實上,AI語音助手比我們表面看起來的要複雜得多。為什麼支持一門新語言如此艱難?給語音助手添加語言支持是一個多管齊下的過程,這需要在語音識別和語音合成方面進行大量的研發。就語音識別而言,首先要將語音轉換成文本,接下來再進行自然語言處理。
  • 谷歌、微軟、蘋果、亞馬遜、三星……哪家的語音助手支持語言種類...
    為什麼識別新語言的進度如此緩慢?究其原因,主要還是訓練語音識別算法的技術進度緩慢,事實上,AI語音助手比我們表面看起來的要複雜得多。為什麼支持一門新語言如此艱難?給語音助手添加語言支持是一個多管齊下的過程,這需要在語音識別和語音合成方面進行大量的研發。
  • 微軟發布語音輸入插件,支持超過20種語言,還能實時翻譯
    雷鋒網消息 微軟發布了一款針對Word、Outlook和Powerpoint辦公軟體的插件,可通過Cortana的語音識別技術來實現語音輸入。微軟並非第一個推出類似產品的企業。Nuance發布Dragon已經有一段時間了,這款軟體同時支持臺式機和行動裝置。此外,去年Google也拓展了Docs的語音輸入功能。Office軟體早就支持將語音轉換成文字輸入,不過Dictate的功能更加完善。它支持超過20種輸入語言以及多種語音編輯指令,比如「換行」「刪除」「停止聽寫」等,你可以移動光標並通過語音對文本進行修改。此外,你還可以通過語音控制標點輸入。
  • 微軟翻譯現已支持印度24種官方語言之一的奧裡亞語
    人類歷史上出現過許多種口頭與書面語言,時至今日,還有不少語言在被積極使用。此外隨著翻譯器技術的不斷發展和完善,使用不同語言的雙方也能夠更高效地溝通。 比如微軟翻譯(Microsoft Translator)剛剛宣布,其現已支持印度官方認定的 6 種古典語之一的奧裡亞語(Odia)方言。
  • 必應詞典3.0 「雲時代」外語學習利器
    必應詞典最新版本與權威英漢雙解詞典合作,加強了詞條的準確性。為了便於用戶查詞,必應詞典3.0可以支持發音查詢和拼寫模糊搜索查詢,當用戶輸入單詞首字母時,下拉框內會出現以該字母開頭的多個詞彙供用戶選擇。除了基本釋義外,必應詞典發揮微軟強大的技術優勢,在網絡釋義方面做足了工作。網絡釋義功能通過網際網路信息經過技術分析獲得單詞、短語甚至句子的中英對照釋義。
  • 日本機器人公司開發智能口罩,可將語音轉譯日語中文等8種語言
    據美國有線電視新聞網8月4日報導,日本一機器人公司開發出一款智能口罩,可以將日語、中文等8種語言的音頻相互轉譯。今年的新冠疫情使得很多產業都蒙受了不小的損失,然而日本一家機器人公司卻從口罩中發現了新商機。
  • WP8.1 版《必應翻譯》更新,音譯更完善
    IT之家訊 WP8/WP8.1版《必應翻譯》今日獲得一個較為重大的更新,全新的v3.2版必應翻譯為更多語言提供了語音翻譯支持,同時對不同口音的英語法語進行了優化,提高了用戶的翻譯體驗。
  • 「必應詞典」是怎麼煉成的
    他向記者講述了「必應詞典」的研發過程。  1 成果 網絡詞典會「說話」  當你進入「必應」的網址後,你會發現在輸入欄上方的選擇欄的右邊有一項是「詞典」。點開之後,在輸入欄中輸入一個英文單詞,不僅可以看到下面的英文解釋,更下面還有相應的英中對照的例句。洪小文說,這些例句都是電腦自動找出來,機器翻譯的,有的加入了一定的人工修改。