馳聲AI語音開放平臺上線,首次公開中英文智能語音評測開發文檔

2021-01-08 太平洋親子網

馳聲AI語音開放平臺上線，首次公開中英文智能語音評測開發文檔

2020-12-11 14:36:41出處：其他作者：佚名

　　日前，馳聲AI語音開放平臺正式上線，產品經理和開發者只需點擊馳聲官網頂部右側「馳聲AI開放平臺」的白色按鈕，即可查看《馳聲智能語音評測開發文檔》，該文檔中包含SDK/API和內核接口使用說明。

　　「智能技術消滅啞巴英語，讓教和學更高效」是馳聲的使命，為了讓更多的智能語言學習產品更便捷地接入馳聲技術，為此，馳聲首次公開所有自主研發的中英文語音評測內核開發文檔，助力教育品牌實現業務升級。

　　▲馳聲官網新增「馳聲AI開放平臺」入口

　　可查看語音評測開發文檔

　　在馳聲AI語音開放平臺上，您將能獲取到以下知識和信息——

　　1. SDK接入文檔

　　馳聲中英文語音評測技術支持Linux、Windows、Mac、JS、Android、iOS、微信公眾號、微信小程序、Unity等平臺接入，也支持部分平臺離線方案調用。

　　2. API接入文檔

　　馳聲中英文語音評測技術支持WebSocket、Http協議接入。

　　3. 馳聲英文口語評測內核文檔

　　4. 馳聲中文口語評測內核文檔

　　2007年，馳聲團隊創立於英國劍橋大學，始終專注於教育領域，用自主研發的語音評測技術一路引領行業，為全球182個國家和地區的智能語言學習產品和1.3億語言學習者提供評分糾音服務。從2012年起，馳聲受各地教育局和考試院之邀，先後參與北京、上海、廣東、廣西、湖北、寧夏、遼寧等多個省份的中高考英語聽說考試方案設計、技術驗證和組織實施，打造的考試級評分引擎倍受官方認可。

　　至今，馳聲已服務中國至少60%的智能語言學習產品，馳聲教育語音雲平臺上年平均錄音人次能達到80億次，每年至少累積700萬小時語音數據，這些海量數據也助力馳聲評測引擎不斷迭代升級。

　　2020年，馳聲全面升級了中文口語評測技術，包括中文單詞評測、中文詞句評測、中文段落評測、中文有限分支、中文AI Talk等五大內核，均支持傳漢字和傳拼音兩種形式，為幼兒啟蒙識字賽道和K12大語文賽道賦能，為客戶創造更便捷的技術使用體驗。

　　同樣在2020年，馳聲智能語音實驗室在英文語音識別和語音評測兩大領域均有重大研發突破——

　　l 創新性推出馳聲英文句子診斷糾音內核，可識別並標註出學習者在句子練習中多讀、漏讀、錯讀、重複朗讀的單詞。同時，該內核可提供總分、準確度得分、流利度得分、完整度得分、各單詞發音得分等維度的評分，並支持實時返回已讀內容，為產品經理進行互動設計提供了更多可能性。

　　l 推出業界首個英語口語半開放題型多維度評估內核，支持對語法、內容、流利度、發音進行獨立評分，並擬合得出最後總分。這是目前業界反饋維度最全的半開放題型內核，不僅評分粒度更精細，更填補了語音評測領域在英語口語語法、內容等模塊的算法空白，在業界具有裡程碑式的意義。

　　l 推出更適合教育領域的英文自由識別評測內核，採用日常對話、聽說考試、口語練習等海量全年齡段教育語音數據訓模而成，識別效率更高、精度更準，可將學習者的口語練習從語音識別轉換為文字，並將識別結果實時反饋在屏幕上，同時標記每個單詞的發音得分、流利度得分、停頓次數、語速、總分等。

　　從用戶使用層面，學習者可以自由開口練習，更符合口語實際運用的情況。馳聲英文自由識別評測內核可以更自如地滿足各類口語練習場景的需求，比如，學習者可以朗讀或背誦自己喜愛的英語文章或段落、試講參加英語演講比賽的稿子、練習英文面試時自我介紹的內容、嘗試模擬回答面試官問題……該內核可反饋識別和評測學習者的口述內容，提高練習效率。

　　從產品應用層面，馳聲英文自由識別評測內核解除了語音評測技術對於文本的束縛，不限定評測內容，即評測前無需再預先錄入單詞、句子、段落文本，給予功能和場景設計上更多的可能性。

　　以上中英文語音評測內核，均可以在馳聲官網首頁右上方的「馳聲AI開放平臺」上找到相關SDK/API和內核接口使用說明，歡迎產品經理和開發者們前往查看、諮詢。

相關焦點

馳聲教育考試研究院:用語音評測技術和大數據語料,為K12英語口語...

馳聲是踏浪而行的那個——2007年團隊在英國劍橋創立，自主研發的中英文口語評測技術評分準、效率高、維度全、創新多，很快成為「中國語言教育產品的智能語音工具包」；2012年起馳聲開始服務國內中高考英語聽說考試，憑藉著成熟的技術和服務，成為各地教育局、考試院值得信賴的正式考試解決方案技術供應商。
騰訊推微信智能開放平臺開放圖像識別語音控制

4月8日，微信宣布推出微信智能開放平臺（http://pr.weixin.qq.com/），該平臺包括圖像開放平臺和此前上線的語音開放平臺。　　目前開發者已可登錄微信智能開放平臺官網，下載SDK包進行試用，或者也可以將相應智能技術服務接入到自己App。
微軟上線語音評測功能:基於Azure雲構建,賦能口語學習的教與學

在聽覺方面，智能語音技術成為各大科技公司們攻堅的重要領域。一家老牌科技巨頭微軟，在語音合成技術、語音識別技術上深耕多年，面向全球合作夥伴開放和落地其技術能力，提供多種智能語音解決方案。5月中旬，在2020微軟Build開發者大會上，微軟上線了語音評測功能，該功能基於Azure語音服務Speech-to-text（語音轉文本）構建。
百度大腦產品上新&技術升級:圖像處理、智能寫作平臺、語音識別

您可以從 PC 端訪問百度 AI 開放平臺（ai.baidu.com）申請邀測，或使用最新產品。新開放 AI 技術能力語音識別語音識別極速版支持60秒內音頻使用 REST API 方式進行調用，簡單易用。採用國際領先的注意力（Attention）模型，實時率小於0.1，5 s 音頻不到500 ms 即可完成識別過程，極大提升語音交互的體驗。
矽基資訊 || 矽基智能語音硬核產品上線,智能交互平臺進入「樂高＂模式

三大智能語音核心技術作為獨立的AI服務，面向廣大用戶開放，旗下的智能交互平臺將進入「樂高」模式。矽基智能表示從現在開始，用戶可基於自身需求，更靈活、便捷的選擇相應的AI服務組合方式，以更低的成本搭建適合企業特性和需求的智能語音專屬定製平臺。
百度大腦AI加持語言教育,智能語音糾正口語發音、指導朗讀背誦

因此，對於銀月網絡來說，能發揮其「沉浸式遊戲」的手段讓用戶在一個真實場景中練習口語，成為開發此款軟體的目的。而為實現在英語互動中，更準確的識別用戶所講，銀月網絡接入了百度大腦語音識別和語音合成技術，讓識別準確率提升至97%，大大提高了人與設備對話的體驗，這也讓用戶在英語口語練習上更科學，更準確，更專業。
幾次嘗試聊天機器人後,Facebook 也要開發智能語音助理

智能語音助理項目從 2018 年初就開始進行了。 CNBC 還援引知情人士消息稱，研發團隊一直在聯繫智能音箱供應鏈中的供應商。晚些時候，Facebook 向科技媒體 The Verge 確認了在研發智能語音助理的消息，說會用在公司開發的 AR、VR 產品上，如 Oculus 、Portal 視頻聊天硬體設備等。
微軟語音 AI 技術與微軟聽聽文檔小程序實踐|AI ProCon 2019

以下為演講內容：趙晟：小程序是現在移動開發的新生態、新趨勢。語音AI技術跟移動開發是非常有關係的。大家平時開車時不方便用手輸入，可以用語音輸入，開車時想聽一些東西，完全可以用文字轉語音的技術去聽這些內容。
百度大腦遠場語音開發套件評測—快速上手,超讚語音交互體驗

這次，有幸收到百度遠場語音開發套件的測評邀請，作為一個非測試專業人員，這裡我就自己的百度遠場語音開發套件使用過程及在使用過程中遇到的問題和大家分享一下，如有錯誤，請多多指教。：百度大腦遠場語音開發套件，基於 RK3308 開發平臺打造，提供的麥克風選型適用於智能音箱、智能家電、車載設備場景，整個開發套件包含麥克風陣列板、開發板
智能語音前沿技術——發音檢錯糾錯和語音轉換

(4) 技術：目前我國已在計算機視覺，智能語音等領域實現了技術突破，處於國際領先水平。國內具有代表性的公司或機構包括：百度，阿里巴巴，騰訊，科大訊飛，曠視科技，商湯科技等。在人工智慧技術中，智能語音技術是一個重要的分支，是人機互動過程中不可或缺的部分。
當外語學習用上智能語音

英國語音學家吉姆森也提出，學會講任何一門語言，必須要掌握其100%的語音知識，而僅需50%-90%的語法和1%的詞彙就足夠了。由此可見口語和語音在聽、說、讀、寫四項語言基本能力中的重要地位。人工智慧技術極大地影響和改變了人們的生活、學習和工作。其中智能語音技術作為人工智慧技術的重要組成部分，被更多地用於教育領域的語言教學和語言測試中。
高德平臺語音導覽隨心聽,景區導遊要下崗了?

12月10日，高德地圖發布了「景區隨身聽導覽官招募計劃」，以高德地圖的流量和獎金為「誘餌」，吸引有志者入駐平臺，發布自己的語音講解。今年國慶，高德地圖上線了「景區隨身聽」，找了一些文化學者、明星，以及專業做景區語音導覽的第三方公司，為全國的熱門景區上線語音講解，覆蓋景區數量目前超過1000個。
中國"果粉"能否用上最好的中文語音助理

但此次訊飛語點申請Appstore上線遭遇阻力，不得不使廣大開發者心存疑慮：蘋果的開放性到底遵循什麼原則，是從用戶角度出發，還是僅從自身利益出發?一旦第三方開發的應用與蘋果自身開發的應用存在一定的競爭衝突，甚至比蘋果做的更好，那是否蘋果就將犧牲用戶的利益而進行拖延、拒絕?這使蘋果的開放蒙上了一層「狹隘的有限性」的陰影。
百度大腦首場開放日:AI已經滲透到了產業的毛細血管

分形科技藉助百度EasyDL的圖像分類技術，打造了首款智能垃圾桶，可以對7種常見垃圾自動分類；德邦物流為了讓用戶免去自行填寫信息的麻煩，使用百度大腦的定製詞法分析快遞申請，一秒拆分姓名、電話、住址等信息；看到審批窗口總是排滿長隊，科鴻智信利用OCR 、iOCR及EasyDL平臺開發了智能化審批管理系統，建立起「一次都不跑
中文語音合成最高水平,百度語音技術打造全球首款地圖語音定製產品

人工智慧技術的落地應用正在向各行業襲來。9月19日，百度地圖「『音』為有你，更有『AI』」語音定製功能發布會召開，重磅推出全球首個地圖語音定製產品。該功能科技範兒十足，用戶只需在百度地圖App上錄製20句話，最快20分鐘，即可生成個人完整語音包。
訊飛PC輸入法評測:語音+跨屏輸入打工人必備生產力神器

訊飛PC輸入法在智能拼音功能體驗上，已經不需要用詳細內容去介紹，一句話總結——非常好用，它會智能記錄每個人的打字習慣，讓你越用越順手。語音輸入超便捷所說即所見獨具創新的語音輸入體驗的才是重點，訊飛PC輸入法並不是單純的支持語音輸入這麼簡單。
國內智能語音行業分析報告

科技巨頭紛紛從不同維度布局相關產業鏈（1）國外科技巨頭：通過併購等手段，夯實核心技術，開放應用平臺，擴展以AI為核心的生態系統識別過程通常又可以分為「前端」和「後端」兩大模塊：「前端」模塊主要的作用是進行端點檢測（去除多餘的靜音和非說話聲）、降噪、特徵提取等;「後端」模塊的作用是利用訓練好的「聲學模型」和「語言模型」對用戶說話的特徵向量進行統計模式識別（又稱「解碼」），得到其包含的文字信息，此外，後端模塊還存在一個「自適應」的反饋模塊，可以對用戶的語音進行自學習，從而對「聲學模型」和「語音模型」進行必要的
阿里AI labs發布兩大天貓精靈新品,將與平頭哥共同定製智能語音晶片

目前，天貓精靈已經接入了超過 660 多家 IoT 平臺，覆蓋超過 60 個品類，900 多個品牌，支持 3600 多型號，2 億可連接設備，成為最大的 IoT 生態開放平臺。如今，天貓精靈又有新動作。
排名語音識別_語音識別技術排名 - CSDN

經過半個世紀的發展，語音識別技術在2011年之後迎來了黃金髮展時期：前微軟研究院俞棟和鄧力研究員首次將DNN在大詞彙量語音識別上成功應用，基於神經網絡的語音識別技術迅速成為了研究和產業上的投入密集地，在工業界Google和國內的訊飛成為了最早上線基於DNN的語音識別系統的兩家公司。經過接近10年的發展，語音識別技術取得了空前的進步，在多個場景下已經達到了實用水平。
依圖科技入局語音識別,欲藉助高精確度算法促進行業透明化

近年來，圍繞著智能語音的競爭日趨激烈。智能家電、智慧交通、可穿戴設備等應用領域百花齊放，其背後的支柱是作為基礎的語音識別API。在依圖入局之前，國內語音識別API中不僅有著科大訊飛、雲知聲等專攻語音的科技公司，以BAT為代表的網際網路巨頭也先後進軍市場，推出了各自的API及硬體產品。

馳聲AI語音開放平臺上線,首次公開中英文智能語音評測開發文檔

相關焦點

馳聲教育考試研究院:用語音評測技術和大數據語料,為K12英語口語...

騰訊推微信智能開放平臺 開放圖像識別語音控制

微軟上線語音評測功能:基於Azure雲構建,賦能口語學習的教與學

百度大腦產品上新&技術升級:圖像處理、智能寫作平臺、語音識別

矽基資訊 || 矽基智能語音硬核產品上線,智能交互平臺進入「樂高＂模式

百度大腦AI加持語言教育,智能語音糾正口語發音、指導朗讀背誦

幾次嘗試聊天機器人後,Facebook 也要開發智能語音助理

微軟語音 AI 技術與微軟聽聽文檔小程序實踐|AI ProCon 2019

百度大腦遠場語音開發套件評測—快速上手,超讚語音交互體驗

智能語音前沿技術——發音檢錯糾錯和語音轉換

當外語學習用上智能語音

高德平臺語音導覽隨心聽,景區導遊要下崗了?

中國"果粉"能否用上最好的中文語音助理

百度大腦首場開放日:AI已經滲透到了產業的毛細血管

中文語音合成最高水平,百度語音技術打造全球首款地圖語音定製產品

訊飛PC輸入法評測:語音+跨屏輸入 打工人必備生產力神器

國內智能語音行業分析報告

阿里AI labs發布兩大天貓精靈新品,將與平頭哥共同定製智能語音晶片

排名 語音識別_語音識別技術排名 - CSDN

依圖科技入局語音識別,欲藉助高精確度算法促進行業透明化

騰訊推微信智能開放平臺開放圖像識別語音控制

訊飛PC輸入法評測:語音+跨屏輸入打工人必備生產力神器

排名語音識別_語音識別技術排名 - CSDN