微軟上線語音評測功能:基於Azure雲構建,賦能口語學習的教與學

2021-01-14 雷鋒網

近年來,隨著人工智慧技術的不斷成熟,企業數位化轉型步伐的加快,AI的觸角逐漸深入到各個場景,使人類的生產生活變得更加智慧化。在聽覺方面,智能語音技術成為各大科技公司們攻堅的重要領域。

一家老牌科技巨頭微軟,在語音合成技術、語音識別技術上深耕多年,面向全球合作夥伴開放和落地其技術能力,提供多種智能語音解決方案。

5月中旬,在2020微軟Build開發者大會上,微軟上線了語音評測功能,該功能基於Azure語音服務Speech-to-text(語音轉文本)構建。用戶可以上傳跟讀文本和音頻對發音人的語音從準確度,流利度和完整度進行評測。在教育領域,尤其是口語學習方面,因具有高識別準確率、擬專家打分的高一致性,可以讓口語學習的教和學更加高效方便。

近日,微軟亞太研發集團智能語音團隊接受了雷鋒網(公眾號:雷鋒網)等媒體的線上採訪,對微軟智能語音評測技術的優勢和應用場景等內容進行了詳細介紹。

微軟亞太研發集團雲計算與人工智慧事業部產品總監丁秉公、微軟亞太研發集團雲計算與人工智慧事業部資深產品經理馬莉莎參與了本次採訪。

語音評測的四個維度

微軟亞太研發集團雲計算與人工智慧事業部資深產品經理馬莉莎表示,目前語音評測市場需求的考量方向主要有四個維度:

專業性。

實時性。

穩定性。

可定製性。

對於專業性,微軟語音評測的每個語言從10萬小時以上的母語大數據中學習當地語言純正口音發音,針對各年齡段多維度精準打分,從文章——句子——詞——音素四個環節,層層評估,擬專家團打分一致性高。

馬莉莎提到,語音評測的專業性考量對比的是和母語專家評測的一致性。業內通用皮爾森相關係數來反映兩個序列線性相關程度的統計量。範圍在-1到1之間,1表示完全相關,-1表示完全相反,0表示亂序無關,數值越大表示相關度越高。微軟語音評測在一致性上達到了0.75,與母語專家水平接近。

對於實時性,微軟語音評測支持音頻上傳流式處理,也就是邊朗讀邊處理,讀完立即反饋評估結果。

對於穩定性,微軟語音評測基於NLP模型構建模糊匹配文本,針對垂直領域的特定場景的容錯率有良好的包容性,漏讀、錯讀、重複讀不影響打分有效性與準確性。

對於可定製性,ASR基礎模型與微軟在語音領域的全面技術能力,可以實現個性化評分標準,可適配口音、適配噪音環境以及適配年齡層等。

據了解,微軟語音評測除了支持英語評測外,還可擴展支持全球 40 多個國家和地區的語言評測,廣泛適用於教育領域解決方案的合作夥伴、APP開發者以及語言學校、培訓中心、教育機構、考試中心的各種語言學習、口語練習和考試等場景的開發。

最大的技術難點在於多點平衡

語音評測能力,在教育領域主要的受眾人群包括老師、學生,通常被廣泛應用於教師評估、作業練習和語言學習場景中。那麼,對於口語學習,教育用戶的痛點是什麼?語音評測最大的技術難點又是什麼?

對此,馬莉莎表示,對於學生來說,他們的痛點在於非母語口語學習。學生們在學習新語言的過程中,如何及時準確地給學生的發音進行反饋,讓學生隨時隨地更方便地聯繫對於提升口語學習的有效性至關重要。

對於學校和教育機構來說,他們的痛點在於老師的資源有限,如何把現有的優質教師資源拓展到一個穩定的教學系統裡。因此,老師需要這樣一個能力,不僅能模擬母語專家打分,還能夠學習到老師們的評測方法,讓老師們可以使用評測高效地一對多給學生提供在線和線下的指導和幫助。

教育用戶的這些痛點,對語音評測技術提出了更高的要求。馬莉莎認為,語音評測最大的技術難點在於語音識別技術本身,首先是多語言的理解和識別,不同的打分場景,包括噪聲環境、不同年齡段學生的發音情況等都要進一步優化。

其次就是要達到包容性和魯棒性(註:robust,技術術語,此處可理解為穩健性或抗變性)的平衡。既要模型做得好、識別好,還要能夠動態、實時構建,對大模型達到高實時地調用,而這些需求加起來就是難上加難了。

「在語音評測上我們的基礎儲備非常堅實,才能把方方面面做到比較好,以一個綜合的體現呈現給用戶,所以我們不是難在一個點上,而是多點平衡。」

據悉,積極探索數位化轉型和新教育模式的好未來,也是微軟語音評測功能的客戶之一。好未來AI科學家胡翔宇表示:

"如何快速而有效地針對不同學生進行口語評測是我們在線上線下的英語教學中遇到的一大挑戰。微軟智能語音服務為好未來內部以及我們的合作夥伴提供強大的實時語音評測能力。根據我們的測試,微軟語音服務的發音測評功能更好地適配了我們的收音環境,並且具備更高的一致性,更加貼近專家的評估結果。" 

基於Azure雲構建的一種能力:算法、數據、算力

微軟亞太研發集團雲計算與人工智慧事業部產品總監丁秉公介紹,一般來說,我們看AI技術主要看三個方面:算法、數據、算力。從這三個方面來說,微軟的語音評測功能有自己獨特的優勢。

在算法層面,微軟在智能語音領域深耕多年,其語音識別已經達到人類的水平,錯誤率在5.1%左右,正是有了這個算法基礎,所以在語音識別延伸的應用——語音評測方面能夠比較有信心。

在數據層面,依靠微軟在語音方面的多年積累,通過將近10萬多小時母語的數據進行訓練,最後學習到當地比較純正的口音。

在算力層面,語音評測所有的技術都是基於微軟Azure雲構建的,Azure是全球擁有數據中心最多、覆蓋區域最多的雲,可支撐用戶大規模的計算需求。同時,Azure符合歐盟GDPR(《通用數據保護條例》)標準,保護用戶的數據安全性。

實際上,微軟語音評測不是一個具體的產品,而是基於Azure雲構建的一種能力。即以微軟Azure為平臺,將微軟在人工智慧領域30年的研究成果,開放API給合作夥伴、獨立軟體開發商、系統集成商,為他們提供認知服務之上的能力,從而進一步做出適合各自領域的方案。

「可以打一個比方,如果微軟雲是平臺的話,認知服務就是這個平臺上提供給用戶智能的部分。就好像一個人有眼睛、耳朵、頭腦,認知服務就是賦予想要在微軟Azure雲上獲取這些能力的用戶,給他們提供擴展能力」,丁秉公說道。

「所謂授之以魚不如授之以漁,我們提供這樣的能力或者工具之後,便於合作夥伴基於垂直領域裡豐富的場景定製或開發相應的解決方案以及產品,他們可以直接調取這樣的能力,而不需要從頭做任何人工智慧方面的研究。」

據了解,目前,微軟語音評測的API有豐富的接口和參數,支持高實時率多並發調用。如果第三方想調用API,在前期評測環節是免費的,而進入集成開發階段,會根據標準的Speech-To-Text(語音轉文本)服務的價格,按照評測音頻的時長來計費。

另外,丁秉公還提到,微軟Azure內部有獨立的Microsoft Education團隊,專門針對教育領域提供不同的解決方案。除了語音評測外,Azure雲在教育領域還有很多已落地的應用。

例如,疫情期間的「停課不停學」,讓微軟遠程協作平臺Microsoft Teams被學生用來作為遠程學習的工具,在教育領域被廣泛使用。

其次,在個性化教育方面,語音評測作為Azure上的服務,提供了個性化的打分能力,使在平臺上使用這個功能的用戶享受到屬於他自己的獨特服務。

第三,Azure的語音技術可以幫助合成AI老師,幫助教育機構生成課件,解決教育資源稀缺的問題。

除此之外,語音技術還可以幫助一些視障和聽障學生更好地學習。

馬莉莎認為,當前全球的教育行業都在進行數位化轉型,疫情的到來加速了教育行業的數位化和線上化。通過讓AI和雲計算進一步賦能教育行業,可以為學生提供多元化個性化的服務,打造一個更加智能的生態環境。

微軟在智能語音技術方面深耕多年,曾推出過多款耳熟能詳的語音產品,如微軟小娜(Cortana)、微軟小冰、Skype等,此次上線語音評測功能也是「順水推舟」之舉。語音評測市場,BAT和科大訊飛等科技巨頭爭相布局,微軟這匹「黑馬」的加入,勢必會讓語音評測戰場的廝殺更為激烈。(雷鋒網雷鋒網)

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 馳聲AI語音開放平臺上線,首次公開中英文智能語音評測開發文檔
    馳聲AI語音開放平臺上線,首次公開中英文智能語音評測開發文檔2020-12-11 14:36:41出處:其他作者:佚名  日前,馳聲AI語音開放平臺正式上線,產品經理和開發者只需點擊馳聲官網頂部右側「馳聲AI開放平臺」的白色按鈕,即可查看《馳聲智能語音評測開發文檔》,該文檔中包含
  • 一起教育科技基於英特爾 技術優化 AI 口語測評平臺 賦能英語教學
    一起教育科技近年來持續強化「AI+教育」的融合,並在旗下的免費學習工具「一起作業」中推出了應用 AI 技術、可以對學生英語口語水平進行準確測評的一起作業 AI 口語測評平臺,致力於為老師們提供更加精準的分數評判體系,為學生們提供更加有效的學情反饋。
  • 當外語學習用上智能語音
    而依託智能語音技術的「網際網路+」計算機輔助教學系統涵蓋大量優質教學資源,不僅便於教師在課上開展豐富多樣的口語教學活動,積極調節課堂氛圍,也能滿足學生在課下進行自主性口語學習和語音訓練的需求。此外,計算機輔助教學系統可以通過機器的深度學習,模擬教師的評測標準和方法,實現對每名學生高效、實時的口語評價和問題診斷。
  • 馳聲教育考試研究院:用語音評測技術和大數據語料,為K12英語口語...
    馳聲智能語音評測技術起源於英國劍橋,即便是微小發音錯誤,也能糾出,並提供實時評分及反饋指導。從2012年起,馳聲已通過多地教育局及考試院技術驗證,系業內少數可支持口頭作文、看圖說話、故事複述等口語考試開放題型的語音公司,首創開放題型多維度評估技術。能夠快速參照各地考試評分標準訓練專屬聲學模型。
  • 微軟小英:讓人工智慧幫你學英語—新聞—科學網
    為了幫助更多人將英語學習融入日常,近日,微軟亞洲研究院和微軟網際網路工程院合力根據中國用戶的語言學習特點,推出了一款名為「微軟小英」的英語口語練習應用,幫助用戶徹底擺脫「Are you OK?」的尷尬場景。 「微軟小英」是一款融合了語音識別、口語評測,自然語言處理、語音合成等人工智慧技術而實現的智能人機互動服務,現已通過微信服務號的形式上線。
  • 微軟語音 AI 技術與微軟聽聽文檔小程序實踐|AI ProCon 2019
    語音AI技術跟移動開發是非常有關係的。大家平時開車時不方便用手輸入,可以用語音輸入,開車時想聽一些東西,完全可以用文字轉語音的技術去聽這些內容。基於這些考慮,微軟語音AI和微軟聽聽小程序合作做了些嘗試,今天給大家分享這裡面的故事。
  • 騰訊英語君INTERSPEECH 2020展鋒芒,5篇英語口語評測成果論文入選
    該模型可以同時對如音素、單詞、句子多個細粒度進行評測;並以半監督學習對音素進行判錯,減少對音素人工標籤的依賴;並採用注意力機制,得到與人工打分相關度更高的單詞得分;另外還能夠多任務學習,共享發音特徵,優化句子評分與音素判錯。
  • 百度大腦AI加持語言教育,智能語音糾正口語發音、指導朗讀背誦
    隨著現代社會的發展,人們對英語學習的需求日益增長。而對於國內情況來說,能夠開口交流是英語學習中最重要的部分之一。因此,對於銀月網絡來說,能發揮其「沉浸式遊戲」的手段讓用戶在一個真實場景中練習口語,成為開發此款軟體的目的。
  • 免費學習英語口語怎麼學?英語達人分享幾點學習法則
    如何快速有效的學好英語口語一直是困擾大家的一個問題。英語口語的表達其實分為兩個部分,一是語音語調的表達,一是口語表達。語音語調的訓練包括兩個方面,一個是正確的發音方法,另一個是語感的培養,這都需要經過大量的跟讀模仿。有了好的語音和語感,就能提高語言的流利度。
  • 資源| 微軟官方整理:用於Azure機器學習的免費數據集
    原標題:資源 | 微軟官方整理:用於Azure機器學習的免費數據集 選自Microsoft 作者:Lee Scott 機器之心編譯> 參與:李亞洲、吳攀、杜夏德 要學習怎麼使用微軟
  • AI Frontiers | 微軟首席 AI 科學家鄧力演講:口語對話系統的分類...
    年加入微軟,2016 年起擔任微軟首席人工智慧科學家,負責微軟深度學習技術中心應用趨向的深度學習研究。取決不同的用戶,語音輸入可能會比文字輸入更簡單——但也可能更複雜。對我個人而言,由於對語音比較了解,我傾向於使用語音來表述複雜事實,它的錯誤率未必會那麼高。語音使得我能更快地提供更多信息。但對於大多數人而言,當使用基於文字的對話,他們傾向於使用複雜句式。原因要麼是這樣做更快,要麼更可能的是,他們會擔心對方的語音識別能力,然後不想重複、或者說太多,尤其在噪聲大的環境下。
  • .| 微軟首席 AI 科學家鄧力演講:口語對話系統的分類及三代演變
    年加入微軟,2016 年起擔任微軟首席人工智慧科學家,負責微軟深度學習技術中心應用趨向的深度學習研究。取決不同的用戶,語音輸入可能會比文字輸入更簡單——但也可能更複雜。對我個人而言,由於對語音比較了解,我傾向於使用語音來表述複雜事實,它的錯誤率未必會那麼高。語音使得我能更快地提供更多信息。但對於大多數人而言,當使用基於文字的對話,他們傾向於使用複雜句式。原因要麼是這樣做更快,要麼更可能的是,他們會擔心對方的語音識別能力,然後不想重複、或者說太多,尤其在噪聲大的環境下。
  • 智能語音前沿技術——發音檢錯糾錯和語音轉換
    2016年科大訊飛、華為等行業知名企業,在深圳共同發布中國《人工智慧深圳宣言》,積極探索政、產、學、研、用合作機制,推動人工智慧產業的協同發展。2017年十二屆全國人大會議中,國務院總理李克強提出,要推動內地與港澳深化合作,研究制定「粵港澳大灣區」城市群發展規劃,提升在國家經濟發展和對外開放中的地位與功能。
  • 國內第一款能學口語的視頻電話手錶糖貓JOY2搶先預售
    4月29日,國內第一款能學口語的視頻電話手錶搜狗兒童手錶糖貓JOY2 4G版搶先預售。除了高清視頻通話、精準定位等基礎功能之外,這款電話手錶的最大亮點在於可以隨時隨地學習英語口語。
  • 檯燈也能輔導學習?阿爾法蛋智能學習檯燈是這麼做
    檯燈也能輔導學習?不少家長認為,選擇一個好的檯燈,對孩子的學習和眼睛健康有極大的幫助。市面上的檯燈產品琳琅滿目,都宣稱「保護視力」,功能大同小異價格卻參差不齊。  還在猶豫不決的家長不妨關注一下,阿爾法蛋智能學習檯燈L9——一盞集「護眼、智能、學習」於一體的檯燈, 3月1日火爆上線,買到就是賺到。
  • 訊飛掃描詞典筆評測 一筆橫掃英語學習中的生詞煩惱
    現在的英語課程從小學甚至幼兒園就已經開始,有的父母更是從孩子剛學會說話就開始教英語,但是我們有沒有想過,如果孩子在學習過程中對英語提不起興趣或者產生厭煩心理怎麼辦?有什麼方法能持保持發孩子的學習興趣?或許你能夠從今天這篇文章中找到一些方法。
  • 訊飛英語通評測:5英寸黃金機身 超便攜專業AI英語輔導助教
    智能AI功能實現全英文專業輔導 助力學生英文學習天天向上如果學生碰到自己日常不會的單詞,直接對訊飛英語通說出中文或英文,機器運用科大訊飛人工智慧語音識別技術,能一鍵語音查詞,還可以拼讀查詞。值得一提的是,訊飛英語通不但就單項糾正學生發音,還可基於場景的AI對話技術營造真實語言對話交流環境。配合先進的人工智慧語音合成技術,讓發音純正的英語口語練習「外教」隨時陪伴學生身邊。每次英文考試,寫一篇好作文也是取得高分的關鍵,英語作文也是綜合考驗學生的語法能力,訊飛英語通內置智能寫作評測引擎,模擬真人老師批改維度。
  • 賦能上海|探營AI大會微軟展區:小冰講故事,小英教英文
    賦能上海|探營AI大會微軟展區:小冰講故事,小英教英文 澎湃新聞記者 承天蒙 2018-09-18 08:51 來源:
  • 微軟打算取消Win10 Cortana語音引導功能 用戶也可手動關閉
    微軟打算取消Win10 Cortana語音引導功能 用戶也可手動關閉 2019年01月05日 11:11作者:小井編輯:梁夢婷文章出處:泡泡網原創