日前,科大訊飛正式啟動了新一代「語音雲」平臺發布暨語音開發者大會(詳情請點擊:2012.voicecloud.cn)。據悉,此次發布的新一代「語音雲」平臺將是一個具有自然語言理解、個性化語音識別、個性化語音合成、聲紋識別、口語評測能力等特性的新一代「語音雲」平臺。
自然語言理解
自然語言,即人們用最自然的說話方式說出的語言。自然語言理解,作為一個新的特性出現在新一代「語音雲」平臺中,在現有的移動網際網路案例中,我們只能想到蘋果的siri,無需拘泥於說話方式的智能語音操控。作為先行者,Siri成功地引爆了移動網際網路語音的這顆炸彈,掀起了語音應用的高潮。若新一代「語音雲」的自然語言理解能達到一個新高度,並被開發者或硬體廠商廣泛應用於各種應用和手機等設備中,那必將是移動網際網路的一次新的革命。在現有的移動網際網路應用中,我們不乏看到類似的應用如Airi、智能360等,其都有通過語音對話的方式進行打開應用、查詢天氣甚至「調戲」的功能,但是識別及回答的效果並不理想。我們更期待一個官方版的「自然語言理解」功力到底如何。
個性化語音識別
個性化的今天,語音也可以玩個性化。在現有的語音雲平臺中,訊飛僅提供的是標準的普通話識別,對於口音較重的方言,目前還沒有一個很好的識別效果。個性化語音識別也許能提供方言識別的解決方案。據悉,新一代「語音雲」平臺可以提供陝西話、四川話、東北話和廣東話的語音識別方案。其實在現有的語音雲平臺中已經有東北話和粵語的合成功能——塞班訊飛口訊的多語播報功能。除了對方言的個性化語音識別,新一代「語音雲」平臺還將建立一個個人的語音資料庫,資料庫收集個人特定的發音信息,可以快速識別具有個人特色口音的語言,即如果它識別不了上海話,你可以通過對它進行訓練和指導,讓它學會「聽」上海話。
個性化語音合成
與個性化語音識別相仿,可以合成不同的方言。這一點在現有的語音雲平臺中已經實現。進一步的個性化莫過於合成具有個人特色的語音。既然能通過建立個人的語音資料庫識別個人特色語音,相信合成具有個人特色的語音基本不是問題,也許哪天你不想動嘴說話的時候,可以找個「替身」替你說了,也許哪天你打電話給你朋友的時候,對方已經變成劉德華或者葛優了……個性化語音合成的意義豐富!
聲紋識別
在影視劇中我們常常可以看到這樣的情景:大佬來到保險門旁,輸密碼;手掌按住指紋識別儀,綠光掃過;語音要求說話驗證;保險門開了!這樣的場景在未來並不是夢。聲紋作為唯一一個非接觸式的個人特性,在公共安全方面應用方面有著重要的意義。也許有一天,警察破案可以不用採集指紋了;啟動汽車不用鑰匙了;開保險柜也不用設置密碼了……,新一代「語音雲」平臺的聲紋識別特性,為各種應用的加密提供了新一代的解決方案。
口語評測
目前,國家普通話水平測試基本都是採用的科大訊飛的語音評測系統。口語評測功能在生活中的應用已經很成熟了。在新一代的「語音雲」平臺中,口語評測已經開放,你可以隨時隨地評測自己的普通話,等你在普通話考試的時候,可以自己在家練習,掌握規律,把握特性,百戰百勝。
作為中文語音產業的領跑者——科大訊飛,在智能語音尤其是中文語音方面一直走在國際IT巨頭的前面。其2010年發布的首個「語音雲」平臺產品獲得了業界的一致好評,目前訊飛語音雲的開發夥伴已經達到了2500多家,終端用戶數已達2500萬,每天在線用戶數已超過120萬、總請求量超過700萬次。新一代「語音雲」平臺的發布必將是語音發展史上的一件大事。