提到語音識別系統,很多人首先想到的就是科大訊飛,今天,中國每10臺具有語音交互功能的汽車就有6輛使用了科大訊飛的技術,那麼科大訊飛究竟是什麼來路?它們的語音交互技術有多厲害呢?今天我們就來聊一聊這個話題。
和北大方正、清華同方一樣,科大訊飛早年也是校辦企業,來自於安徽合肥的中國科技大學,早在網際網路還沒普及的1999年,科大訊飛就已經開始研究智能語音技術,2010年後,科大訊飛的靈犀助手和訊飛輸入法等明星產品相繼問世,而在2016年底,羅永浩在發布會上展示了訊飛輸入法,一時間科大訊飛名聲大噪!
雖然近幾年裡,科大訊飛一度是靠政府補貼來盈利,而受「AI同聲傳譯事件」影響,科大訊飛在業界也曾毀譽參半。但在車載智能系統方面,科大訊飛著實闖出了名堂,比如今天科大訊飛最新的飛魚OS系統,語音識別能力絕對能刷新你對車機的認知。
2020年廣州車展期間,科大訊飛發布飛魚OS MATE 2021系統。
可能在今天,你身邊的朋友還會有意無意向你顯擺一下愛車車機的智能程度:
「xx,我感覺有點熱」
「xx,打開天窗」
「xx,順路去一趟加油站」
「xx,幫我訂一張去上海的機票」……
更有無聊的人(比如我)還會用幾種方言和車機系統打情罵俏一番,然後語音識別功能都能從容處理,但其實,這些功能早在科大訊飛的飛魚OS 2.0系統上就已經實現了。
長安CS95採用了飛魚OS 2.0系統
而飛魚OS 2.0還有一個厲害的地方是,當語音交互系統被喚醒後,90秒內系統都會保持接受駕乘者指令的狀態,而不用重複說喚醒詞進行喚醒,語音交互體驗更加順暢自然,而且,駕乘者之間的聊天內容還不會被車機系統誤判為指令,智能化程度已經很高了。
而在目前,科大訊飛的飛魚OS 3.0系統已經投入使用,它的智能化程度完全可以用驚豔來形容了。飛魚OS 3.0最主要的升級是,語音交互能實現多輪對話、上下文識別、跨場景識別等幾項功能。
長安UNI-K車機系統採用了飛魚OS 3.0系統
比如,當系統無法完全理解用戶語義時,系統將進入類人語音交互模式,發起多輪對話來學習用戶語義含義,通過學習,飛魚OS 3.0系統會越變越聰明。而且飛魚OS 3.0系統還帶來了TTS語音合成技術,用戶甚至可以將語音設置為家人、朋友、明星……等任何人物的聲線,是不是越來越有科幻電影那味了?
目前,包括奇瑞瑞虎8 PLUS,長安UNI-K等車型都將採用飛魚OS 3.0系統。
而科大訊飛最新研發的飛魚OS系統還要實現這些功能:
四音區交互功能——系統獨立識別各個乘客的語音指令,四聲場單獨播放導航音樂,還能最大程度減少聲音互相干涉;
支持視覺語音雙模感知——多模語音(帶唇語),人臉識別,視線追蹤,疲勞檢測,分心檢測,行為檢測等;
快速指令——比如觸摸導航屏幕,直接說我要導航到這裡,就可以直接導航,無需說出目的地;
眾所周知,打造智能化系統最重要的資源是數據基礎,而目前,科大訊飛的車載語言交互系統的全國裝機量已經超過了2000萬輛,龐大的用戶數據為科大訊飛發展語音系統提供了紮實的基礎,當然,語音交互對於大部分用戶來說還是一個新體驗,而作為消費者,您覺得今天的語音交互技術還有那些亟待完善的地方呢?不妨在評論區談談您的意見哦。