思必馳專注於人機互動中的自然語言交互技術,從這方面來看,2016年,作為人工智慧60周年,語音交互已經成為人機互動最天然的入口,成為標配方式,尤其體現在智能硬體領域。
思必馳成立在之初即與上海交大成立了聯合研究實驗室,在國際語音技術的前瞻性研究方面取得了較大成果,例如深度學習領域推出了VDCNN算法模型及新型解碼框架等,並在多項國際大賽中取得優異成績,例如,在由英國BBC公司和EPSRC組辦的國際挑戰賽,思必馳四個單項上均列世界第一,且單項成績均大幅領先第二名,參賽技術涉及語音識別、說話人分割聚類、標註對齊、時序漸進語音識別等,處於行業領域地位。
但是,實驗室研究取得的成果需應用到實際商業案例中才更具備價值,思必馳專注國內智能硬體領域,國內智能硬體市場也在飛速的發展中,前沿的實驗室技術也在不斷的實現商業化的應用。2017年,思必馳將依據智能硬體市場需求的發展,實現更多的技術轉化及商業應用。
人工智慧的相關技術正在經歷著從感知智能向認知智能的飛躍,就自然語言交互技術而言,語音識別和合成都屬於感知範疇,主要目的是將語音信號轉為編碼文字,後端需要對生成的編碼文字進行相應的理解決策及表述,這屬於認知。思必馳目前正在做的事情就是將感知智能與認知智能連接在一起。
在這個過程中,大數據和深度學習是最核心的兩個因素。在大數據方面,思必馳深耕垂直領域的語音技術,積累了超過100TB的語音數據、文本數據、語義數據、對話數據、知識庫數據等資源,覆蓋了智能車載、智能家居、機器人等智能硬體領域。在深度學習領域,思必馳上海交大實驗室取得了十分突出的成果,在噪聲處理方面推出的VDCNN算法表現出不可取代的優勢,取得了7.09%的詞錯誤率,相比於世界其他機構目前10%左右的最好結果,有一個大幅度的明顯優勢,在抗噪語音識別上是一個新的裡程碑。同時,新型解碼框架使幀同步解碼轉換為音素同步解碼,搜索空間減少80%以上等,使語音識別系統的速度累積提高20-30倍,內存下降50%以上。
除此之外,認知計算也成為思必馳著眼的另一大方向,能夠解決深度學習與大數據之外的更多問題。深度學習主要解決輸入輸出的問題,而認知計算對應人腦中較為抽象的推理部分,解決理解、反饋和學習問題。基於認知計算技術,思必馳自然語言交互系統可結合應用場景,追蹤用戶說話意圖,去除交互語言中的不確定性,並進行糾正打斷,在垂直場景下的語義理解更加精準,為用戶反饋更有效的信息。
服務型機器人,在2016年只是有個初步爆發,隨著人機互動手段、晶片傳感器、ID及內容的升級,未來服務型機器人會呈現幾何式爆發增長,以及機器人會對技術的要求越來越高。比如就語音而言,對自然語言理解和處理的依賴會更明顯,對遠場交互和聲源定位的要求會更高,對後端的內容服務需求會更有針對性。
基於此,針對機器人語音,思必馳將從大數據、深度學習、認知計算三個方面繼續深入,深耕語音識別、語音合成、語音識別++、語義理解、智能對話等核心技術,豐富並打通後端第三方內容資源,為機器人打造更人性化的語音交互體驗。
從技術角度來看,思必馳將在AIOS For Car之後陸續提出AIOS For Home/Robot兩大純軟體的解決方案,與此同時, 「環形6+1遠場麥克風陣列」「四麥線性麥克風陣列」等軟硬一體化解決方案也將不斷進行優化升級,在遠場識別、聲源定位、語音增強、語義理解、糾正打斷等方面不斷深化,帶來更個性化的語音方案。從內容資源角度來看,思必馳目前已集成高德、蝦米、酷我、喜馬拉雅FM、微信、大眾點評、墨跡天氣、神馬搜索等多領域的內容資源,之後也將持續豐富更多內容資源,滿足用戶個性化需求。
未來,會有越來越多的網際網路大企業參與到人工智慧領域的戰場中,以及會受到來自不同市場合作的誘惑(比如AR/VR等)。如何在競爭激烈的市場中保持自己的優勢地位、保持領域堅持和未來發展的統一性,這是我們最大的課題方向。
傳統行業在不斷變革,網際網路巨頭不斷加入戰場,創業公司此起彼伏,但思必馳將保持三個始終:始終專注智能硬體領域(智能車載、智能家居、智慧機器人),始終堅持toB的智能語音交互技術之路,始終將技術和人才放在企業發展的重要位置。在此基礎上,思必馳會進一步打通第三方內容服務和跨平臺的用戶服務,為產品和消費者提供更實用、有趣的人機互動體驗。
要想在未來市場中立於不敗之地,還有很重要的兩點是保證技術創新力和技術產品化能力。思必馳成立之初與上海交大成立聯合研究實驗室,專注語音技術的前瞻性研究,所有研究成果歸思必馳獨享,保證思必馳語音技術的創新性及行業領先性。此外,針對機器人的實際需求和場景應用,思必馳有推出不同針對性的語音交互方案,包括AIOS For Home,麥克風陣列,AIchip(與第三方晶片公司合作),保證最佳的技術落地。在2017年,我們會有幾個重要的機器人合作項目落地上市,相信會讓大家耳目一新。
未來可能很難再有類似思必馳這樣的技術平臺型公司出現,但創業企業可以從平臺公司獲取基礎技術,再根據細分行業的具體需求來形成應用,這是語音交互產業的未來一個發展方向。思必馳作為國內唯一一家專注智能硬體領域的語音公司,將憑藉著近10年的技術積澱,為垂直領域打造更專業的語音交互方案。
本文為華強電子網原創,版權所有,轉載需註明出處
關注電子行業精彩資訊,關注華強資訊官方微信,精華內容搶鮮讀,還有機會獲贈全年雜誌
關注方法:添加好友→搜索「華強微電子」→關注
或微信「掃一掃」二維碼