靜待花開終有時-聲紋識別風口何時到來?

2021-01-05 億歐網
[億歐導讀]

近年來,加入聲紋賽道的企業越來越多,隨著技術成熟與商業化落地,聲紋識別逐漸進入大眾視野。本文章將從技術、市場、參與者三個方向解讀聲紋識別。

2020年受疫情影響,消費者需求向線上傾斜,智能客服需求量也隨之增加。因此,儘管疫情影響下中國經濟下行,但人工智慧尤其智能語音行業市場整體利好。激增的市場消費者群體,一方面帶來了多元化的市場需求,另一方面,促使技術服務商不斷探索新的產品功能和應用場景。近年來,許多智能語音技術服務商開始布局聲紋識別領域。隨著技術成熟與商業化落地,聲紋識別逐漸進入大眾視野。

 

一、聲紋識別技術

聲紋識別是生物識別技術的一種,也是語音技術的分支,也被稱為說話人識別,包含聲紋註冊和聲紋認證兩道程序。所謂聲紋識別就是把聲信號轉換成電信號,提取特徵、搭建模型,根據匹配度進行識別判斷。

 

聲紋識別VS語音識別

聲紋識別相比於語音識別,近年來才逐漸進入大眾視野,兩者同為語音前端信號處理,經常被放在一起比較。而談及兩者的共性及區別時,快商通聯合創始人李稀敏博士在接受億歐智庫採訪時表示:「聲紋的載體是語音,而所謂語音就是指人說的話。在人類正常的語音交互中,我們可以識別語音主體的意圖、情緒、性別、身份以及內容等信息。而利用人工智慧技術完成這一識別,則需要依靠語音及聲紋的提取與處理。語音識別和聲紋識別雖然在智能語音技術流程中都屬於對語音信號的處理,但實際的技術方向及應用卻截然相反。」

"語音識別追求的是聲音的共性",李稀敏博士表示。也就是針對不同個體對於同一句話的不同聲音、口音、語速表達,可以翻譯成同樣的文字。比如在使用智能音箱時,對於同樣的指令,無論發出這個指令的個體是男是女,南方抑或是北方口音,智能音箱都需要能夠對語音輸入提取共性,並作出準確的一致的應答。

與之相比,"聲紋識別則追求聲音的個性",即針對同一個體在不同情境下的不同表達,可以認證聲源來自同一個體。比如微信的語音登陸系統,有時因外部環境,身體狀態等因素,說話人的語音輸入會出現語速,音高等變化,而一個完善的聲紋識別系統,則需要能夠提取不同情境下語音輸入信號的個性,並準確認證說話人的身份以完成登陸。

聲紋辨認VS聲紋確認

聲紋識別主要有兩大應用場景,聲紋辨認和聲紋確認,其中:

聲紋辨認,也被稱作1:N識別,主要應用於在語音庫範圍內的語音篩查,即在海量聲紋資料庫中找到說話人的過程。比如,金融語音銷售場景下,可以迅速根據來訪者聲紋信息與自身聲紋資料庫對比,判斷客戶是否為初次購買,抑或是否在徵信黑名單中,從而調整銷售策略。

聲紋確認,也稱1:1驗證,主要應用於安全訪問驗證及身份認證等場景,系統對說話人進行語音認證,完成」你是不是你」的身份判斷。相比起聲紋辨認,聲紋確認對於語音輸入信息的質量要求更為嚴苛,比如微信的語音登錄功能會要求使用者在無嘈雜環境中對固定文本進行語音輸入。


 

 

聲紋識別進入落地階段,技術仍有發展空間

談及聲紋識別技術成熟度,李稀敏博士表示:「聲紋識別擁有數十年的研究歷史,但由於技術的局限,近年來才逐漸進入應用落地階段,技術成熟度相當於3年前的語音識別。」

因此語音識別所面臨的絕大部分技術痛點,也同樣影響著聲紋的發展。因聲源採樣率、信噪比、信道、語音時長、文本內容等因素變化而造成的準確率變化明顯。因此提升聲紋識別系統的魯棒性是聲紋識別大規模落地應用的前提條件。

深入金融安防領域,多元語音技術融合助力場景落地

由於聲紋識別系統的特殊性,在進行識別前,需要進行聲紋註冊,因而聲紋識別的應用對於資料庫有著較強的依賴。另一方面,前文提到的聲紋識別技術的不成熟,也導致其使用體驗無法達到預期效果。因此數據的缺乏以及技術的痛點導致聲紋識別與行業融合程度較淺,也成為聲紋識別落地傳統行業的主要障礙。

李稀敏博士表示,現階段聲紋識別主要應用在公安、司法以及金融領域。主要是因為聲紋識別直接的解決了這些行業的痛點,應用價值大,因而在行業的資本投入下,聲紋識別的行業落地獲得了快速發展。

除金融安防領域外,現階段聲紋識別在民生場景中的應用還處於初期試水階段,如家居車載中聲紋判定系統,硬體中的聲紋門禁等等。

智能語音技術的全面發展,以及智能設備的爆發式增長,為聲紋識別提供了更多的應用埠,而與多元語音技術的融合也成為聲紋識別落地更多行業場景提供了技術保障。在未來聲紋識別將向著聲紋+智能,以及多模態識別的方向發展。

 

二、聲紋識別市場

應用前景廣闊

相比為人所熟知的指紋識別、人臉識別,聲紋識別作為生物識別的另一個主要的分支,雖然剛剛從實驗室走出進入大眾視野,但卻擁有較強的適用性和較大的應用空間。根據快商通提供的信息整理,首先,聲紋識別具有更高的採集便捷性,用戶接受度更高,被採集者無需接觸傳感器或面對鏡頭,即可完成識別。在疫情所帶來的新需求下,聲紋識別擁有極大的落地空間。

與此同時,聲紋識別在1:1驗證應用下的準確率高,並因聲紋的穩定性,造假難度較高,是理想的生物識別模式。此外聲紋傳感器相對低廉的造價及部署成本也使得聲紋識別擁有可被廣泛應用的優勢。

聲紋技術難盈利,技術服務商何去何從?

現階段聲紋識別賽道的服務商普遍處於虧損狀態,而剖析這一現象,需要從利潤和成本兩個方向進行考慮。

聲紋技術和行業早期磨合階段,滲透率較低

聲智科技戰略合伙人&COO李智勇首先表示:「聲紋識別作為一種新的技術,雖然提供了更多的可能性,但是必須要和行業進行進一步的深度結合。然而在技術落地早期階段的磨合試探過程中,通常不會很通暢,這也導致了現階段的聲紋識別應用勢必無法深度滲透行業。」

李稀敏博士也有類似的觀點,他認為在聲紋產品在沒有深度結合產業的情況下,產品過於單一,盈利的可能性很小。而另一方面聲紋技術仍不成熟,在無法達到預期使用期望的情況下,籤單量及籤單價都不理想。

技術紅利下,企業不斷增加研發成本

在投入成本方面,李智勇表示:「目前國內企業正第一次主要進行原創的技術研發,技術研發本身所投入的成本相比於產品公司更高。此外,在技術紅利驅使下,企業也紛紛將大量的人力物力投入到科研研發中,以期望技術所帶來的未來的巨大利潤空間。」

據億歐智庫調查統計,現階段大部分聲紋技術服務商的研發人員佔比均在50%以上,與此同時,國內相關專利公開數量也不斷提升,技術研發已然成為了服務商的發展重點。

厚積薄發,多年沉澱等待破繭成蝶

綜合論述,較低的滲透率,及尚未成熟的技術體系導致聲紋識別營收並不理想,另一方面技術紅利下,企業不斷加大自身研發成本。收支兩方面的因素導致現階段聲紋技術服務商的盈利十分艱難。然而這是一項新技術發展所需要經歷的必然階段,新的技術勢必會引發新的產品和新的模式,而當我們回顧2000年左右的網際網路市場,會發現和現階段的語音市場相差無幾。整個語音市場是否會像網際網路市場一樣,成為一個時代的標誌,我們尚未可知,不過可以相信的是,在不久的將來,待語音技術成熟,和行業深度融合的那一天,聲紋識別業務一定會迎來屬於他們的春天。

 

聲紋市場風口何時到來?

2017年,6月《中華人民共和國網絡安全法》正式施行,明確將個人生物識別信息納入個人信息範疇管理。同年12月,工信部引發《促進新一代人工智慧產業發展三年行動計劃(2018-2020年)》 ,智能身份識別系統、智能語音交互系統被率先列入重點發展8大領域。直至2020年,相關政策紛紛出臺,尤其是受年初疫情影響,無接觸,無感知的聲紋識別系統需求隨之增加。

市場方向,近年來全球生物識別產業規模不斷擴大,聲紋識別的市場佔比也逐年上升。而隨著技術的成熟以及在產業內的不斷滲透,這一規模仍會繼續增加。市場參與者方向,綜合語音廠商,聲紋專業廠商,人工智慧初創公司以及網際網路巨頭紛紛入駐聲紋賽道,並在各自細分領域不斷進行行業融合,整體市場處於良性競爭狀態。2016-2020年期間,聲紋識別賽道資本投資進入加速階段,哪怕在2020年,資本市場整體遇冷情況下,賽道仍獲得多筆融資。

技術方向,李稀敏博士表示:「當前聲紋學術領域,已經在廣泛地使用最前沿的神經網絡技術,用於解決聲紋技術所存在的問題,比如人聲分離、遠場識別、跨信道等。預計3年左右,這些問題將得到較好地解決,在通過一段時間的實踐,算法和工程化都將得到驗證。總而言之,5年以內,風口將來。」

綜合論述,儘管現階段聲紋識別的應用仍具有局限性,但是聲紋主導的生物識別模式已經進入公眾視野,並被時代所接受。相信在未來,人臉識別大熱過後,聲紋識別一定能迎來屬於他的風口。


三、聲紋識別市場參與者

企業不斷入局聲紋賽道,原因為何?

近年來加入聲紋賽道的企業越來越多,包括騰訊、百度、字節跳動、平安科技等,創業者也不斷入局,究其原因,我們可以從以下幾個視角進行思考。

技術視角

李稀敏博士表示:「2011年前後神經網絡技術在人臉識別和語音識別領域的廣泛應用,帶動了神經網絡技術在聲紋技術領域的探索,直至2018年前後達到了一個高潮,各種算法層出不窮。所以,這個階段加入聲紋賽道,有其技術方面的因素。」 在另一方面,李智勇也指出,在原創技術的推動下,聲紋識別所帶來的技術紅利也是企業入局的促進因素。

市場視角

在語音研發的道路上,服務商們逐漸發現了聲紋的重要性,以及潛在的市場需求,因而逐漸向聲紋技術發展。而隨著聲紋技術在金融、安全領域的探索應用,身份認證及聲紋反欺詐應用不斷成熟,並引發了行業的廣泛關注。以金融、安全為引,聲紋市場逐漸向其他行業落地拓展,市場規模增長的情況下,企業紛紛入局聲紋賽道。

政策視角

生物識別政策頻出,2018年,央行正式發布《移動金融基於聲紋識別的安全應用技術規範》,加深了聲紋識別在金融行業的應用落地,大批聲紋服務商湧現。

聲紋識別服務商分類及布局

受市場、戰略以及技術的影響,聲紋識別技術服務商呈現出了多元化的趨勢,業務模式、產品形態以及用戶群體都展現出了較大的差異化。現階段聲紋識別的市場參與者主要有四類,分別為綜合語音技術服務商、人工智慧初創公司、深耕聲紋的技術服務商以及網際網路巨頭。

綜合語音技術服務商

多為傳統語音服務商,普遍成立於2000年左右,擁有較為成熟的技術支持及產品體系。整體業務以融合了多元語音技術的通用解決方案為主,客戶群體以大型客戶為主。聲紋識別作為語音的技術分支,更多作為定製化選項搭配語音方案進行輸出。企業戰略本身就是平臺+賽道,也就是將其自身的AI平臺,落地到各種賽道。典型的綜合語音技術服務商為科大訊飛,捷通華聲等。

深耕聲紋的技術服務商

在傳統語音技術服務商進入市場後,一部分專注與語音細分賽道的企業相繼出現,以得意音通、遠鑑科技為代表的深耕聲紋識別的服務商進入市場。整體業務以聲紋識別產品及方案為主,相比起綜合語音技術服務商,更加聚焦行業的特定需求,並專注於聲紋技術的落地,探索各類潛在的應用場景。

人工智慧初創公司

2010年開始,專注於特定行業的人工智慧初創公司陸續進入市場。因聚焦行業,因此在行業圖譜及資料庫搭建上具備更大的優勢。整體業務以特定行業的SaaS服務及落地方案為主,在行業的基礎上應用聲紋技術,更加深入行業需求,主要面向中小企業。典型的代表企業為快商通,聲智科技等。

網際網路巨頭公司

近年來網際網路巨頭公司紛紛開始布局聲紋賽道,依託自身雲服務優勢及龐大C端客戶流量進入市場。業務布局較廣,擁有較大的潛在用戶群體。典型的網際網路巨頭為阿里雲、騰訊雲、百度智能雲及華為雲。

 

 億歐智庫現正在進行《2021中國智能語音行業方案及服務商品牌測評》的報告研究及撰寫,如有合作意願或任何疑問,請聯繫本文章分析師具體溝通,也歡迎分享您的觀點及建議。


相關焦點

  • 我一錯再錯錯的執著是什麼歌 張涳青澀花開終有時插曲一錯再錯歌詞
    我一錯再錯錯的執著是什麼歌 張涳青澀花開終有時插曲一錯再錯歌詞  歌詞 「我一錯再錯錯的執著」 是什麼歌?據悉這是由青澀花開終有時插曲,由張涳演唱的《一錯再錯》。  一錯再錯完整歌詞介紹  一錯再錯 - 張涳  (電視劇《青澀花開終有時》插曲)  作詞:蔣舟  作曲:蔣舟  就算是犯錯 也不想錯過  就當是花開沒有結果  不害怕流浪 也不去多想  就當自己是只撲火的飛蛾  我一錯再錯 錯的執著  就算痛徹心扉
  • (網友推薦)靜待花開 - 「四有」好老師 - 中國 · 寶應
    王知珩媽媽班主任潘晶晶《聖經》裡說,世間萬物皆有定時——播種有時,成長有時,花開有時,凋零有時。養育我們的小孩,就像成長,就像花開,需要時間,需要我們靜下心,慢慢來,不要急。每個孩子的花期不同,有的春天開花、有的秋天開花的,還有的在冬季怒放,還有的永遠不會開花,因為他是一棵參天大樹。
  • 聲紋識別未來可期,盤點六大主流廠商
    2020年,聲紋識別這個詞走進了人們的視野,在疫情期間,不摘口罩,無接觸來進行身份認證,成為了大眾對生物識別的迫切需求。人臉識別大熱過後,聲紋識別是否可以成為一個新的風口?也許在2020年,聲紋識別的市場接受程度與資本認可程度會指數級上升。
  • 虹膜識別,聲紋識別,指紋識別,人臉識別的優缺點是什麼
    生物識別市場正處在快速增長當中。 全球生物識別市場結構中,指紋識別份額達到58%,人臉識別的份額為18%,緊隨其後的是新興的虹膜識別,份額為7%,此外還有與指紋識別類似的掌紋識別,以及聲紋識別和靜脈識別等。各個生物特徵識別的優缺點是什麼,在產業化進程中有哪些困難需要克服,以及每類生物特徵的代表性企業有哪些,今天的文章將為大家詳細講述。
  • 上善若水,靜待花開,是最美的教育情懷
    我從自己二十多年的教育經歷中悟出:上善若水,靜待花開,是最美的教育情懷。   德國哲學家雅斯貝爾斯在《什麼是教育》中有句名言,「教育就是一棵樹搖動一棵樹,一朵雲推動一朵雲,一個靈魂喚醒另一個靈魂」,強調了教育者對受教育者的巨大作用。那麼如何才能「搖動、推動、喚醒」受教育者呢?
  • 生物識別市場中的四大「爆款」:聲紋識別、人臉識別等
    近幾年,隨著生物識別技術的不斷進步,以聲紋識別、人臉識別、虹膜識別、指紋識別為代表的生物識別技術也越來越成熟。   聲紋識別   據了解,聲紋是一種可用電聲學儀器顯示、攜帶言語信息的聲波頻譜,與指紋、人臉、虹膜等生物特徵類似,具有穩定性和唯一性。聲紋識別技術是一種通用技術,可用於安防、公安司法系統、金融風控身份驗證、坐席質檢等多個領域,包括呼叫中心身份驗證、非觸摸交互界面、銀行帳戶認證保護和行動應用程式開發。
  • 北京遠鑑信息技術有限公司專注聲紋識別:聞「聲」而動
    和他接觸,第一感覺是低調,但只要談起聲紋技術,他就會亢奮起來,眼睛裡閃著光。「聲紋就是一個人聲音的特徵,反映其發聲生理器官和說話習慣的特異性。無論一個人是不是在模仿別人說話,也無論他說的是普通話還是方言,只要其聲道結構不發生本質變化,通過聲紋就能準確識別其身份。」鄭榕說。
  • 默默耕耘 靜待花開
    有的花開在春天,也有的開在別的季節。當人家的花在春天開放時,你不要急,也許你家的花是在夏天開;如果到了秋天還沒有開,你也不要著急跺他兩腳,說不定你家的這棵是臘梅,開的會更動人。如果你的花到冬天還沒開放,你也不要生氣,沒準你的花就是一棵鐵樹,鐵樹不開花,開花驚豔四方,且炫麗無比。永遠不要在意花開的時間,只要默默耕耘,靜待花開……」看了這段文字很受感動,每個孩子都是一朵花,我們又該如何去呵護他?
  • 花開疫情終有時 揚帆起航新學期!中捷友誼小學開學第一天
    花開疫情終有時 揚帆起航新學期!(通訊員:楊堯) 點亮「原標題:《花開疫情終有時 揚帆起航新學期!
  • 聲紋識別加速落地,三大應用場景展望未來
    近年,聲紋識別隨著技術的發展,越來越被更多的人所了解。通過聲音來確認你是你,是2020年人工智慧圈裡比較火的事件之一了,無論是在安防領域,還是金融,民生領域,聲紋識別都在發揮著不小的作用。當前聲紋識別技術迅猛發展,積極推動著安防領域向著一個更智能化、更人性化的方向前進,主要體現在以下這幾個方面:● 聲紋採集:聲紋識別系統通過採集語音,採用全國統一採集標準,提取聲紋特徵,訓練模型並建立聲紋模型庫,把待識別的語音和聲紋模型庫進行比對,從而實現對說話人的識別● 聲紋鑑定:聲紋鑑定又稱語聲鑑定。
  • 生物識別技術四大種類介紹(人臉、指紋、虹膜、聲紋)
    打開APP 生物識別技術四大種類介紹(人臉、指紋、虹膜、聲紋) 賽迪智庫 發表於 2020-07-24 16:26:50   隨著網際網路+時代的到來,行動支付、共享出行、智慧安防、醫療等場景對身份驗證、保障安全提出了更高要求。
  • 融資頭條滿天飛,聲紋識別這項生意為什麼突然火了?
    突如其來的資本和政策支持讓很多人都摸不著頭腦,其實聲紋識別作為一項生物識別技術,一直以來保持低調姿態是因為技術發展還不成熟,隨著大數據的發展和技術的進步,近兩年聲紋識別技術得到了迅猛發展的機會。什麼是聲紋識別技術聲紋識別,生物識別技術的一種,也稱為說話人識別,是一種通過聲音判別說話人身份的技術。
  • 什麼是聲紋識別?帶你走進聽聲辨人的科技
    在這些識別技術愈加成熟之時,越來越多的人開始將目光放在另外一種生物識別技術上——聲紋識別。什麼是聲紋識別?聲紋識別技術有兩類,即說話人辨認和說話人確認。不同的任務和應用會使用不同的聲紋識別技術,如縮小刑偵範圍時可能需要辨認技術,而銀行交易時則需要確認技術。聲紋識別有哪些應用場景?
  • 聲紋識別加持,蘋果HomePod Mini能否「聲」而不同?
    而當搭載聲紋識別技術後,基於聲紋的獨特性,在不能識別出闖入者身份的前提下,語音控制系統會進行報警等一系列安防措施。這一性能也可以在門禁上得到充分應用,例如聲紋識別企業快商通在2019年發布具備聲紋識別能力的智能門禁,該產品在聲紋識別與人臉識別技術的加持下,由說話人聲紋特徵和人臉特徵的穩定性與唯一性組成雙重身份認證,顯然更加的安全可靠。
  • 網易 AI Lab 斬獲全球頂級聲紋識別競賽冠軍
    近日,全球最大的語音會議INTERSPEECH 2020公布了SdSV聲紋識別比賽成績,網易AI Lab 從眾多國際頂級隊伍中脫穎而出,獲文本相關聲紋識別賽道綜合排名第一、單模型第一的雙料冠軍。彰顯了網易AI Lab在語音聲紋識別技術領域的領先地位。
  • 網易AI Lab 斬獲全球頂級聲紋識別競賽冠軍
    近日,全球最大的語音會議INTERSPEECH 2020公布了SdSV聲紋識別比賽成績,網易AI Lab 從眾多國際頂級隊伍中脫穎而出,獲文本相關聲紋識別賽道綜合排名第一、單模型第一的雙料冠軍。彰顯了網易AI Lab在語音聲紋識別技術領域的領先地位。
  • AnalyticDB向量檢索+AI 實戰:聲紋識別
    本文通過聲紋識別的例子展示如何快速搭建一套端對端的非結構數據搜索服務。聲紋識別是根據說話人發音的生理和行為特徵,自動識別說話人身份的一種生物識別技術,對應在電話銷售場景下,它主要解決以下安全問題:一方面,有不法分子竊取電話銷售人員帳號信息,非法獲取客戶個人信息資料並進行販賣、洩露,嚴重侵犯了公民個人的信息隱私權,另一方面,部分行業從業人員利用一些規則漏洞,通過套保、騙保等非法手段實施金融詐騙.
  • 聲紋識別進入生活!聲音會被模仿,個人信息安全嗎?
    從聲紋特徵分析上還是會有差異。繼「刷臉」之後聲紋識別也已進入我們的生活。近日,平安科技和金融壹帳通聯合項目組與廣發銀行籤署了聲紋核身項目,將在銀行預防欺詐、提供優質服務方面發揮作用。此前,市場監管總局、人民銀行兩部委發文,決定將支付技術產品認證擴展為金融科技產品認證,並確定了《金融科技產品認證目錄(第一批)》,該認證目錄中也包括聲紋識別系統。那麼,什麼是聲紋?
  • AI PM老司機告訴你:如何評測聲紋識別系統?
    當我在和別人介紹聲紋識別的時候,大家總會有各種疑問,聲紋識別準確率怎樣?感冒了能識別出來嗎?故意變聲能否識別?模仿別人的聲音能否識別?被人錄音了是否就能用於驗證?問題大同小異,總結起來一句話,這玩意靠譜麼?當你準備在你的產品上增加聲紋識別這一黑科技的時候,你除了需要清楚知道聲紋識別能做什麼之外,還需要了解它能做到什麼程度。
  • 聲紋識別將大展拳腳,哪家公司能夠一舉奪魁?
    在以前的社會中人們出入需要有安全憑證,但是隨著社會科技的越來越智能化,出入憑證不在是人們的身份證而是人們身上具備的某種生物屬性,就想"聞聲識人"就是在表達這種屬性,雖沒有指紋識別這麼火爆高調,但它卻在科技領域散發著獨特的魅力,它叫做——聲紋識別,聲紋識別作為一個正在爆發的生物識別技術