2020 年是不平凡的一年,突如其來的疫情,雖然改變了人們的生活方式,但卻為人工智慧的發展按下了加速鍵,語音的「非接觸」交互優勢被充分的挖掘和放大,語音 AI 也迎來了行業紅利期。
在經歷了上半年的「沉寂」後,語音 AI 企業在下半年集體「蓄勢待發」了。
語音 AI 的「多事」之秋
8 月,思必馳完成數億元 Pre-IPO 輪融資,距離上一輪 4.1 億人民幣融資僅五個月。思必馳旗下晶片設計公司深聰半導體,則於 12 月獲得數千萬元人民幣的 Pre-A 輪融資,或將推出下一代語音 AI 晶片。
9 月,百度宣布小度科技獨立融資,百度依然保持了對小度科技的絕對控制權,投後估值達約 200 億元。繼智能音箱取得多項全國第一後,小度發布首款「破圈」產品小度真無線智能耳機。
10 月,聲智完成 B+ 輪融資,加速遠場語音交互和人工智慧作業系統的應用場景落地,同時面向 C 端發布首款支持免喚醒智能語音交互的耳機。
10 月,杭州國芯科技完成數億元 C 輪融資,三個月前,杭州國芯發布了首款超低功耗的應用在可穿戴領域的 AI 晶片,開啟了全新的基於「人-車-家」全場景的落地之路。
11 月,雲知聲獲得科創板上市受理,招股書顯示,司最近三年營業收入複合增長率為 89.37%、超過 20%。
12 月,傳聞稱 Rokid 已完成新一輪融資(未被披露),正擬拆 VIE 架構,準備登陸科創板。
語音 AI 作為人機互動的新希望,激勵了眾多隨風起舞的獨角獸,政策、資本的利好,讓這些快速成長的企業直指一個目標——科創板上市。
闖關科創板
12 月 7 日,科創板迎來了自 2019 年 7 月 22 日開市以來,第 200 家上市公司。
據統計,這 200 家上市公司所處的行業高度集中在高新技術產業和戰略新興產業。其中,新一代信息技術領域的企業有 65 家。雖然其中聚焦 AI 的企業並不多,但每一家都受到了廣泛的關 注。
而作為科創板首個遞交招股書的語音 AI 企業,雲知聲能否成為繼 2008 年科大訊飛深交所上市後,第二家上市的語音 AI 企業,一時間也成為人們關 注的焦點。
雲知聲定義為一家為企業和用戶提供智能語音技術和綜合解決方案的人工智慧企業,主營業務包括提供智能語音交互產品、智慧物聯解決方案、以及人工智慧技術服務。
人工智慧行業正處於高速發展階段,而公司作為行業內極具競爭力的廠商,雲知聲經營規模和資產規模不斷擴大,主營業務收入呈逐年增長的趨勢,從 2017 年的 6114.07 萬元,增長至 2019 年的 2.19 億元,年均複合增長率達 89.14%。主營業務佔總營收 99.87%,主營業務毛利率為 31.66%。
從盈利能力和經營風險的角度來看,雲知聲的核心技術的商業化探索仍在持續進行,營業收入規模較小。與此同時,為持續構建核心技術和產品體系、保持競爭力,公司持續加大研發投入。公司目前仍在不斷探索新的業務方向並相應適當調整經營策略,預計公司在短期內仍無法實現盈利。
基於此,雲知聲選擇適用《上海證券交易所科創板股票上市規則》第 2.1.2 條第一款第二項的上市標準:預計市值不低於人民幣 15 億元,最近一年營業收入不低於人民幣 2 億元,且最近三年累計研發投入佔最近三年累計營業收入的比例不低於 15%。
目前在已上市的 200 家上市公司中,有 10 家企業選擇第二套上市標準。
這是語音 AI 企業遞交科創板的首份招股書,它映射了雲知聲和很多其他語音 AI 企業在主營業務上的商業化探索。
商業化探索之路
雲知聲創立於 2012 年,從創立之初就圍繞智能語音市場需求,為企業和用戶提供智能語音技術和綜合解決方案。
2012 年仍是語音 AI 商業化的萌芽階段。在此之前的 2011 年,蘋果 Siri 隨 iPhone 4s 初次亮相;隨後的 2012 年,Google Now 出現在安卓 4.1 和 Nexus 手機上;2013 年,微軟 Cortana 語音助手在年度 Build 開發者大會上首次亮相;直到 2014 年 11 月,亞馬遜 Alexa 語音助手和 Echo 智能音箱在黑五促銷季亮相,從而引爆整個語音 AI 產業。
這一期間,海外的語音 AI 的商業化之路仍在探索,國內的語音 AI 幾乎還是一片空白。
雲知聲較早的發現商機並持續圍繞著「算力+算法+數據」構建基礎架構,完善技術體系,打造獨特的「雲-端-芯」產品中臺,對核心技術進行了模塊化梳理和整合,從而具備面向市場需求的快速產品化能力,支撐公司以豐富的產品組合為眾多知名企業提供服務。
2012 年,雲知聲率先將深度神經網絡(DNN)應用於商業語音識別系統,例如,後來湧現的卷積神經網絡(CNN)、回歸神經網絡(RNN)、端到端序列建模、生成對抗網絡(GAN)等主流技術方法,雲知聲都是業界最早的產業實踐者之一,這也讓雲知聲在算法方面有了堅實的根基,並在後來始終保持高效的演進速度。
2012 年 9 月份,雲知聲率先推出免費的語音雲平臺,允許各類應用開發者免費在線實時調用公司基礎智能語音服務。
2014 年初,雲知聲亦是行業率先,提出了面向物聯網的「雲-端-芯」核心戰略,將三個模塊不斷整合,形成了面向市場需求的快速產品化能力。
從 2015 年開始,雲知聲啟動了造芯計劃。通過設計專用的 AI 加速器並重組晶片架構來支持密集的邊緣計算任務,打造語音 AI 核心 IP,讓各項人工智慧核心技術具備運算密集型的特性,對硬體算力有剛性需求。
也是從 2015 年開始,雲知聲的智能語音交互產品也日漸豐富起來,包括以軟硬一體形式為主進行交付的物聯網語音交互產品,和以軟體形式為主進行交付的智能語音工具產品兩類。
與此同時,以家居、醫療場景為突破口,率先完成智能語音解決方案的商業化落地。
在家電領域,雲知聲的智能語音交互方案已被格力等家電龍頭採用;在酒店、商業地產和住宅領域,世茂集團與雲知聲成立合資公司,落地整屋和全場景的智能化;在醫療領域,公司相關產品得到北京協和醫院等近百家醫院的高度認可,此外,公司與平安好醫生成立合資公司,試水醫療領域智能硬體產品的開發;在汽車領域,公司與億咖通成立合資公司,為戴姆勒奔馳等整車廠提供車載語音解決方案,並攜手探索基於自研車規級人工智慧語音晶片「雪豹」的車載語音解決方案的應用。
雲知聲的主要盈利模式包括三類:
1、向客戶銷售標準化程度較高的智能語音交互產品,以軟硬一體、軟體或雲服務形式交付為主;
2、為客戶提供具有一定定製化成分的場景智能化解決方案,交付內容通常包含硬體、軟體和服務;
3、面向部分細分行業龍頭客戶所提供的定製化人工智慧技術服務。
為持續提升技術領先性和加速技術產業化,雲知聲計劃將募集資金投資於下列項目:人工智慧技術中臺建設項目;面向物聯網邊緣計算的人工智慧晶片研發平臺建設項目;基於人工智慧技術的智慧醫院解決方案建設項目。
在技術層面,將夯實硬核技術實力和全棧技術體系。
在產品層面,將進一步完善及提升「雲-端-芯」產品中臺能力,以完備的產品技術組合、統一的解決方案、開放的平臺能力,夯實支持「萬物智聯」的落地能力。
在商業層面,將持續打造「U(雲知聲)+X(場景)」智慧商業生態,形成科技驅動的運營服務和產品增長的良性閉環。
語音 AI 的希望
語言,是人類最自然、最便捷、使用頻率最高的溝通方式,也是未來人機互動最重要的方式。
在人工智慧發展的 60 餘年中,智能語音是發展最早、最重要、發展最成熟的技術方向之一。同時,因為語言天然附帶的思維屬性和應用複雜性,也是人工智慧的技術制高點,行業成熟度高、市場潛力巨大。
伴隨智能音箱和語音助手在家庭、出行等領域的不斷滲透,語音 AI 在離大眾最近的消費級 IoT 領域,正在成為各種終端設備至關重要的入口。尤其是在 5G 推動萬物互聯的關鍵時刻,語音 AI 在物聯網場景中將極大受益。人機互動模式也進入了語音交互、鍵盤輸入、屏幕觸摸等多模態融合的萬物互聯新時代。
據市場調研機構 Juniper Research 預測,到 2023 年,全球語音助手的使用量將達到 80 億,而智能音箱和智能可穿戴設備端的語音助手使用量將有超過 40% 的增長。
與此同時,語音 AI 的相關技術正處於爆發期:深度學習利用深層模型替換聲學模型中的混合高斯模型,顛覆語音領域的算法設計思路,使得語音識別領域實現了有效突破,性能得到快速提升;而海量真實語音數據又為深度學習算法提供基礎原材料,成為深度學習突破聲紋識別的關鍵因素,有效降低識別錯誤率;雲計算與高性能計算機則為深度學習提供強大的運算能力和服務能力。
儘管具備語音交互能力的設備量正在井噴,但用戶對於交互效率的期待一直很高。據調查,對於語音和語義識別準確度的關 注比例高達 84.2%。可以預見,在三大技術的助力下,語音識別準確率將逐步上升,用戶滿意度也將不斷提高,從而為智能語音行業的發展打下堅實的技術基礎。
在商用場景,隨著各垂直行業的信息化建設基本完成,智能化建設方興未艾。
以醫療場景為例,在 21 世紀的前 20 年基本完成了醫療信息化的初步改造,如辦公自動化、數據數位化等智能化改造的前置條件基本完成,為進一步的人工智慧場景化應用,如就診流程智能化、診治手段智能化、空間場景智能化等提供了巨大的行業發展機會。其他垂直領域如金融、交通、生產製造、行政管理等也存在類似的信息化建設基礎 和智能化建設機會,人工智慧技術的場景化應用將成為大勢所趨。
據 Meticulous Research 發布的報告,預計到 2025 年,全球語音和語音識別市場的規模將達到 268 億美元。
雲知聲只是行業的一個縮影。放眼全球,Nuance、Cerence、科大訊飛、思必馳、出門問問等各家在語音 AI 領域耕耘的智能語音技術公司,以及 Google、蘋果、亞馬遜、百度、小米等國內外網際網路科技巨頭,正在競爭與合作、以及不斷的跨界和破圈中,推動著語音 AI 在更廣闊的商業化應用場景,落地、生根、發芽。
微 信 號:shenzhenware
主筆:周森 / 深圳灣
編輯:陳述 / 深圳灣
插圖製作:達達 / 深圳灣
題圖說明:電影《人工智慧》,2001 年上映。