語音助理早已不是新鮮事物,但是近來搭載AI語音助理的智能音箱卻成為了國內外科技巨頭爭相推出的智能家居新品,這無疑將帶動語音識別中必不可少的傳感器——麥克風市場的增長,不過增長並非包括所有類型的麥克風。MEMS麥克風憑藉微型化、一致性好、低功耗等特性更好滿足智能音箱、智能耳機、機器人等應用的語音交互需求將受惠最大,但麥克風陣列的應用也將帶來技術挑戰。
MEMS麥克風市場持續增長 智能音箱促進作用明顯
數據顯示,2016年MEMS麥克風市場為9.93億美元,接近10億美元大關,加上7億美元的駐極體電容麥克風(ECM)市場,整個麥克風市場規模約為18億美元。市場研究機構Yole Développement預估,在智能語音助理、車載等應用的加持下,MEMS麥克風出貨量未來五年將保持高速增長態勢,複合年增長率達11.3%,到2022年時年出貨量可望超過80億顆。ECM麥克風出貨量則緩慢萎縮,到2022年時出貨量僅30億顆左右。
圖1:ECM/MEMS麥克風市場規模(資料來源:Yole Développement)
在亞馬遜2014年推出擁有語音助理Alexa的智能音箱Echo熱銷之後,搭載Google Assitant、Cortana、Siri等虛擬語音助理的智能音箱紛紛亮相。各大IT巨頭陸續推出智能音箱產品,預示著消費類MEMS麥克風陣列市場蓄勢待發。很顯然,以智能音箱為代表的智能家居產品將助推MEMS麥克風市場的增長。意法半導體MEMS產品部華南區高級市場工程師董愷也表示:「隨著智能產品在智能家居中的滲透率逐步提高,傳統的交互方式已經不能滿足用戶的需求,語音作為一個重要的交互手段變得越來越流行。MEMS麥克風作為重要的交互窗口,已經在手機和筆記本市場獲得了巨大成功,智能音箱將成為MEMS麥克風應用的第三波浪潮。」
圖2:可穿戴設備(含Hearables)市場發展趨勢
遠場語音識別面臨高SNR、AOP等挑戰
智能音箱未來對MEMS麥克風市場將帶來促進作用,反過來,智能音箱也將給MEMS麥克風帶來多重挑戰。智能音箱作為智能家居產品,不同於手機語音助理和耳機語音助理的近場語音識別,智能音箱往往配置MEMS麥克風陣列,採用波束成形(Beam-forming)等技術進行降噪語音處理,從而實現遠場語音識別,整個過程無需要雙手操作。對於遠場語音拾取應用,結合算法應用的要求,均需要匹配高信噪比的MEMS麥克風。麥克風陣列應用對於麥克風的靈敏度一致性,信噪比一致性及相位一致性要求都是非常高的。
除了眾所周知的信噪比(SNR),聲學過載點(AOP)也是MEMS麥克風重要的質量指標。高SNR能夠讓設備更好的實現遠距離收音,AOP則是評估MEMS麥克風在高聲壓水平下的性能指標,SNR和AOP對於使用場景的越來越多樣化的智能語音設備來說非常重要。有報告顯示,64dB以上的高信噪比MEMS麥克風的市場佔有率已經達到50%以上,對AOP的要求,很多廠商也從之前的120dB上升到130dB以上的水平。
遠場語音識別場景中麥克風的收音環境不可避免的會受到各種噪聲、混音甚至反射帶來的幹擾,導致MEMS麥克風對聲音信號採集和提取的準確率大幅下降,從而影響語音識別的準確率。此時設備就需要通過MEMS麥克風陣列去辨別哪些是有用的聲音。另外,倘若MEMS麥克風陣列一直在收音狀態將非常耗電,這對智能行動裝置來說是非常不適合的。因此,如何把MEMS麥克風變得更加智能,能夠實現低功耗的同時保證用戶體驗也是一個挑戰。除此之外,隨著智能設備朝著小型化和多樣化的方向發展,MEMS麥克風射頻幹擾、微型化仍需提升。最後,相比傳統的ECM,MEMS麥克風的成本依舊沒有優勢。
技術指標之外仍需考慮設計結構及生產方式 算法更為關鍵
董愷表示,MEMS 麥克風陣列對麥克風的性能要求很高。不過,除了器件本身特性外,麥克風算法才是產品能否被接受的關鍵。例如,環境噪音的過濾,MEMS麥克風就需要通過與深度神經網絡(DNN)、機器學習等技術的融合。很難去評判到底多少個麥克風會更合適麥克風陣列,產業內的各家晶片公司、算法公司均推出了自己的陣列方案,不同的硬體和算法的搭配也推出了不少優秀的智能音箱產品,因此麥克風數量的選擇還取決於方案商產品的設計、定位、具體應用場景等。涉及到波束成形、關鍵字喚醒等功能的實現,更多依賴於語音算法公司。
MEMS麥克風未來將融合DSP 朝智能化方向發展
MEMS麥克風的應用趨勢是始終開啟,就像耳朵一樣,要保持一直打開的狀態。融合DSP的意義在於,簡單算法麥克風自行處理,並且滿足低功耗的要求。ST和DSP Group推出集成關鍵詞喚醒的MEMS麥克風,幫助客戶解決低功耗麥克風低功耗的挑戰,該麥克風在微型系統封裝(SiP)內集成意法半導體的低功耗MEMS麥克風、DSP Group的超低功耗語音處理晶片和 Sensory的語音識別固件,利用意法半導體的先進封裝技術取得了非常好的輕量型封裝、極長的續航時間和先進的功能。
隨著MEMS麥克風成本的下降,智能音箱麥克風陣列選擇MEMS麥克風已經是趨勢,並且MEMS麥克風市場目前發展很好,正在進行多領域開發。
對於未來MEMS麥克風更多的應用場景,董愷認為車載市場將會是另一個MEMS麥克風爆發的應用。汽車作業系統聯網化,提供豐富應用的同時對汽車的人機互動界面也提出了新的需求,語音作為最自然、安全的人車交互方式,必將主導汽車內的交互方式。他同時表示未來幾年MEMS麥克風市場會持續保持增長勢頭,同時新的競爭對手入場導致市場競爭也會更加激烈。