一、文章概述
在未來的人工智慧和物聯網時代,語音用戶界面(VUI)作為更直觀的人機互動(HMI)方式而備受關注。聲學傳感器將模擬聲波轉換為數位訊號,這對於通過機器學習算法實現HMI語音通信至關重要。人類可以使用約15000個毛細胞通道檢測共振聲音,從而實現遠距離和準確的識別。然而,目前的研究工作尚未達到人類水準。本文通過利用超薄膜進行仿生頻帶控制,來演示了一種高靈敏度的壓電移動聲學傳感器(PMAS)。(1)、仿真結果證明,通過在超薄聚合物上採用鋯鈦酸鉛(PZT)膜來覆蓋整個語音頻譜,可以擴大壓電膜的諧振帶寬。(2)、集成的聲學傳感器模塊,算法處理器和定製的Android應用程式演示了基於機器學習的生物特徵認證。(3)、最後,與傳統的微機電系統麥克風相比,具有少量訓練數據的PMAS模塊可顯著降低揚聲器識別中的異常錯誤率。相關論文以題為「Biomimetic and flexible piezoelectric mobile acoustic sensors with multiresonant ultrathin structures for machine learning biometrics」發表在國際頂尖期刊Science Advances (IF=13.116)上,通訊作者及單位為:韓國科學技術高等研究院材料科學與工程系的Keon Jae Lee教授。二、圖文導讀
【仿生PMAS和移動生物識別】
圖1、仿生PMAS和移動生物識別技術的總體概念。
(A)、微型PMAS的仿生多頻帶控制和移動生物特徵識別的示意圖:(i)仿生超薄PMAS,模仿人耳蝸基底膜,將多共振頻率定位在100Hz至4kHz的聲音範圍內。(ii)通過使用低Q因子超薄聚合物,應力控制的壓電膜和多通道電極,PMAS對全覆蓋的電話頻譜具有高度敏感的頻率響應。(iii)使用由微型PMAS,機器學習處理器和無線發射器組成的集成聲學模塊進行移動應用的生物識別認證。
(B)漂浮在易碎氣泡上的超薄多通道PMAS膜的照片。插圖顯示了超薄聚合物上PZT薄膜和粘合劑層的橫截面掃描電子顯微鏡圖像。
(C)高靈敏度小型化PMAS與先前報導的諧振壓電聲學傳感器之間的靈敏度FOM(FOMsens)比較。
圖2、全覆蓋語音頻譜的頻帶控制和靈敏度提高。
(A)根據厚度為40μm的PMAS的小型化尺寸,對共振頻率的二次行為進行FEM計算。
(B)130mm2有效面積中的共振頻率分布,該分布是通過有限元模擬計算得出的PMAS厚度的函數。
(C)比較僅PZT薄膜和超薄聚合物上PZT的諧振帶寬。與僅PZT薄膜的尖銳和離散共振譜相比,模擬結果顯示在語音頻率範圍內具有低Q因子的超薄聚合物上PZT的帶寬較大。
(D)IDE結構中殘餘應力(拉伸和壓縮)下偶極子對準和面內壓電勢的示意圖和FEM計算。
(E)通過在(110)峰處的Psi取向的d-間距變化計算出的每個壓電厚度處的壓應力的比較。
(F)通過測量P-E磁滯回線,將飽和度和殘餘極化值作為PZT膜厚度的函數。底部插圖顯示了IDE通道的光學顯微鏡圖像。
圖3、PMAS的機械和電氣特性
(A)通過LDV在100Hz至4kHz的頻率掃描下測得的超薄PMAS膜的多共振位移。
(B)通過選擇多個通道中的最高靈敏度繪製的PMAS頻率響應。插圖展示了PMAS與商用Li-button電池的尺寸比較。
(C)在第一,第二和第三諧振和低頻時,最敏感通道的壓電電壓輸出。插圖顯示了單色正弦波聲音下峰峰值電壓的放大電信號,顯示了PMAS優於參考傳聲器的出色靈敏度。
(D)在單個頻率的聲波下,每個諧振頻率的靈敏度轉換為dBV單位。紅色,藍色和青色框線是第一次,第二次和第三次共振的基頻,而其他峰值是諧波頻率。
(E)通過減去每個諧振頻率和噪聲基線的靈敏度計算出的SNR。頂部插圖顯示通過FEM計算模擬的彎曲PMAS膜的多共振位置。
(F)通道2在第一次諧振時的電壓隨壓力的線性變化。插圖顯示了與正弦輸入相同的PMAS信號的同相特性。
圖4、PMAS模塊基於機器學習的移動生物特徵認證。
(A)使用PMAS模塊的基於機器學習(ML)的移動生物特徵認證的示意圖。PMAS的多通道信號被無線傳輸到算法資料庫,以對智慧型手機進行訪問控制。
(B)比較原始聲音和PMAS模塊信號之間的語音功能。這些圖包括時域的電壓信號,FFT響應和STFT頻譜圖。
(C)用於說話人訓練和測試程序的GMM算法流程圖,包括信號平均、特徵提取和層形成。通過將輸入的語音信息與預訓練的數據集進行比較來執行說話者決策。
(D)在150個數據訓練,150個數據測試和7種混合條件下,PMAS模塊的揚聲器識別錯誤率優於商用MEMS麥克風。
(E)由PMAS模塊和定製的智慧型手機應用程式演示的實時移動生物識別,用於在五個訓練和一個測試字的情況下的訪問許可和禁止。
三、結束語
本文開發了一種高度靈敏的小型化PMAS,用於使用仿生超薄壓電膜進行多諧振頻帶控制。使用集成了智慧型手機的傳感器模塊(由PMAS、算法處理器和無線發射器組成)演示了基於機器學習的生物特徵識別。在150個訓練數據和150個測試數據的少量條件下,與商用MEMS麥克風相比,PMAS模塊的說話者識別錯誤率降低了56%。最後,通過定製的Android應用程式,即使使用了五個訓練詞和一個測試詞,也已經成功地實現了用於行動應用程式的實時語音生物識別技術。未來的研究工作將面向用於多通道頻率響應平坦度的信號處理,以實現均勻性和無失真的聲音輸出。四、論文詳情
Biomimetic and flexible piezoelectric mobile acoustic sensors with multiresonant ultrathin structures for machine learning biometrics
Science Advances (IF=13.116)
Pub Date : 2021-02-10
DOI: 10.1126/sciadv.abe5683
Hee Seung Wang, Seong Kwang Hong, Jae Hyun Han, Young Hoon Jung, Hyun Kyu Jeong, Tae Hong Im, Chang Kyu Jeong, Bo-Yeon Lee, Gwangsu Kim, Chang D. Yoo and Keon Jae Lee
Department of Materials Science and Engineering, Korea Advanced Institute of Science and Technology (KAIST), 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea.
.
WEST可穿戴電子微信群開通。歡迎加入、推薦、分享和交流,謝謝!
該平臺免費提供相關領域的論文宣傳和招生招聘,有興趣請關注訂閱號給小編留言或者郵件聯繫 E-mail:wonger.west@gmail.com