麥克風陣列的概念簡介

2021-01-11 電子發燒友

1 麥克風陣列

        麥克風陣列,是一組位於空間不同位置的全向麥克風按一定的形狀規則布置形成的陣列,是對空間傳播聲音信號進行空間採樣的一種裝置,採集到的信號包含了其空間位置信息。根據聲源和麥克風陣列之間距離的遠近,可將陣列分為近場模型和遠場模型。根據麥克風陣列的拓撲結構,則可分為線性陣列、平面陣列、體陣列等。

(1) 近場模型和遠場模型

        聲波是縱波,即媒質中質點沿傳播方向運動的波。聲波是一種振動波,聲源發聲振動後,聲源四周的媒質跟著振動,聲波隨著媒質向四周擴散,所以是球面波。

        根據聲源和麥克風陣列距離的遠近,可將聲場模型分為兩種:近場模型和遠場模型。近場模型將聲波看成球面波,它考慮麥克風陣元接收信號間的幅度差;遠場模型則將聲波看成平面波,它忽略各陣元接收信號間的幅度差,近似認為各接收信號之間是簡單的時延關係。顯然遠場模型是對實際模型的簡化,極大地簡化了處理難度。一般語音增強方法就是基於遠場模型。

        近場模型和遠場模型的劃分沒有絕對的標準,一般認為聲源離麥克風陣列中心參考點的距離遠大於信號波長時為遠場;反之,則為近場。設均勻線性陣列相鄰陣元之間的距離(又稱陣列孔徑)為d,聲源最高頻率語音的波長(即聲源的最小波長)為λmin,如果聲源到陣列中心的距離大於2d2/λmin,則為遠場模型,否則為近場模型,如圖1所示。

圖1  近場模型和遠場模型

(2) 麥克風陣列拓撲結構

        按麥克風陣列的維數,可分為一維、二維和三維麥克風陣列。這裡只討論有一定形狀規則的麥克風陣列。

        一維麥克風陣列,即線性麥克風陣列,其陣元中心位於同一條直線上。根據相鄰陣元間距是否相同,又可分為均勻線性陣列(UnIForm Linear Array,ULA)和嵌套線性陣列,如圖2所示。均勻線性陣列是最簡單的陣列拓撲結構,其陣元之間距離相等、相位及靈敏度一直。嵌套線性陣列則可看成幾組均勻線性陣列的疊加,是一類特殊的非均勻陣。線性陣列只能得到信號的水平方向角信息。

圖2  線性陣列拓撲結構

        二維麥克風陣列,即平面麥克風陣列,其陣元中心分布在一個平面上。根據陣列的幾何形狀可分為等邊三角形陣、T型陣、均勻圓陣、均勻方陣、同軸圓陣、圓形或矩形面陣等,如圖3所示。平面陣列可以得到信號的水平方位角和垂直方位角信息。

圖3  平面陣列拓撲結構

        三維麥克風陣列,即立體麥克風陣列,其陣元中心分布在立體空間中。根據陣列的立體形狀可分為四面體陣、正方體陣、長方體陣、球型陣等,如圖4所示。立體陣列可以得到信號的水平方位角、垂直方位角和聲源與麥克風陣列參考點距離這三維信息。

圖4  立體陣列拓撲結構

2  波束形成

        波束形成,是對各陣元的輸出進行時延或相位補償、幅度加權處理,以形成指向特定方向的波束。

        在遠場模型中,假設輸入是一個平面波。設傳播方向為θ,時域頻率(弧度)為ω,聲音在介質中的傳播速度為c,對於在一個局部均勻的介質裡傳播的平面波,定義波束k為

k = ωsinθ/c = 2sinθ/λ,其中λ是對應於頻率ω的波長。由於信號到達不同的傳感器的時間不同,則陣列接收到的信號可表示為

        f(t)=[f(t-τ0) f(t-τ1)…f(t-τN-1)]T=[exp(jω(t-kτ0)) exp(jω(t-kτ1))…exp(jω(t-kτN-1))]T

其中τn為第n個陣元接收到的信號相對於參考點的時延,N為陣元個數,T表示轉置。

        定義v(k) = [e-jωkτ0 e-jωkτ1 …e-jωkτN-1]T

矢量v包含了陣列的空間特徵,稱為陣列流行矢量。則f(t)可表示為f(t) = ejωtv(k)。

        陣列處理器對一個平面波的響應為y(t,k) =HT(ω) v(k)ejωt

其中H(ω)是濾波器係數向量的傅立葉變換。符號y(t,k)強調了輸出和輸入波數k的關係。時域上的相關性體現在輸出是一個復指數,和輸入平面波有相同的頻率。在頻域上式可表示為Y(ω,k) =HT(ω) v(k)。

注意此處ω對應單一的輸入頻率,所以是窄帶的。陣列的空時處理關係完全可以由上式的右端描述,稱為陣列的頻率-波數響應函數。它描述了一個陣列對於時域頻率為ω,波數為k的輸入平面波的復增益。

        陣列的波束方向圖反映了平面波在一個局部均勻的介質中傳播情況,它是用入射方向表示的頻率-波數響應函數,可以寫成B(ω:θ) = Y(ω,k)|k=sinθ。

陣列的波束方向圖是確定陣列性能的關鍵要素,其主要參數有3dB帶寬,到第一零點的距離,第一旁瓣高度,旁瓣衰減速度等。其幅度的平方定義為功率方向圖,是常用的一種陣列性能度量。

3 時延補償

        由於麥克風陣元空間位置的差異,各陣元接收到的信號存在時延,在對信號處理之前進行時延補償,保證各陣元待處理數據的一致性,使陣列指向期望方向。

        考慮最簡單的均勻線性麥克風陣列,如圖5所示。

圖5  ULA時延

        設麥克風陣列共用M個陣元,中心為參考點,陣元間距為d,信號入射角為θ,聲音傳播速度為c,則根據幾何知識,第m(0≤m≤M-1)個陣元的時延為τm = (d/c) sinθ(m-(K-1)/2)。

        麥克風採集的是數位訊號,設採樣周期為T,則對時域離散的信號來說,時延為D = τ/T。

        通常D不是一個整數,而對離散信號來說,整數時延才有意義。對於非整數D,可以分解為整數部分和分數部分D = ⌊D⌋ + d,式中,⌊D⌋為D的向下取整,0≤d<1。對於非零的分數部分d,此時信號實際值介於兩個相鄰採樣點之間,即分數延遲。在實際處理中,可對d四捨五入取整,然後加上⌊D⌋,得到近似整數時延,但這種方法處理的結果不夠精確。

        為了得到較為精確的處理結果,就必須設計分數時延濾波器,對採樣信號進行精確的時延補償。理想的分數時延濾波器的衝激響應可表示為hid(m) = sinc(m-D)。

        由數位訊號處理知識可知,上式是無限長、非因果不穩定的,在物理上不可實現。為了解決這一問題,在實際操作中,通常會對上式進行加窗,加窗後濾波器的衝激響應為

h(m)=(W(m-D)sinc(m-D), 0≤m≤M-1。加窗後的分數時延濾波器的時延精確程度與理想分數時延濾波器非常接近

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 麥克風陣列的基本原理、結構組成及聲學效果簡介
    一、波束的形成麥克風陣列是指按一定距離排列放置的一組麥克風,通過聲波抵達陣列中每個麥克風之間的微小時差的相互作用,麥克風陣列可以得到比單個的麥克風更好地指向性。在麥克風陣列的設計中首要的改進是引入了波束成形、陣列指向性與波束寬度的概念。
  • 廣播百科 麥克風陣列
    ∧     更多內容推薦        請關注為星標麥克風陣列
  • 詳解麥克風陣列的基本原理、結構組成及聲學效果
    陣列(Array):數學定義——有限個相同資料形態之元素組成之集合麥克風陣列具有對遠場幹擾噪聲很強的抑制作用,應用於便攜IT設備如PDA、GPS、NB、手機等在較大噪聲環境中使用時表現出較好的效果。小型麥克風陣列由一組麥克風單元在一個小範圍內按照一定空間分布組合而成,由於它在噪聲環境下具有良好的信號採集性,因此越來越受到聲學應用領域的關注。
  • 數字麥克風和陣列拾音技術的應用
    數字麥克風陣列通過L/R引腳配置成成主麥克風(L/R接地)和參考麥克風(L/R接電源),拾取的近端信號經過數字麥克風放大並轉換成PDM信號連接到語音處理晶片FM34-395晶片。兩路麥克風信號經過下採樣裝換成16位的PCM信號,放大濾波以後進行相關處理。
  • 智能語音技術中麥克風陣列的原理
    麥克風陣列能幹什麼?  任何一項技術的發生發展都伴隨著問題的提出及解決,麥克風陣列也是如此。那麼它主要應用在哪些場景下呢?又有著怎樣的功能!  噪聲環境怎麼破?而麥克風陣列融合了語音信號的空時信息,可以同時提取聲源並抑制噪聲。  目前科大訊飛已經實現了基於線性陣列、平面陣列以及空間立體陣列的波束形成和降噪技術,效果均達到業界一流水平。  說話人老是變幻位置怎麼破?—聲源定位  現實中,聲源的位置是不斷變化的,這對於麥克風收音來說,是個障礙。
  • 麥克風相陣列氣動噪聲測量技術
    麥克風相陣列氣動噪聲測量技術是氣動噪聲研究的重要技術手段。
  • MEMS麥克風設計:從概念到完成GDSII只需兩周!
    打開APP MEMS麥克風設計:從概念到完成GDSII只需兩周! 胡薇 發表於 2018-06-14 14:45:28 MEMS麥克風市場簡介 眾所周知,Knowles(以下簡稱:樓氏電子)在2003年推出了首個MEMS麥克風,從而促進了MEMS
  • 基於麥克風陣列的聲源跟蹤系統
    聲源目標跟蹤技術可以應用在視頻錄製、安防監控、鳴笛抓拍等場景中,在這些場景中,針對目標對象的語音信號,可以應用陣列信號處理的知識,將麥克風按照特定陣列放置在空域中,利用空間不同位置點的聲源對麥克風陣列響應的時延相位誤差,對聲源進行測向,實現低成本的聲源定位跟蹤功能。
  • 一文帶你全面熟悉智能語音之麥克風陣列技術的原理
    也就是說由一定數目的聲學傳感器(一般是麥克風)組成,用來對聲場的空間特性進行採樣並處理的系統。   早在20世紀70、80年代,麥克風陣列已經被應用於語音信號處理的研究中,進入90年代以來,基於麥克風陣列的語音信號處理算法逐漸成為一個新的研究熱點。而到了「聲控時代」,這項技術的重要性顯得尤為突出。   麥克風陣列能幹什麼?
  • 基於MEMS麥克風陣列的四通道語音採集系統設計
    單個孤立麥克風作為傳統的語音拾取工具,在噪聲處理、聲源定位和跟蹤,語音增強等方面存在不足,在噪聲環境下會嚴重影響語音質量。一些文章探討了多通道麥克風的降噪技術,在理論上提高了噪聲環境下語音的信噪比。但是實際應用中,多通道的語音實時採集是一個尚待解決的問題。
  • 利用MEMS麥克風陣列定位並識別音頻或語音信源的技術方案
    特別是基於微機電系統(MEMS) 的麥克風陣列出現後,麥克風陣列音頻定位方案引起科研企業和開發人員的廣泛關注。麥克風陣列可捕捉從不同方向傳來的聲音,通過算法運算使麥克風指向某一個特定方向,放大從該方向捕捉到的音頻信號,同時衰減從其它方向捕捉的音頻信號,整個動作就像一個智能麥克風。
  • 樂鑫發布 AI 語音麥克風陣列開發板 ESP32-Korvo
    樂鑫信息科技發布 AI 語音麥克風陣列開發板 ESP32-Korvo 。這是一款針對物聯網嵌入式設備的 AI 語音開發板,基於樂鑫的旗艦晶片 ESP32,搭載多麥克風陣列,能夠實現高性能、低功耗的遠場語音喚醒和命令詞識別功能。本文引用地址:http://www.eepw.com.cn/article/202004/411927.htm近年來,隨著人工智慧和物聯網的興起,語音逐漸成為我們與智能設備交互的一種典型方式。
  • 微軟新專利:包含魚眼鏡頭和麥克風陣列的AI設備
    本月微軟提交申請的一項專利被美國商標和專利局(USPTO)收錄,展示帶有單個魚眼攝像頭和多個麥克風陣列的人工智慧系統。魚眼攝像頭具備特殊的鏡頭可以監控360度全景。儘管該技術並不新鮮,但微軟計劃以不同的方式和其他周圍環境傳感設備配合使用。這種環境捕獲系統通常具有多個攝像機以擴展其視野。這需要複雜的設計,並且還需要額外的硬體來融合多個視頻數據流。
  • 使用雲端麥克風陣列,音頻轉錄精度提升22.4%
    導語:微軟利用人工智慧轉錄會議音頻,新系統使用雲端麥克風陣列。智東西9月16日消息,微軟語音和對話研究小組的科學家最近研發了一個系統,利用內置於智慧型手機、筆記本電腦和平板電腦中的麥克風來提高音頻質量。這個系統通過智能硬體連接網際網路,在雲端形成臨時的麥克風陣列,可以實時高精度轉錄音頻。
  • NASA部署30英裡麥克風陣列測試超音速飛機噪音
    為了迎接新時代的到來,美國宇航局(NASA)計劃對洛克希德馬丁公司的X-59 QueSST進行測試,並使用長達30英裡的麥克風陣列進行驗證。自20世紀70年代以來,由於超音速噴氣式飛機所產生的巨大噪音而遭到了很多民眾的強烈反對,因此在美國境內測試這些超音速飛行是違法的。美國宇航局正在通過其低空飛行演示計劃為最終改變這一立法鋪平道路,該計劃將涉及測試和驗證產生更安靜的超音速飛行的技術。
  • 邁進數字拾音時代――數字麥克風和陣列拾音技術的應用
    數字麥克風適合SMT焊接,可以解決系統各種射頻幹擾對語音通信產生的噪聲,富迪科技的數字陣列麥克風拾音技術可以抑制和消除通話時的回聲和環境噪聲,數字接口方便同數字系統的連接。模擬麥克風和數字麥克風麥克風結構:ECM模擬麥克風通常是由振膜,背極板,結型場效應管(JFET)和屏蔽外殼組成。振膜是塗有金屬的薄膜。
  • 盤點麥克風技術及市場,遠場語音交互如何選型麥克風?
    這幾個指標其實都好理解,決定了麥克風的性能,而且每個指標都非常關鍵,缺一不可。當然這些指標相對於喇叭的T-S參數來說,真的是簡單的了許多。麥克風是典型的傳感器產業,其技術迭代非常迅速,外觀也發生了不少變化,估計很多人從下面的麥克風陣列中準確找到麥克風就很困難。現在麥克風陣列主要使用的是數字MEMS麥克風,其最長尺寸僅有3.76MM。
  • 麥克風技術規格和術語全解析
    簡介   在ADI公司的眾多產品中,MEMS麥克風IC的獨特之處在於其輸入為聲壓波。因此,這些器件的數據手冊中包括的某些技術規格可能不為大家所熟悉,或者雖然熟悉,但其應用方式卻比較陌生。對於固定的聲學輸入,靈敏度值較高的麥克風的輸出水平高於靈敏度值較低的麥克風。麥克風靈敏度(用dB表示)通常是負值,因此,靈敏度越高,其絕對值越小。  務必注意麥克風靈敏度規格的表示單位。如果兩個麥克風的靈敏度不是採用同一單位來規定,則直接比較靈敏度值是不恰當的。模擬麥克風的靈敏度通常用dBV來規定,即相對於1.0 V rms的dB數。
  • 智能音箱將MEMS麥克風推向高潮,為啥中國企業是最大贏家
    編者按:近年來,隨著物聯網概念的興起,除了電視、冰箱、空調和風扇以外,如什麼電燈、窗簾等也都成為了智能家居廠商「下手」的對象。但是如何控制這些設備,成為開發者和消費者關注的話題。
  • 可編程邏輯陣列(PLA)簡介
    本文將著重介紹可編程邏輯陣列PLA的一些基本概念、類型以及基礎應用。  一.PLA的基本概念  可編程邏輯陣列原文是英文的ProgrammableLogicArray,簡稱PLA,是一種可編程邏輯裝置,它的與陣列(AND array)和或陣列(OR array)均為可編程,輸出電路為不可組態。又叫做FPLA(field-programmable logic array)。