基於MEMS麥克風陣列的四通道語音採集系統設計

2020-11-27 OFweek維科網

  單個孤立麥克風作為傳統的語音拾取工具,在噪聲處理、聲源定位和跟蹤,語音增強等方面存在不足,在噪聲環境下會嚴重影響語音質量。一些文章探討了多通道麥克風的降噪技術,在理論上提高了噪聲環境下語音的信噪比。但是實際應用中,多通道的語音實時採集是一個尚待解決的問題。本文基於此出發點,採用四個ADMP441 MEMS 數字麥克風,使用BF533 DSP 作為主控,組成一個4 聲道的語音實時採集系統,在時頻域的基礎上增加一個空間域,以便對來自空間不同方向的信號進行實時處理,彌補了傳統單聲道的缺陷。

  MEMS(微型機電系統) 麥克風是基於MEMS 技術製造的麥克風,簡單的說就是一個電容器集成在微矽晶片上,可以採用表貼工藝進行製造, 能夠承受很高的回流焊溫度,容易與 CMOS 工藝及其它音頻電路相集成。本文採用的四個ADMP4411 是一款高性能、低功耗、數字輸出、提供底部收音孔的全向MEMS 麥克風。完整的ADMP441 解決方案由MEMS傳感器、信號調理電路、模數轉換器、抗混疊濾波器、電源管理和業界標準24-bitI2S 接口組成。ADMP441 利用I2S 接口與數字處理器( 例如:DSP、微控制器) 直接相連,因此,在系統中無需使用音頻編解碼器,在體積和功耗方面具有普通mic 採集方案無法比擬的優勢,系統可以很方便的嵌入到對功耗和體積敏感的可穿戴式設備中,並且提供更清晰語音質量,具有較高實用價值。MEMS麥克風的全部潛能還有待挖掘,但是採用這種技術的產品已經在多種應用中體現出了諸多優勢,比如中高端手機應用和人工耳蝸助聽器。

  本文採用的主控晶片ADSP-BF533 是主頻高達600 MHz 高性能Blackfin 處理器,內核包括:2 個 16 位 MAC,2 個 40 位 ALU,4 個 8 位視頻 ALU,以及 1 個 40 位移位器RISC 式寄存器和指令模型,編程簡單,編譯環境友好,具有先進的調試、跟蹤和性能監視功能。並且晶片具有2 個雙通道全雙工同步串行接口,支持 8 個立體聲 I2S 通道,十分適合多通道的語音信號採集和處理。

  1 硬體系統設計

  該硬體系統主要包括4 路MEMS 麥克風構成的陣列、麥克風外圍電路、DSP 數據處理模塊、USB 通訊模塊、PC 機組成。

  1.1 麥克風陣列部署

  由於多數麥克風陣列語音增強採用波束成型(Beamforming)技術,根據理論,我們得到的波形可以表達為

  其中wn(f) 為權重係數, 為相對第0 個陣子的相位差,n 為麥克風數量。由上式我們可以得出麥克風數量和間距的關係以及排布,如圖2 和圖3:

  由圖2、圖3 我們知道,經典應用中,麥克風間距為40mm,數量為3-10 個麥克風。本文採用4 個麥克風排列為間隔40mm 的線陣布局。

  圖2:麥克風數量N 與波形的關係

  圖3:麥克風間距與波形的關係

  1.2 DSP數據處理模塊

  本文採用的BF533 DSP 數據處理模塊。其 中,BF533 通過SPORT 接口與前端的MEMS 麥克風I2S 接口相連,並利用SPORT接口數據傳輸速度快、傳輸量大, 且不佔用CPU 時鐘周期的特點,將採集數據轉存至BF533 的片內存儲空間。本系統採用了一個 USB1.1 標準的 USB 設備晶片,其型號為PDIUSBD12, 該晶片有 6 個數據傳輸斷點,其控制命令簡單,寄存器少,適合於簡單USB信息傳輸。BF533 處理器通過 EBIU 接口的BANK3 連接 PDIUSBD12 晶片,通過 CPLD為其分配訪問地址,通過 CPLD 的 USB_DAT寄存器和USB_CMD 寄存器進行訪問,完成DSP 與PC 機平臺間的USB 數據傳輸。

  1.3 MEMS數字麥克風與DSP數據處理模塊接口設計

  圖4 所示電路允許兩個數字MEMS 麥克風通過單條數據線與一個DSP 接口。由於BF533 有2 路SPORT 接口,最多可以設置四路串行數據輸入,因此單個DSPBF533 理論上最多支持八個ADMP441。

  圖4:MEMS 麥克風與Blackfin DSP 的連接(原理示意圖:未顯示所有連接)

  電路描述:

  ADMP441 麥克風連接到ADSP-BF533 的SPORT0,SPORT1 數據輸入引腳。本電路需要的無源元件只有電容和電阻:每個ADMP441需要一個0.1 μF 旁路電容;SD 線路上需要一個大下拉電阻(100 kΩ),用以在ADMP441 的輸出驅動器處於三態時給電容放電。旁路電容應儘可能靠近ADMP441 VDD 引腳(引腳7)放置。麥克風的VDD 與BF533 的2.25 V至3.3 V VDDEXT 應由相同的電源供電。雖然ADMP441 可以採用1.8 V 至3.3 V 的VDD工作,但ADSP-BF527 的VDDEXT 必須至少是2.25 V。為實現I2S 數據流,ADMP441 與BF533 之間必須連接三個信號:幀時鐘、位時鐘和數據。BF533 為系統時鐘,並生成兩個I2S 時鐘。

  此電路展示麥克風連接到Blackfin 的SPORT0 單個數據輸入端。BF533 的兩個SPORT 各具有兩組數據接收引腳,因此最多可提供八通道I2S 音頻輸入。

相關焦點

  • 利用MEMS麥克風陣列定位並識別音頻或語音信源的技術方案
    特別是基於微機電系統(MEMS) 的麥克風陣列出現後,麥克風陣列音頻定位方案引起科研企業和開發人員的廣泛關注。其中,音頻方向測定子系統基於麥克風陣列,運行三個不同的音頻方向估算算法;數據融合子系統負責推斷方向,自動語音識別子系統利用傳入的音頻信號增強主音源信號強度,衰減主音源周圍的其它音頻信號。最後,自動說話人確認子系統識別某些關鍵詞彙,再利用相關特徵與說話人匹配。
  • 大熱的麥克風陣列語音識別系統的設計和輕鬆實現,提供軟硬體解決方案
    1、研究方案1.1 總統研究方案當前基於隱馬爾可夫模型(HMM)的麥克風陣語音識別系統,主要包括陣列信號處理和特徵識別兩個階段,原理圖如圖1.1所示:圖1.1 基於HMM的麥克風陣語音識別系統結構其中前端的陣處理主要是為了進行語音增強,目的是在提取語音參數之前,儘量減小信號波形的失真。
  • 智能語音技術中麥克風陣列的原理
    因為它使用的麥克風個數最少,並且充分考慮到了語音譜和噪聲譜的特性,使得這些方法在某些場景下也具有較好的噪聲抑制效果,並因其方法簡單、易於實現的特點廣泛應用於現有語音通信系統與消費電子系統中。  但是,在複雜的聲學環境下,噪聲總是來自於四面八方,且其與語音信號在時間和頻譜上常常是相互交疊的,再加上回波和混響的影響,利用單麥克風捕捉相對純淨的語音是非常困難的。
  • 基於麥克風陣列的聲源跟蹤系統
    聲源目標跟蹤技術可以應用在視頻錄製、安防監控、鳴笛抓拍等場景中,在這些場景中,針對目標對象的語音信號,可以應用陣列信號處理的知識,將麥克風按照特定陣列放置在空域中,利用空間不同位置點的聲源對麥克風陣列響應的時延相位誤差,對聲源進行測向,實現低成本的聲源定位跟蹤功能。
  • 8種麥克風DIY設計方案,包括MEMS、CMOS電容式等
    利用MEMS麥克風陣列定位並識別音頻或語音信源的技術方案  音源定位是自動語音識別和自動說話人識別系統的一個重要環節,對於提高語音識別系統的性能至關重要。麥克風陣列可捕捉從不同方向傳來的聲音,通過算法運算使麥克風指向某一個特定方向,放大從該方向捕捉到的音頻信號,同時衰減從其它方向捕捉的音頻信號,整個動作就像一個智能麥克風。
  • 廣播百科 麥克風陣列
    (Microphone Array):其實就是一個聲音採集的系統,該系統使用多個麥克風採集來自於不同空間方向的聲音。從字面上,指的是麥克風的排列。也就是說由一定數目的聲學傳感器(一般是麥克風)組成,用來對聲場的空間特性進行採樣並處理的系統。早在20世紀70、80年代,麥克風陣列已經被應用於語音信號處理的研究中,進入90年代以來,基於麥克風陣列的語音信號處理算法逐漸成為一個新的研究熱點。而到了「聲控時代」,這項技術的重要性顯得尤為突出。
  • 一文帶你全面熟悉智能語音之麥克風陣列技術的原理
    也就是說由一定數目的聲學傳感器(一般是麥克風)組成,用來對聲場的空間特性進行採樣並處理的系統。   早在20世紀70、80年代,麥克風陣列已經被應用於語音信號處理的研究中,進入90年代以來,基於麥克風陣列的語音信號處理算法逐漸成為一個新的研究熱點。而到了「聲控時代」,這項技術的重要性顯得尤為突出。   麥克風陣列能幹什麼?
  • 語音應用多元化,MEMS麥克風走向高效能
    遠場語音識別日趨重要,帶動MEMS麥克風走向高效能  語音控制應用逐漸多元化,讓使用者能透過最直覺方式達到目的;另一方面,也讓使用者能夠空出雙手進行其他活動,若MEMS麥克風效能不佳,將導致語音難以識別,進而造成使用者體驗不佳。
  • 樂鑫發布 AI 語音麥克風陣列開發板 ESP32-Korvo
    樂鑫信息科技發布 AI 語音麥克風陣列開發板 ESP32-Korvo 。這是一款針對物聯網嵌入式設備的 AI 語音開發板,基於樂鑫的旗艦晶片 ESP32,搭載多麥克風陣列,能夠實現高性能、低功耗的遠場語音喚醒和命令詞識別功能。本文引用地址:http://www.eepw.com.cn/article/202004/411927.htm近年來,隨著人工智慧和物聯網的興起,語音逐漸成為我們與智能設備交互的一種典型方式。
  • 麥克風陣列的概念簡介
    1 麥克風陣列        麥克風陣列,是一組位於空間不同位置的全向麥克風按一定的形狀規則布置形成的陣列,是對空間傳播聲音信號進行空間採樣的一種裝置,採集到的信號包含了其空間位置信息。根據聲源和麥克風陣列之間距離的遠近,可將陣列分為近場模型和遠場模型。根據麥克風陣列的拓撲結構,則可分為線性陣列、平面陣列、體陣列等。
  • MEMS麥克風新浪潮——Vesper壓電MEMS麥克風
    YD:信噪比對於高級語音控制系統有多重要?MC:客戶告訴我們,麥克風的信噪比仍是他們系統的瓶頸。目前使用的算法非常複雜,如果我們能夠提供更好的數據,這些算法將會變得更加有效。客戶告訴我們,麥克風需要達到90dB的信噪比,在達到該信噪比之前都不會再有更多的利潤可言。所以,我們還有很長的路要走。
  • 基於STCl2C5410AD單片機的四通道聲發射信號採集系統設計
    摘要:根據聲發射信號微弱、傳播速度快、易受幹擾等特點,通過對聲發射檢測中聲發射信號源定位類別和方法的研究,提出了多個數據採集通道同時採集聲發射信號的設計方法。
  • 基於FPGA的語音智能操控系統
    基於FPGA實現語音智能操控系統具有:(一)設計靈活、操作方便、快捷(二)準確度高,工作範圍大(三)可隨時用語音操控帶有遙控裝置的用電器(四)可擴展性強,增強了系統的外接功能(五)便於更新和系統升級,可隨時嵌入更新系統程序
  • 富迪科技推出MEMS麥克風傳感器和晶片套片提供語音接口整合方案
    富迪科技 MEMS 傳感器和麥克風晶片的出貨量已超過2億5千萬顆,成為市面上前三大麥克風套片的 IC 設計公司之一。除了提供高競爭力的產品,富迪科技在可靠度、穩定性與供貨產能上更是獲得一線客戶的肯定。人工智慧崛起強化對語音識別能力的要求,促使語音成為重要人機接口,應用層面從手機拓展到智能音箱、電視與車用等終端產品,進而帶動市場對 MEMS 麥克風需求。
  • 微軟最新AI系統!使用雲端麥克風陣列,音頻轉錄精度提升22.4%
    導語:微軟利用人工智慧轉錄會議音頻,新系統使用雲端麥克風陣列。智東西9月16日消息,微軟語音和對話研究小組的科學家最近研發了一個系統,利用內置於智慧型手機、筆記本電腦和平板電腦中的麥克風來提高音頻質量。這個系統通過智能硬體連接網際網路,在雲端形成臨時的麥克風陣列,可以實時高精度轉錄音頻。
  • MEMS麥克風市場持續增長,智能音箱促進作用明顯
    智能音箱作為智能家居產品,不同於手機語音助理和耳機語音助理的近場語音識別,智能音箱往往配置MEMS麥克風陣列,採用波束成形(Beam-forming)等技術進行降噪語音處理,從而實現遠場語音識別,整個過程無需要雙手操作。對於遠場語音拾取應用,結合算法應用的要求,均需要匹配高信噪比的MEMS麥克風。麥克風陣列應用對於麥克風的靈敏度一致性,信噪比一致性及相位一致性要求都是非常高的。
  • 關於MEMS麥克風的功能分析介紹
    (sorce:internet) 為了更好地拾取聲音,現在流行的智能音箱都是採用麥克風陣列的架構。根據科大訊飛的相關科普,所謂的麥克風陣列(Microphone Array),從字面上,指的是麥克風的排列。也就是說由一定數目的聲學傳感器(一般是麥克風)組成,用來對聲場的空間特性進行採樣並處理的系統。
  • 人工智慧電視遠場語音設計
    摘要:本文介紹一種服務於人工智慧電視,實現遠場語音應用的麥克風陣列設計方案,闡述系統框架和硬體設計,同時介紹軟體設計的部分要點。通過麥克風陣列,協助語音增強算法的實現,達到遠距離拾音、回聲消除、聲源定位,滿足當前智能語音應用的需求。
  • 基於嵌入式Linux的語音識別系統硬軟體設計
    該設計運用三星公司的S3C2440,結合ICRoute公司的高性能語音識別晶片LD3320,進行了語音識別系統的硬體和軟體設計。
  • 數字麥克風和陣列拾音技術的應用
    數字麥克風適合SMT焊接,可以解決系統各種射頻幹擾對語音通信產生的噪聲,富迪科技的數字陣列麥克風拾音技術可以抑制和消除通話時的回聲和環境噪聲,數字接口方便同數字系統的連接。   模擬麥克風和數字麥克風   麥克風結構:ECM模擬麥克風通常是由振膜,背極板,結型場效應管(JFET)和屏蔽外殼組成。振膜是塗有金屬的薄膜。