基於DSP的語音降噪系統設計

2020-12-13 donews

在現實的語音通信中會不可避免地受到來自環境中的背景噪聲影響,致使通信質量嚴重下降,甚至聽不清楚對方講話的內容,因此對帶噪語音信號進行降噪已經成為語音通信中的一個非常迫切的課題。近年來,隨著VLSI技術的發展和高速DSP晶片的出現,語音增強方法走向實用化[1]。本文所介紹的語音降噪系統能夠有效地實現數字降噪功能,由於降噪處理時不但要進行信號的採集與回放,還要進行降噪算法的實時處理,採用具有高速實時處理能力的DSP TMS320VC5509進行處理,能夠滿足日常生活中語音通信中的降噪要求。

1 降噪系統設計    

1.1 硬體系統結構圖

本系統採用TI公司的TMS320VC5509晶片進行信號處理和譜相減算法的處理,語音降噪系統如圖1所示。系統採用12 MHz的晶振為DSP提供時鐘,DSP內部工作時鐘採用PLL方式設置成16倍頻,使DSP的內部時鐘達到192 MHz。語音採集與回放模塊採用TLV320AIC23語音編解碼晶片。CPLD XC95114提供讀寫Flash AM29LV800B和配置,啟動語音編解碼模塊AIC23的控制信號。供電模塊採用TPS73HD301,分別提供DSP晶片所需的1.6 V內核電壓和3.3 V的I/O電壓。

1.2 主要電路原理分析

圖2為5509DSP與TLV320AIC23的接口原理圖。

音頻Codec晶片TLV320AIC23通過外圍器件對其內部寄存器進行編程配置,使用靈活,其配置接口支持SPI總線接口和I2C總線接口,  數據傳輸格式支持右判斷模式、左判斷模式、I2S 模式和DSP模式4種方式,其中TI 模式專門針對TI DSP設計[2,3]。C5509的多通道緩衝串口MCBSP可以配置為SPI總線接口,其串行數據傳輸格式與TLV320AIC23的DSP模式兼容,此外,這兩款晶片的I/O電壓兼容,從而使得C5509與TLV320AIC23可以無縫連接,系統設計簡單。

MODE引腳作為串行接口輸入模式選擇端,0為I2C模式,1為SPI模式;由於C5509片內外設含有I2C模塊,直接使用C5509的I2C模塊控制TLV320AIC23,此時C5509作為I2C總線的主設備,TLV320AIC23作為從設備,通過編程完成對TLV320AIC23的配置。

TLV320AIC23的數字音頻接口採用DSP模式,將TLV320AIC23配置為主設備。與DSP的McBSP0無縫連接,將其作為雙向的數據收發通道。輸入輸出的幀同步信號LRCIN、LRCOUT分別接McBSP串口的FSX0與FSR0,時鐘信號BCLK與McBSP的串口輸出時鐘CLKX0相連,同時通過CLKX0驅動輸入串行時鐘CLKR0,以保證串口數據收發的一致與同步。SCL和SDI分別是 TLV320AIC23的控制埠和數據輸入端,分別和C5509的I2C模塊埠 SCL和 SDA 相連。

1.3 音頻信號的採集與回放

此系統中採用MICPHONE採集語音信號,把採集的語音信號經過模數變換,進入DSP後再經過濾波存儲到DSP的片內存儲空間。然後調用譜相減算法降噪軟體進行降噪處理,得到新的處理後的數據再經過數模變換,放大後從耳機輸出。

通過MIC採集的語音信號通過TLV320AIC23語音編解碼晶片對語音進行模數轉換。TLV320AIC23是一個高性能的多媒體數位訊號編解碼器,該模塊具有模數轉換器、數模轉換器,使用了高效的 Multibit sigma-delta 和過採樣數字插補濾波技術,支持 16、20、24 和 32位格式從8 kHz~96 kHz採樣頻率的音頻信號的採集與回放,並具有較高的信噪比(SNR)和較低的能耗。利用多通道緩衝串口McBSP(multiply—channel buffer interferce)與DSP通信。把通過TLV320AIC23模數轉換後的數據通過McBSP1傳送給DSP進行降噪處理,處理後的數據經過數模轉化後傳送到耳機輸出。

2 系統算法與軟體設計

2.1 譜相減算法[4,5]

目前降噪算法具有代表性的有自相關算法、自適應噪聲濾波法、短時譜幅度估計法、譜相減算法、小波變換等。譜相減算法因具有運算量小、容易實時實現、增強效果好等特點,是目前在降噪系統中最常用的算法之一。

譜相減算法的基本原理是在頻域將噪聲的頻譜分量從帶噪語音信號的頻譜中減去。譜減的提出前提是假設語音信號與加性噪聲相互獨立,它假設噪聲是統計平穩的,即有語音期間噪聲振幅譜的期望值與無語音間隙噪聲的振幅譜的期望值相等,用無語音期間測得的噪聲頻譜的估計值取代有語音期間的噪聲頻譜,與含有噪音的語音頻譜相減,即可得到語音頻譜估計值。假設帶噪語音的模型表達式如式(1):

其中sm(n)表示純淨的語音,dm(n)表示噪聲,ym(n)表示帶噪語音。其中m=0,1,2,…,M-1;n=0,1,2,…,N-1;M、N分別表示一段語音中包含的幀數和每幀信號的長度。
    在實際中由於語音信號是不平穩的,但是具有短時平穩性,因此計算時通常要加窗處理。設Yk、Sk、dk分別表示帶噪語音,純淨語音和噪聲的傅立葉係數。對(1)式進行傅立葉變換,由於假設的語音與噪音是不相關的,可得式(2),即

譜相減算法原理圖如圖3所示

2.2 系統軟體設計

在本系統的軟體設計中,軟體系統主要包括主程序、中斷服務程序、中斷向量表和連結命令文件,其中最重要的是主程序和中斷服務程序,中斷服務程序主要功能是實現數據採集與數據更新。

系統主函數是程序執行的入口並完成需要的初始化工作。主函數中主要包括對時鐘、多通道緩衝串口McBSP1以及對AIC23的初始化配置。接著啟動串口進行正常工作,最後進行譜相減法降噪算法處理,輸出降噪後的語音信號。

在該系統中,音頻信號通過MIC被採集,然後經過TLV320AIC23語音編解碼模塊,把採集的語音信號進行信號保持、採樣、量化後轉換成數位訊號,轉換成的數字語音信號以中斷方式被DSP讀取,通過DSP的多通道緩衝串口McBSP1以數據幀的方式把數據存儲到片上緩衝區裡。當一幀數據採集完後,中斷返回到主程序對數據的進行加窗處理、FFT變換,然後再進行有聲無聲檢測,判斷是否需要進行降噪處理。處理後的數據通過McBSP1輸出到TLV320AIC23進行回放。軟體處理流程結構如圖4所示。

CPU在相應接收中斷服務程序後,在服務程序中將128個採樣值拷貝到處理緩衝區中等待處理,實現緩衝區的數據轉換,然後置1使程序進入主程序中進行降噪處理。

本系統中實時設計中的關鍵技術有加窗處理、幀間重疊、幀移位、快速傅立葉變換(FFT)、快速傅立葉反變換、定點數與浮點數的轉化。在進行FFT變換的時候必然會產生大量的數據,所以在對數據進行讀取與存儲時不可避免地要造成流水線衝突,為了解決這樣的問題,可以在產生流水線衝突的兩條指令間加上三個NOP指令[6,7]。

通過譜相減算法在DSP開發板上搭建的語音降噪系統中進行降噪實驗,實驗結果表明,本系統能夠有效地降低環境噪聲對語音的影響,能夠有效地提高信噪比,改善語音通信質量,達到降低語音通信中的背景噪聲的目的。

參考文獻

[1] 黃蘇雨,梁聲灼,黃蘇園.語音增強方法綜述[J].計算機與現代化,2007,23(3):16-20.

[2] 汪春梅,孫紅波.TMS320C5000系列DSP系統設計與開發實例[M].北京:電子工業出版社,2004.

[3] 丁祥,餘小清.音頻編解碼器TLV320AIC23及其與DSP接口設計[J].單片機與嵌入式系統,2002,2(6):35-37.

[4] 王欣,羅代升,王正勇.基於改進譜減算法的語音增強研究[J].成都信息工程學院學報,2007,22(2):201-204.

[5] 張俊.基於譜減算法語音增強的研究[J].信息技術,2009,33(3):74-76.

[6] Texas Instruments.TLV320AIC23B stereo audio CODEC datamanual[Z],2003.

[7] 北京瑞泰創新科技有限責任公司. ICETEK-VCS5509 EVM用戶使用手冊V1.0[Z],2004.

相關焦點

  • 基於DSP和USB技術的數據採集與處理系統
    1.1 數位訊號處理器dsp  dsp晶片,又稱為數位訊號處理器,是一種特別適用於進行實時數位訊號處理的微處理器,採用它能滿足系統計算量大的要求。所連的外設通過主機調度和基於令牌的協議共享usb帶寬。usb的主要優點有:(1)速度快;(2)設備配置和安裝容易。
  • 解析基於DSP的漢字語音識別系統的實現方式
    語音識別經過四十多年的發展,已經顯示出巨大的應用前景。本文從實現原理入手,介紹語音識別系統的實現方式。本文引用地址:http://www.eepw.com.cn/article/201610/309216.htm概述本漢語語音識別系統是一個非特定人的、孤立音語音識別系統。
  • 數字電路降噪語音捕獲SoC提升語音辨識度
    在這些應用中,要降低或濾除環境噪聲,提升語音通信效果,可以採用不同的方法,如專門降噪麥克風、模擬電路降噪或數字電路降噪等。這些方法各有其特點,相比較而言,採用數字電路降噪的方法靈活,聲學設計複雜度較低,且降噪效果優越。當然,便攜設備設計人員除了要提供良好的降噪效果,還面臨著多種設計約束及挑戰,如尺寸、能耗、物理聲學設計、音頻保真度及成本等。
  • 第六講 DSP在雷達信號處理中的應用
    引言 dsp是一種基於精簡指令集的可編程數學計算晶片,可以對數位訊號進行時頻域變換、頻譜分析、濾波、估值、增強、壓縮等處理,廣泛應用於家用電器、多媒體系統、雷達、衛星系統、移動通信、網絡會議、醫學儀器、實時圖像識別與處理、語音處理、自適應制導控制、模式識別、定位、導航、聯合戰術無線電系統和智能基站等領域。
  • 基於DSP的多路語音實時採集與壓縮處理系統
    因此,如一方面要求對多達8路的語音信號進行實時採集,另一方面又要求對各路的語音信號進行較高壓縮率的實時壓縮處理,對數據採集和處理系統提出了更高的要求。基於此,本文介紹的多路語音實時採集與壓縮處理系統採用了高速DSP技術。
  • dsp處理器一般哪裡用_dsp處理器應用領域分析
    多媒體通信系統所需要的圖像壓縮(目前工業標準是JPEG、MPEG-1、MPEG-2,當然還會出現一些新的算法如小波變換等)、聲音壓縮(標準有G.711、G.722、G.728、G.729等)以及傳輸所需的高速數據機都和dsp有關。隨著dsp運算速度的進一步提高和軟體開發環境的改進,可編程dsp將會成為主流而取代某些專用晶片,或者用戶將自己開發的軟體,駐留在可編程dsp上而成為專用晶片。
  • GMIS 2017大會汪德亮演講:基於深度學習的語音降噪技術
    中國科學院自動化研究所複雜系統管理與控制國家重點實驗室主任王飛躍為本次大會做了開幕式致辭,他表示:「如今人工智慧非常熱,有人說再過幾年人類甚至不如鞋底聰明,50% 甚至 70%工作被人工智慧取代。」王飛躍對此表示很震驚,但並不認同,他又說:「情況是,再過幾年,人類 90% 的工作由人工智慧提供,就像今天我們大部分工作是由機器提供的一樣。
  • 基於聲紋識別的通用語音控制系統設計
    聲音不僅可以傳達指令,還能與聲紋識別的安全系統結合,如果可以把語音控制與安全控制結合起來,系統就變得更自然直接更人性化了。在本設計就是希望通過設計出一個通用的系統為將來的這些應用實現基本的框架。1.2.編寫目的進入21世紀以來,隨著科學技術的突飛進展,語音識別與確認技術也逐漸的走向成熟,基於語音識別技術的對話控制系統受到了越來越多的關注。直接用聲音來發出控制指令,讓機器能「聽懂」你的話,執行相應的命令。
  • 基於AT89S52單片機和ISD4004語音晶片實現語音播報記事器的設計
    基於AT89S52單片機和ISD4004語音晶片實現語音播報記事器的設計 張裕,劉毅敏,方康 發表於 2020-12-16 17:57:00 引 言
  • 中文語音處理在數字助聽器的設計
    是否不同語系的不同語音特徵會影響聽覺受損患者對言語的理解,尤其是在使用基於不同語系研究成果製作成的助聽器時,這種語音的差異是否起到重要作用,最近已成為學術和科研的一個熱門課題。比如國內研製的人工耳蝸的一個特點便是在設計其算法時考慮到中文語音特點。國外助聽器廠商將在近期推出以中文語音為特徵算法的助聽器。
  • 中文語音處理在數字助聽器系統的開發
    是否不同語系的不同語音特徵會影響聽覺受損患者對言語的理解,尤其是在使用基於不同語系研究成果製作成的助聽器時,這種語音的差異是否起到重要作用,最近已成為學術和科研的一個熱門課題。比如國內研製的人工耳蝸的一個特點便是在設計其算法時考慮到中文語音特點。國外助聽器廠商將在近期推出以中文語音為特徵算法的助聽器。
  • 基於DSP的滾動軸承實時故障診斷系統設計
    本文設計的以TI公司生產的TMS320C6713為數位訊號處理器的滾動軸承實時故障診斷系統,就可以滿足中小型設備實時智能故障診斷的需要[2]。2.滾動軸承實時故障診斷系統原理滾動軸承實時故障診斷系統主要包括硬體部分和軟體部分兩個方面:(1) 硬體部分:主要用模擬電路實現共振解調技術[3-4]和數位訊號處理電路設計。
  • 基於DSP與AD7656的高速AD採集系統設計
    摘要:在某綜合控制計算機系統中為了實現對多路AD信號實時高精度採集,採用了以B為核心,與AD7656晶片相組合的高精度、實時A/D數據採集砹計實現方案。重點分析硬體接口電路的設計、PCB設計中應注意的問題和軟體設計實現流程。
  • 基於DSP NNC-PID的電液位置伺服控制系統設計
    電液位置伺服系統具有功率大、響應快、精度高的特點,這就要求控制系統不僅有良好的定位精度,而且要有好的伺服跟蹤性能,因此是控制領域中的一個重要組成部分。電液位置伺服控制系統的典型特徵是非線性、不確定性、時變性、外界幹擾和交叉耦合幹擾等,系統精確的數學模型不易建立。因此,對電液系統的控制一直是一個複雜控制系統問題。 常規PID控制器具有結構簡單、參數意義明確、控制的動態和靜態特性優良等特點。
  • ...個離在線一體語音識別解決方案,自研AI降噪算法提高30%識別準確率
    在語音識別的研發過程中,一個完整的識別鏈路可以簡化為麥克風輸入、降噪處理、語音識別、識別結果輸入四個環節。想做好識別,首先要在降噪處理上下功夫。註:圖片來自探境科技探境自研的AI降噪算法基於深度學習,不僅能夠處理穩態的噪聲,非穩態的突發性噪聲也能很好的過濾。
  • 探境科技發布首個離在線一體語音識別解決方案,自研AI降噪算法提高...
    探境自研的AI降噪算法基於深度學習,不僅能夠處理穩態的噪聲,非穩態的突發性噪聲也能很好的過濾。在語音識別的研發過程中,一個完整的識別鏈路可以簡化為麥克風輸入、降噪處理、語音識別、識別結果輸入四個環節。想做好識別,首先要在降噪處理上下功夫。
  • 基於VoiceXML技術的可視化IVR系統設計和實現(三)
    查瑋 2009/12/29 基於VoiceXML技術的可視化IVR系統設計和實現(一) 基於VoiceXML技術的可視化IVR系統設計和實現(二)   在系統分析和系統總體設計之後,就進入了系統實現階段。
  • 德州儀器推出新型 TMS320C6411 DSP
    通過提供兩款高性能嵌入式協處理器,C6416 DSP 使無線基礎設施開發人員能夠從容應對第三代服務的嚴峻挑戰,極大加速了片上語音及數據通道解碼的操作進程。一個單通道 600MHz 的 C6416 DSP 可分別以 12.2 kb/s 速度處理多達350個語音通道,以高達 384 kb/s 的速度處理35個數據通道。
  • 基於OV6630圖像傳感器和DSP的圖像採集系統設計
    0 引言 本文引用地址:http://www.eepw.com.cn/article/85790.htm  DSP是基於可編程超大規模集成電路和計算機技術發展起來的一門重要技術
  • 基於超跑概念設計 能聽交響樂的降噪產品 英國的碳纖維耳機來了
    PX7的設計比較內斂,也比較有藝術感,比如碳纖維支架上,那「斑駁鏽跡」提升了質感和品味布面、啞光、不同質感的深灰色、獨特的外輪廓曲線、基於超跑的設計靈感像PX7這種靠一根支架連耳罩的設計也挺稀有的,轉動耳罩時,那感覺很特別