基於FPGA IP核的FFT實現與改進

2021-01-10 電子產品世界

摘要 利用FPGA IP核設計了一種快速、高效的傅立葉變換系統。針對非整數倍信號周期截斷所導致的頻譜洩露問題,提出了一種通過時輸入信號加窗處理來抑制頻譜洩露的方法。利用Modelsim和Matlab對設計方案進行了仿真,同時在Altera公司的CycloneⅡ硬體平臺上進行了驗證。驗證結果表明,系統性能良好,改進效果明顯。

本文引用地址:http://www.eepw.com.cn/article/201610/306475.htm

FFT是離散傅立葉變換(DFT)的一種快速算法,被廣泛應用於頻譜分析、音頻編碼、圖像處理等數位訊號處理領域。FFT運算複雜,需要大量的存儲器和運算單元,其硬體實現平臺多種多樣。DSP需要外置存儲器和特定接口,限制了運算速度。ASIC雖能滿足速度要求,但其硬體電路複雜、可擴展性差、且價格昂貴。FPGA具有陝速並行運算、高集成度、低功耗等特點,且具有豐富的IP核資源,方便調用,適合FFT算法的實現。

對於512點FFT處理器,如果該512個輸入數據不是信號周期的整數倍,即非整數倍周期截斷,則會出現頻譜洩露現象。窗函數處理的宗旨是減小頻譜洩露。常規的FFT硬體實現方法均不考慮由於非整數倍截斷導致的頻譜洩露問題。針對以上問題,本文設計了一種基於Altera IP核的512點FFT系統,同時通過對輸入信號的加窗處理,抑制了非整數倍信號周期截斷所產生的頻譜洩露。

1 原理概述

1.1 FFT原理

離散傅立葉變換(DFT)算法為

FFT為DFT的快速算法,其方法多種多樣,基本可以分為按時間抽取法和按頻率抽取法兩類。此處介紹基-4頻率抽取法。令N=4M,對式(1)N點的DFT可按如下方法作按頻率出抽取

4個等式可定義為一個蝶形運算,蝶形運算可看作基-4FFT基本運算單元。參與蝶形運算的4個節點是有規律的,分別為(n)、(n+N/4)、(n+2N/4)和(n+3N/4)。接著再將X(4r)、X(4r+1)、X(4r+2)和X(4r+3)分別分解為4個長度為N/16的序列,基本結構是每一級的運算由N/4個蝶形運算構成,經過迭代log4N次後完成計算。FFT算法的本質是利用係數

的共軛對稱性和周期性,將長序列DFT分解成短序列DFT,避免了大量的重複運算,從而提高運算效率。

1.2 窗函數原理

當對輸入信號非整數倍周期截斷,即512個輸入數據不是輸入信號周期的整數倍時,會出現頻譜洩露現象。對輸入信號進行加窗處理,可以有效地抑制頻譜洩露。常用的窗函數有矩形窗(Rectangle Window)、漢寧窗(Hanning Window)、海明窗(Hamming Window)、布拉克曼窗(Blackman Window)等,不同的窗函數具有不同的特點,表現在主瓣旁瓣寬度,頻率識別精度及幅度識別精度等方面。圖1為Matlab仿真圖,分別為原始信號,原始信號加窗(海明窗)結果,原始信號做512點FFT結果,原始信號加窗後再做512點FFT結果,這4幅圖直觀形象地描述了時域信號做FFT後的頻域結果,以及原始信號是否加窗對FFT結果的影響。

2 FFT IP核

FFT IP核是高速執行的,參數可配置的FFT處理器,可以實現複數形式的FFT變換和IFFT變換。想要正確地使用FFT IP核,首先需要了解其引擎結構、數據流結構和關鍵管腳信號。

2.1 引擎結構

FFI IP核有兩種不同的引擎結構:四輸出和單輸出,結構如圖2(a)和圖2(b)所示。核心區別在於FFT蝶形處理器的吞吐量。一個時鐘周期內,四輸出結構可以計算出所有4個蝶形輸出,單輸出結構可以計算出一個蝶形輸出。

2.2 數據流結構

FFI IP核支持流、變量流、緩衝突發、突發4種數據流結構。流結構允許連續輸入數據,同時輸出連續的複數數據流。變量流產生一個與流結構類似的連續輸出數據流。緩衝突髮結構需要存儲資源相對較少,但平均吞吐量也相應降低。突髮結構的執行過程與緩衝突髮結構類似,對於給定的參數設置,突髮結構需要更少的存儲資源。

其中,clk為時鐘信號;reset_n為復位信號;inverse為FFT處理器變換模式選擇信號,選擇FFT或IFFF;sink_valid為輸入數據有效信號;sink_sop為輸入第一個數據標誌信號;sink_eop為輸入最後一個數據標誌信號;sink_real為輸入實部數據;sink_imag為輸入虛部數據;sink_error為輸入錯誤標誌;source_ready為輸出等待狀態標誌;sink_ready為輸入等待狀態標誌;source_error為輸出錯誤標誌;source_real為結果實部數據;source_imag為結果虛部數據;source_exp為結果補償係數;source_valid為結果有效信號;source_sop為

輸出第一個數據標誌信號;source_eop為輸出最後一個數據標誌信號。

3 方案設計

系統主要由三部分組成:A/D採集模塊、FPGA處理模塊及MCU運算顯示模塊,系統框圖如圖4所示。A/D採集外部信號數據,將其存入FPGA內部緩存RAM。當FFT輸入有效時,讀取緩存中的數據,同時與窗函數表中的對應係數做乘法運算,結果輸入FFT核中,FFT核處理結束後將數據存入緩存RAM中。單片機讀取緩存RAM中的結果數據,進行相應的模值計算,並通過LCD顯示結果頻譜圖形。該方案的核心在於窗函數與FFT運算核的設計與實現。

3.1 窗函數設計

前端數據緩存採用雙口RAM核,深度512,位寬8 bit,存放A/D採集到的信號數據。窗函數表採用ROM核,深度512,位寬8 bit,存放窗函數數據。通過Matlab生成512點Hamming窗函數係數表,由於該數據為浮點數,而本設計中全部採用定點運算,故對窗函數係數進行256倍放大,將其變為定點整數,數據範圍為0~255。將係數表生成mif文件,作為ROM的初始化文件。該RAM和ROM採用同一套讀出地址,保證相應數據同步讀出,做乘法運算,得到16 bit結果數據。由於Hamming窗數據是實際數據的256倍,所以需要對乘法結果進行右移8位操作,得到8bit FFT輸入數據。設計模塊如圖5所示,該模塊實現了輸入信號數據的加窗處理。

3.2 FFT核設計

FFT核採用MegaWizard FFT v11.1,變換點數選擇512,數據精度8 bit,引擎結構選擇單輸出結構,引擎數為1,I/O數據流結構選擇突發(Burst)結構。FFT輸出數據有3種:實部數據、虛部數據和補償指數數據。採用兩個雙口RAM核,深度均為512,寬度均為8 bit,分別存放

FFT核的實部結果數據和虛部結果數據。由於每512個FFT輸出數據,補償指數均相同,所以設置一個8 bit的寄存器存放補償指數即可。設計模塊如圖6所示,該模塊實現了加窗處理後的信號數據的快速傅立葉變換。

4 仿真與硬體驗證

4.1 系統仿真

FPGA開發環境為QuartusII 11.1,仿真環境為Modelsiml0.0。仿真時,由Matlab生成波形數據mif文件,作為仿真測試數據文件存入波形緩存RAM中。通過Quartus II調用Modesim對測試工程進行仿真,仿真時序如圖7所示。經時序分析可知,工作時鐘頻率為100 MHz(period= 10 ns),每進行一次512點處理到全部輸出處理結果共耗時36.9μs。

將仿真結果數據導入Matlab,得到結果由圖8(a)知,對信號周期整數倍截斷FFT處理後,得到單一的正確的頻譜圖;如圖8(b)知,對信號周期非整數倍截斷FFT處理後,頻譜出現嚴重洩露,且幅度值下降;如圖8(c)知,對信號周期非整數倍截斷,加窗後做FFT處理,頻譜洩露現象有明顯的改進,但幅度值因為加窗處理而相應下降。仿真結果表明,FFT系統設計正確,且加窗處理對信號周期非整數倍截斷導致的頻譜洩露問題有良好的改進效果。

4.2 硬體驗證

ADC選用ADS9238,它是一款高速高動態範圍A/D轉換器,12 bit,最高採樣時鐘達65 MSample·s-1。MCU選用c8051F120單片機,LCD選用ZLG320240K-FFSSWE-YBC,解析度為320×240,可以滿足字符、漢字及圖形等各種顯示需求。FPGA選用Altera公司的Cyclone II EP2C8Q208 C8N,該晶片資源豐富,包含8256個LEs,36個4 kbit Block RAM,18個內部乘法器和208個I/O資源,並支持FFT IP核。

FFT處理時鐘為100 MHz,A/D採樣率為10 MHz,採樣點數為512,故頻譜解析度f=10 MHz/512=19.531 kHz。當輸入信號為390.625 kHz時,512個採樣點表示20個信號周期;當輸入信號為400.390 kHz時,512個採樣點表示20.5個信號周期。在加窗和不加窗兩種情況下分別對頻率為390.625 kHz和400.390 kHz的正弦信號進行採樣,得到如圖9的結果。

圖9中(a)為不加窗的情況下對390.625 kHz的輸入信號進行採樣,由於512個點正好是20倍截斷,所以只在頻譜的第20個點有單一幅值,說明FFT系統工作正常。而且由於是整數倍截斷,結果沒有頻譜洩露;圖9(b)為不加窗的情況下對400.390 kHz的輸入信號進行採樣,由於512個點正好為20.5倍截斷,非整數倍截斷,所以結果中存在嚴重的頻譜洩露;圖9(c)為加窗的情況下對400.390 kHz的輸入信號進行採樣,可以看到,頻譜洩露現象得到較好的改善。硬體測試結果表明,FFT系統設計正確,且加窗處理對信號周期非整數倍截斷導致的頻譜洩露問題有良好的改進效果。

5 結束語

本文利用Altera公司的IP核設計了一種FFT系統,該方法設計簡單、資源利用率高、運算速度快,試驗證明具有良好性能。同時針對非整數倍周期截斷導致的頻譜洩露問題,提出了一種通過加窗改進的方法,經硬體平臺驗證,其改進效果明顯。由於加窗導致的幅值變化問題,本文尚未作詳細論證,有待進一步的研究。

相關焦點

  • 基於FPGA IP核的FFT實現
    目前現有的文獻大多致力於研究利用FFT算法做有關信號處理、參數估計、F+FT蝶形運算單元與地址單元設計、不同算法的FFT實現以及FFT模型優化等方面。而FPGA廠商Altera公司和Xilinx公司都研製了FFT IP核,性能非常優越。在FFT的硬體實現中,需要考慮的不僅僅是算法運算量,更重要的是算法的複雜性、規整性和模塊化,而有關利用FFT IP核實現FFT算法卻涉及不多。
  • 用FPGA實現FFT算法(圖)
    快速傅立葉變換(fast fourier transformation,簡稱fft)使dft運算效率提高1~2個數量級。其原因是當n較大時,對dft進行了基4和基2分解運算。fft算法除了必需的數據存儲器ram和旋轉因子rom外,仍需較複雜的運算和控制電路單元,即使現在,實現長點數的fft仍然是很困難。
  • 基於fpga二維小波變換核的實時可重構電路
    項目背景及可行性分析本文引用地址:http://www.eepw.com.cn/article/266432.htm  2.1 項目名稱及摘要:  基於fpga二維小波變換核的實時可重構電路  現場可編程門陣列為可進化設計提供了一個理想的模板
  • 基於DSP的FFT算法實現
    基於DSP的FFT算法實現1、FFT的原理快速傅氏變換(FFT)是離散傅氏變換的快速算法,它是根據離散傅氏變換的奇、偶、
  • 用FPGA實現FFT算法
    FFT算法除了必需的數據存儲器ram和旋轉因子rom外,仍需較複雜的運算和控制電路單元,即使現在,實現長點數的FFT仍然是很困難。本文提出的FFT實現算法是基於FPGA之上的,算法完成對一個序列的FFT計算,完全由脈衝觸發,外部只輸入一脈衝頭和輸入數據,便可以得到該脈衝頭作為起始標誌的N點FFT輸出結果。
  • 基於FPGA高精度浮點運算器的FFT設計與仿真
    摘要 基於IEEE浮點表示格式及FFT算法,提出一種基2FFT的FPGA方法,完成了基於FPGA高精度浮點運算器的FFT的設計。利用VHDL語言描述了蝶形運算過程及地址產生單元,其仿真波形基本能正確的表示輸出結果。
  • 基於FPGA和IP核的FIR低通濾波器的設計與實現
    打開APP 基於FPGA和IP核的FIR低通濾波器的設計與實現 秩名 發表於 2012-12-03 11:50:23   FIR
  • 基於FPGA的可配置FFT IP核實現研究
    摘要 針對FFT算法基於FPGA實現可配置的IP核。採用基於流水線結構和快速並行算法實現了蝶形運算和4k點FFT的輸入點數、數據位寬、分解基自由配置。用FPGA實現FFT處理器具有硬體系統簡單、功耗低的優點,同時具有開發時間較短、成本較低的優勢。基於FPGA實現的數位訊號處理系統具有較高的實時性和嵌入性,並能方便地實現系統集成與功能擴展。基於FPGA的硬體實現FFT通常有兩種方法:(1)並行方法,其採用多個蝶形處理器並行運算,能對較高的數據採樣率進行運算,但其硬體規模較大,當在FPGA上要實現較大點數的FFT時較為困難。
  • 基於改進的CORDIC算法的FFT復乘及其FPGA實現
    在FFT運算中,核心操作是蝶形運算,而蝶形運算的主要操作是向量旋轉,實現向量旋轉可用複數乘法運算來實現,但複數乘耗費了FFT運算中大量的乘法器資源。CORDIC算法只需簡單的移位與加減運算就能實現向量旋轉,具有使用資源少、硬體規模小等優勢。因此在FFT蝶形運算中用其代替傳統FFT運算中的複數乘法器,可以獲得更好的性能。
  • 用C語言實現FFT算法
    /*****************fft programe*********************/#include typedef.h #include math.h本文引用地址:http://www.eepw.com.cn/article/150637.htmstruct compx
  • 基於DSP和FPGA的機器人聲控系統設計與實現
    2 系統硬體總體設計 系統的硬體功能是實現語音指令的採集和步進電機的驅動控制,為系統軟體提供開發和調試平臺。如圖1所示。 系統硬體分為語音信號的採集和播放,基於dsp的語音識別,fpga動作指令控制、步進電機及其驅動、dsp外接快閃記憶體晶片,jtag口仿真調試和鍵盤控制幾個部分。
  • 基於FPGA IP核的線性調頻信號脈衝壓縮-電子發燒友網
    基於FPGA IP核的線性調頻信號脈衝壓縮 張 旭,李 巍 發表於 2011-06-29 10:40:20     近年來,隨著現場可編程門陣列(FPGA)在雷達信號處理中的廣泛應用以及FPGA
  • 基於FPGA的實時中值濾波器硬體實現
    在許多實際應用場合,如高清視頻監控、X光圖像的降噪等,需要快速且實時地進行中值濾波,軟體實現達不到實時處理的要求,因此選用硬體實現。 在硬體實現上,文獻[1]、[2]等採用行延遲的方法形成鄰域數據,以實現3×3的中值濾波。文獻[7]為了提高紅外成像跟蹤器設計了大窗口的中值濾波器。
  • 基於FPGA的伺服驅動器分周比設計與實現
    為此提出一種基於FPGA的整數分周比實現方法。該方法邏輯結構簡單,配置靈活,易於擴展,具有很高的實用價值。  1 電子齒輪比與分周比  電子齒輪比與分周比是數控工具機和數控加工中心中一個很重要的概念。國外的各種驅動器一般都帶有分周比功能,對利用FPGA實現分周比進行研究和探討,電子齒輪比、分周比功能示意圖如圖1所示。
  • 基於FPGA的FFT算法硬體實現
    基於FPGA的FFT算法硬體實現
  • 基於FPGA的複數浮點協方差矩陣實現
    故目前國內外協方差運算的FPGA實現都是採用定點運算方式。 在所有運算都是定點運算的情況下,每次乘法之後數據位寬都要擴大一倍。若相乘後的數據繼續做加減運算,為了保證數據不溢出,還必須將數據位寬擴展一位,而協方差矩陣的運算核心就是乘累加單元,隨著採樣點數的增加,位寬擴展呈線性增加。最終導致FPGA器件資源枯竭,無法實現設計。
  • 聲納圖像動態範圍擴展與FPGA實現
    基於課題組研製的多波束成像聲納原理樣機的研製,分析了數據動態範圍壓縮導致圖像細節丟失的原因及其對成像質量的影響,採用JPL快速平方根近似算法改善了開方運算FPGA實現過程的資源佔用和系統延時。最後,對改進設計方案進行了實驗驗證,通過多波束成像聲納系統的消聲水池實驗證明了本文動態範圍擴展方法的有效性和可行性,系統成像質量改善明顯,達到優化設計的預期目標。
  • 一種基於FPGA的實時紅外圖像預處理方法
    針對這一問題,提出一種基於FPGA的實時紅外圖像預處理方法。該方法採用了流水線技術來並行完成非均勻校正、空間濾波、直方圖統計等多個紅外圖像預處理算法,對系統結構進行了改進和優化。經過實驗測試驗證,該方法合理可行,能夠實時高效地完成紅外圖像預處理任務。與DSP圖像預處理系統相比可以節約將近50%的處理時間。
  • 基於MSP430系列微控制器的FFT算法實現
    TI公司的MSP430系統微控制器具有功耗低、供電範圍寬及外圍模塊齊全等特點,適合實現各種監測設備。採用MSP430系列微控制器實現FFT算法具有超低功耗、低電壓工作、低成本、分析速度快等優點,它比採用專用晶片和DSP晶片價格便宜,比採用FPGA晶片容易實現。1 利用微控制器實現FFT算法快速傅立葉變換在信號處理中的線性濾、相關計算、譜分析等方面起著重要的作用。
  • 基於FPGA的高速流水線FFT算法實現
    FPGA(現場可編程門陣列)是一種具有大規模可編程門陣列的器件,不僅具有專用集成電路(ASIC)快速的特點,更具有很好的系統實現的靈活性。FPGA可通過開發工具實現在線編程。與CPLD(複雜可編程邏輯器件)相比,FPGA屬寄存器豐富型結構,更加適合於完成時序邏輯控制。因此,FPGA為高速FFT算法的實現提供了一個很好的平臺。