1 概述
本文引用地址:http://www.eepw.com.cn/article/79625.htm如今的低功耗微控制器(μC)也開始集成原先只存在於大型微處理器、ASIC和DSP中的外設功能,使我們有可能以很低的功耗實現複雜的算術運算。本文討論一種快速傅立葉變換(FFT)應用,並在一個含有單周期硬體乘法器的低功耗μC上實現該應用。這個FFT應用實時計算一路輸入電壓(圖l中VIN)的頻譜。為完成該任務,用一片模數轉換器(ADC)對VIN進行採樣,獲得的採樣傳送給μC。然後,μC對這些採樣執行256點FFT運算,獲得輸入電壓的頻譜。為便於檢測,μC將計算出的頻譜數據傳送給PC,由PC實時顯示出來。
該FFT應用的固件針對MAXQ2000系列中的一款16位、低功耗μC用C語言編寫。有興趣的讀者可以下載該項目的固件和電路原理圖(http:∥www.maxim -ic.corn.cn/images/appnotes/3722/3722Firm -ware.zip)。編寫FFT代碼絕非易事。低功耗μC的一些局限又進一步使該任務複雜化。
存儲器:我們所選的μC有2 kB的RAM。已經知道該算法需要用到2N個16位變量來存儲FFT數據,這樣,μC可以執行N最高為512的FFT。然而,固件的其他部分也要用到一些RAM。因此,在此項目中,限制N於256。若採用16位變量來表示每個值的實部和虛部,FFT數據總共需要1 024位元組的RAM。
速度:低功耗μC儘管具有高MI/s/mA性能,仍然需要一些優化手段來使運行FFT的指令數儘可能少。好在本應用所用的C編譯器(IAR的Em-bedded Workbeneh for MAXQ,見www.iar.com)可提供多種級別的優化和設置。高效地使用硬體乘法器可使代碼優化到可以接受的水平。
無浮點能力:所選的μC不具備浮點能力(低功耗產品一般都不具備浮點能力)。因此,所有運算都必須採用定點算法。為了表示小數,固件採用帶符號的Q 8.7表示法。這樣,在固件中假定:
●第O位至第6位代表小數部分;
●第7位至第14位代表整數部分;
●第15位代表符號位(二的補碼)。
這樣的安排對於加法和減法沒有影響,但在做乘法時必須注意將數據按照Q8.7格式對齊。
所選的數據表示法還要適應FFT算法可能遇到的最大數值,同時又要提供足夠的精度。例如,我們的ADC可提供帶符號的8位採樣,以二的補碼表示。如果輸入為最大幅度(對於帶符號8位採樣為127)的直流電壓,則其能譜全部包含於X(0)中,用Q8.7表示為32 512。這個數值能夠用單個帶符號的16位數據表示。
2 固件
以下部分討論在低功耗μC上執行Radix-2FFT的固件實現。信號採樣由ADC讀出後被存儲在x_n_re數組中。這個數組代表X(n)的實部。虛部存儲在x_n_im數組中,在開始運行FFT前初始化為零。完成FFT後,計算結果取代原始採樣數據,被存儲在x_n_re和x_n_im中。
2.1 獲取採樣
FFT算法假定採樣是以固定的取樣頻率獲得的。在為FFT獲取採樣時如果不加小心將會產生一些問題。例如,採樣間隔的抖動就會給FFT結果引入誤差,應盡力減小。
清單1.兩種ADC採樣偽碼算法
ADC採樣循環中的判決語句會造成採樣間隔的抖動。例如,系統從ADC讀取帶符號的8位採樣,並將其存儲在一組16位變量中。程序清單1中給出了兩種偽碼算法,執行ADC讀取-存儲功能。算法l給出的方法會造成採樣間隔的抖動,因為負採樣比正採樣需要更多的時間來讀取並存儲。
2.2 三角函數表
本FFT算法通過查表(LUT)而非計算得到正弦或餘弦函數值。程序清單2給出了對於正弦和餘弦LUT的聲明。實際固件的注釋中包含了自動生成這些LUT的原始碼,可由程序調用。兩個LUT均含有N/2分量,因為旋轉因子的索引號變化範圍為0至N/2-1(見圖2)。
這些LUT中的數組被聲明為const,強制編譯器將它們存儲於代碼空間而非數據空間。由於LUT數值須採用Q8.7表示法,它們由正弦和餘弦的實際值乘以27後得到。
2.3 位反轉
位反轉排序(N已知)可在運行時通過計算、查表或直接利用展開循環編寫。所有這些方法都需要在原始碼的尺寸和運行速度間進行折衷。本FFT應用利用展開循環進行位反轉,其原始碼較長,但運行速度快。程序清單3顯示了該展開循環的實現。本應用固件的注釋中包含了用於程序自動生成展開循環的原始碼。
清單3.用於實現N=256的位反轉的展開循環
2.4 Radix-2 FFT算法
採樣按照位反轉方式重新排序後就可進行FFT運算了。本Radix-2 FFT應用的固件通過三個主循環執行圖2所示的蝶型運算。外循環計數log2(N)級FFT運算。內循環執行每一級的蝶型運算。
FFT算法的核心部分是執行蝶型運算的一小塊代碼。程序清單4給出了這一塊代碼,遺憾的是,它是本應用中唯一「不可移植」的固件。宏MUL_1和MUL_2利用C的硬體乘法器執行單指令周期乘法運算。這些宏的內容專用於MAXQ2000,可在實際固件中全部看到。
2.5 複數的極坐標轉換
為了便於確定VIN頻譜的幅度,必須將複數形式的X(K)轉換為極坐標形式。實現該轉換的固件示於程序清單5。幅度值取代了原始的FFT結果,因為固件不再需要這些數據。
頻譜幅度通過一個二維LUT查表得到。第一索引為頻譜實部的高4位(MSB),第二索引為頻譜虛部的高4位。為得到這些數據,可將帶符號的16位數據右移11次。在從頻譜的實部和虛部取得索引號前,需首先將它們轉換為絕對值。因此,符號位為零。
頻譜的幅度是關於X(N/2)對稱的,因此只需將前(N/2)+1個頻譜數據轉換為極坐標形式。還有,我們可以看到,對於實數輸入採樣,X(0)和X(N/2)的虛部總為零,因此這兩條譜線的幅度被單獨計算。本項目實際固件的注釋中包含了用於自動生成該LUT的原始碼,可由程序調用來計算X(k)的幅度。
2.6 Hamming或Hann窗
此項目固件還包括了對輸入採樣加Hamming或Hann窗的LUT(Q8.7格式)。加窗函數可有效降低對時域採樣X(n)的捨入操作所引起的頻譜洩漏。Hamming和Hann窗函數分別如式l和2所示。
程序清單6給出了實現這些函數的代碼。同樣,本項目實際固件的注釋中包含了用於自動生成這些LUT的原始碼,可由程序調用來實現這些窗函數。
3 測試結果
為了測試該FFT應用的性能,固件將X(K)幅度通過μC的UART埠上傳給PC。專門編寫的FFTGraph軟體(隨該項目固件一起提供)用於從PC串口讀取這些幅值,並以圖形方式實時顯示頻譜。圖3顯示了μC以200 kS/s採樣四種不同輸入信號並處理後,由FFT Graph所顯示出來的結果。