基於複數浮點運算的協方差矩陣的FPGA實現

2021-01-10 電子產品世界

引言

本文引用地址:http://www.eepw.com.cn/article/201706/349296.htm

  協方差矩陣的計算是信號處理領域的典型運算,是實現多級嵌套維納濾波器、空間譜估計、相干源個數估計以及仿射不變量模式識別的關鍵部分,廣泛應用於雷達、聲吶、數字圖像處理等領域。採用FPGA(Field Programmable Gate Array)可以提高該類數位訊號處理運算的實時性,是算法工程化的重要環節。但是FPGA不適宜對浮點數的處理,對複雜的不規則計算開發起來也比較困難。故目前國內外協方差運算的FPGA實現都是採用定點運算方式。

   在充分應用FPGA並行處理能力的同時,為了擴展數據處理的動態範圍,減少數據溢出機率,避免數據截斷所產生的誤差,提高協方差矩陣的運算精度以及擴展該運算的通用性。

本文以空間譜估計作為研究背景,研究了複數據運算和浮點運算的特點,提出了一種適用於任何陣列流型、任意陣元的基於複數浮點運算的協方差矩陣的FPGA實現方案。

  1 求解複數浮點協方差矩陣

  以11陣元的均勻圓陣為例,其協方差矩陣的求解方案原理框圖如圖1所示。


  1.1 FIF0數據緩存器

  在該設計方案中選擇FIFO作為數據存儲器,這是因為一旦多路接收機有數據輸出,就會啟動FIFO進行存儲,進而FIFO的不空信號有效(empty=O),觸發後續的矩陣運算;否則,運算停止,一切狀態清零,FPGA恢復idle(空閒)狀態,等待新的快拍採樣數據的到來。

  這樣可以很方便地控制運算的開始和結束。矩陣運算所需要的同步時鐘需要設計一個類似於單穩態觸發器的模塊。當檢測到empty=『0』時,就觸發一個含有121個clk(對於串行方案而言)時鐘信號周期長度的高電平。該高電平與主時鐘相與便可以得到運算的同步時鐘。

  1.2 數據共軛轉換

  由於測向陣列的輸出矢量X(t)是一個復矢量,對其求協方差矩陣需用陣列輸出列矢量X(t)與其共軛轉置矢量XH(n)對應相乘。如式(1)所示:


  1.3 定點數到浮點數的轉換

  定點計算在硬體上實現簡單,計算速度比浮點計算要快,但是表示操作數的動態範圍受到限制,浮點數計算硬體實現比較困難;一次計算花費的時間也遠大於定點計算的花費,但是其表示的操作數動態範圍大,精度高。在本設計中,考慮到系統的數據動態範圍和運算精度,選擇浮點計算。由於運算數據是直接從接收機I,Q兩路通道的A/D變換器的輸出獲得,為定點數,因此必須要有一個將A/D採樣的定點數據轉換為浮點數的過程。設計中將16位定點數轉換為IEEE 754標準的單精度格式。32位單精度格式如圖2所示,最高位為符號位,其後8位為指數e(用移碼表示,基數f=2,偏移量為127),餘下的23位為尾數m。
  

  1.4 浮點複數乘累加器

  1.4.1 複數乘法器

  假設有兩個複數分別為a+jb和c+jd,這兩個數的乘積為:

 
  複數乘法器的工作原理如圖3所示,其中所用到的加法、減法和乘法器都是基於浮點的運算。值得一提的是,在實現浮點加減法的時候,可以將尾數連同符號位轉化為變形補碼形式後再進行加減運算。這樣做的目的是方便判斷數據是否溢出(變形補碼判斷溢出的規則是:當兩位符號位不同時表示溢出,否則無溢出。無論數據是否溢出,第一位符號位永遠代表真正的符號),若溢出,則將尾數右歸,指數部分加1,若沒有溢出,則將尾數左歸(規格化)。浮點乘法相對較簡單,對應階碼相加,尾數相乘可以採用定點小數的任何一種乘法運算來完成,只是在限定只取一倍字長時,乘積的若干低位將會丟失,引入誤差。
  

  1.4.2 浮點複數乘累加器

  以11個陣元的圓陣為例,實現串行處理方案的浮點複數乘累加器的原理如圖4所示,實部和虛部(雙通道)的乘累加器模塊工作原理一樣。

  121階數據緩存器實際上就是121個數據鎖存器級聯形成的一個移位寄存器,初始狀態為零。當浮點複數乘法器有輸出的時候,啟動數據緩存器與之進行加法操作,121個時鐘周期以後可以實現一次快拍採樣的矩陣累加。累加清零信號由時序控制器給出,當所有的快拍採樣點運算都結束之後,數據緩存器輸出累加結果(即協方差矩陣的運算結果),同時控制器送出一個清零信號,清零121階數據緩存器。

  2 仿真結果

  可編程邏輯設計有許多內在規律可循,其中一項就是面積和速度的平衡與互換原則。面積和速度是一對對立統一的矛盾體,要求一個設計同時具備設計面積最小,運行頻率最高,這是不現實的。於是基於面積優先原則和速度優先原則,本文分別設計了協方差矩陣的串行處理方案和並行處理方案,並用Altera\stratix\EP1S20F780C7進行板上調試。其調試結果表明,串行處理方案佔用的資源是並行處理方案的1/4,但其運算速度卻是後者的11倍。

  2.1 串行處理方案仿真結果

  如圖5所示,clk為運算的總控制時鐘;reset為復位控制信號,高電平有效;rd為讀使能信號,低電平有效;wr為寫使能信號,低電平有效;wr_clk為寫時鐘信號,上升沿觸發;q_clk為讀時鐘信號,上升沿觸發;ab_re(31:O)和ab_im(31:O)為乘法器輸出的實部和虛部。q_t2為矩陣乘累加模塊的同步時鐘信號;clkll,state(3:O),clkl和state(3:0)是狀態機的控制信號,控制矩陣運算規則。


  如圖5所示,在100 ns時reset信號有效(即reset=『1』),所有狀態清零。從335~635 ns間,寫使能信號有效(wr=『O』)且有兩個寫時鐘信號的上升沿到來,即向任意一個通道的FIFO中存入兩個快拍採樣數據,最後輸出結果應該有兩個矩陣,如圖6所示。當FIFO為空時,運算停止,所有狀態清零。等待新採樣數據的到來。

  圖5中,在350 ns時,讀使能有效(rd=『0』)且有一個讀時鐘信號的上升沿到來,所以empty信號存在短暫的不空(empty=『O』)狀態,捕獲到這個信息,便觸發單穩態觸發器模塊,產生具有121個clk時鐘周期長度,佔空比為120:1的q_clk信號,進行FIFO的讀操作。

  在350~535 ns時間段,因為寫時鐘信號沒有到來,所以FIFO為空(empty=『1』)。從550 ns~24.75 μs時間段讀時鐘信號沒有上升沿到來,整個設計處於第一個矩陣的運算過程中,即運算一個矩陣所需要的時間為24.2 μs。與此同時,第二個數據寫入FIFO,empty一直處於不空狀態(empty=『O』)。

  在第一個矩陣運算結束之後,即24.6μs時,系統檢測到empty=『0』,開始讀數據並觸發第二個矩陣運算的時鐘控制信號。如圖6所示,在24.6μs時,empty=『1』。FIFO中的第二個數據被讀出,處於空狀態。從24.85~49.05μs進入第二個矩陣的運算周期。
  

  在仿真時,輸人數據為16位的定點數(1+j1;O+jO;2+j2;3+j3;4+j4;5+j5,6+j6;7+j7;8+j8;9+j9;A+jA),輸出結果為32位的單精度浮點數。選擇的主時鐘周期為200 ns。在實際調試過程中,整個系統可以在50 MHz主時鐘頻率下正常工作。

  2.2 並行處理方案仿真結果

  並行方案運算原理與串行方案的一樣,只是在時鐘控制上有所區別,因為採用了11個浮點複數乘累加器,進行一次矩陣運算,只需要11個時鐘周期,如圖7,圖8所示。在仿真時,設置在寫使能信號有效(wr=『O』)的同時,有3個寫時鐘信號(wr_clk)的上升沿到來,即分別向22個FIF0中存入3個數據,則輸出有3個矩陣。從圖7中還可以清楚地看出,運算結果是矩陣的11行數據並行輸出,輸出結果是一個對稱矩陣。
  

  3 結語

  在分析了目前應用於空間譜估計的協方差矩陣運算在硬體實現上的不足,如定點計算的數據動態範圍小,運算精度不高,且只適用於特定陣列模型和的陣元數,不具備通用性。在此基礎上提出了基於浮點運算的通用型協方差矩陣的實現方案。仿真結果表明,本文所提出的實現方案採用的是複數乘法運算,最終結果得到的是復共軛對稱矩陣,適合利用任意的陣列模型和陣元數得到與之相對應的協方差矩陣。這就拓展了協方差矩陣運算的應用範圍,且整個運算過程採用的是浮點運算,提高了整個運算的精度。

相關焦點

  • 基於FPGA的複數浮點協方差矩陣實現
    O 引言 協方差矩陣的計算是信號處理領域的典型運算,是實現多級嵌套維納濾波器、空間譜估計、相干源個數估計以及仿射不變量模式識別的關鍵部分,廣泛應用於雷達、聲吶、數字圖像處理等領域。
  • 基於FPGA高精度浮點運算器的FFT設計與仿真
    摘要 基於IEEE浮點表示格式及FFT算法,提出一種基2FFT的FPGA方法,完成了基於FPGA高精度浮點運算器的FFT的設計。利用VHDL語言描述了蝶形運算過程及地址產生單元,其仿真波形基本能正確的表示輸出結果。
  • 教程| 從特徵分解到協方差矩陣:詳細剖析和實現PCA算法
    機器之心編譯參與:蔣思源本文先簡要明了地介紹了特徵向量和其與矩陣的關係,然後再以其為基礎解釋協方差矩陣和主成分分析法的基本概念,最後我們結合協方差矩陣和主成分分析法實現數據降維。本文不僅僅是從理論上闡述各種重要概念,同時最後還一步步使用 Python 實現數據降維。首先本文的特徵向量是數學概念上的特徵向量,並不是指由輸入特徵值所組成的向量。
  • 協方差矩陣是什麼_協方差矩陣計算公式_如何計算協方差矩陣
    打開APP 協方差矩陣是什麼_協方差矩陣計算公式_如何計算協方差矩陣 發表於 2017-12-05 15:58:43
  • 基於協方差矩陣的目標特徵提取與跟蹤
    本文提出了基於協方差矩陣建模的改進跟蹤中心點的確定方法。該方法在確定融合了LBP紋理特徵的目標特徵向量基礎上,建立目標區域協方差矩陣作為模板矩陣,並從下一幀中提取協方差矩陣,與模板矩陣進行矩陣相似性度量,形成相似度矩陣,使用閾值進行矩陣元素的選擇,並計算剩餘元素的權值,再按重心公式確定跟蹤中心點。
  • 基於FPGA IP核的FFT實現
    目前現有的文獻大多致力於研究利用FFT算法做有關信號處理、參數估計、F+FT蝶形運算單元與地址單元設計、不同算法的FFT實現以及FFT模型優化等方面。而FPGA廠商Altera公司和Xilinx公司都研製了FFT IP核,性能非常優越。在FFT的硬體實現中,需要考慮的不僅僅是算法運算量,更重要的是算法的複雜性、規整性和模塊化,而有關利用FFT IP核實現FFT算法卻涉及不多。
  • ML基礎:協方差矩陣!
    下面根據舉一個例子來對協方差形象的解釋:協方差矩陣是實對稱矩陣,實對稱矩陣的性質:實對稱矩陣的不同特徵值對應的特徵向量時正交的實對稱矩陣的特徵值是實數,特徵向量是實向量實對稱矩陣必可對角化,且其相似對角矩陣的對角線元素為n個特徵值協方差矩陣中的對角線元素表示方差, 非對角線元素表示隨機向量 X 的不同分量之 問的協方差.
  • 基於FPGA的高速流水線浮點乘法器設計與實現
    同時由於基於IEEE754 標準的浮點運算具 有動態範圍大,可實現高精度,運算規律較定點運算更為簡捷等特點,浮點運算單元的設計 研究已獲得廣泛的重視。本文介紹了 32 位浮點乘法器的設計,採用了基4 布思算法,改進的4:2 壓縮器及布思 編碼算法,並結合FPGA自身特點,使用流水線設計技術,在實現高速浮點乘法的同時,也 使是系統具有了高穩定性、規則的結構、易於FPGA 實現及ASIC 的HardCopy 等特點。
  • 方差-協方差法VaR計量模型選擇
    本文將對方差—協方差法中計算VaR的一些典型模型做簡要介紹,利用大盤及板塊做實證研究以對比基於各種模型計算的VaR對市場風險的刻畫效果,即VaR的有效性,並給出相應結論,以供在選擇模型時參考。
  • ARM 浮點運算詳解
    一:早期ARM上的浮點模擬器:早期的ARM沒有協處理器,所以浮點運算是由CPU來模擬的,即所需浮點運算均在浮點運算模擬器(float math emulation)上進行,需要的浮點運算,常要耗費數千個循環才能執行完畢,因此特別緩慢。
  • 用FPGA實現FFT算法
    快速傅立葉變換(Fast Fourier Transformation,簡稱FFT)使DFT運算效率提高1~2個數量級。其原因是當N較大時,對DFT進行了基4和基2分解運算。FFT算法除了必需的數據存儲器ram和旋轉因子rom外,仍需較複雜的運算和控制電路單元,即使現在,實現長點數的FFT仍然是很困難。
  • 【華泰金工林曉明團隊】不同協方差估計方法對比分析
    投資者通常採用樣本協方差作為對真實協方差矩陣的估計,該方法需要估計的參數眾多,誤差較大,為此學者們提出了包括稀疏矩陣、因子模型、壓縮估計在內的一系列改進算法。本文正是要討論各類協方差估計方法的優劣及適用場景,主要內容包括:1、採用一套統一、透明的評價體系來評估各個算法的估計效果,保證結果的可比性;2、基於模擬數據驗證各類算法能否達到其理論設計目標;3、基於大類資產、一級行業、股票的真實交易數據驗證各類複雜協方差估計方法相比於樣本協方差的改善程度,並針對不同配置場景(大類資產、行業、股票)提供實操建議。
  • 基於ADSP-TS101S的超分辨測向算法硬體設計
    MUSIC算法的過程為先計算陣列接收數據的協方差矩陣R,對R進行特徵分解求出其特徵值和特徵向量。根據特徵值可以確定信號源的數量,利用由特徵向量組成的信號子空間和噪聲子空間的正交關係,對兩個子空間進行適當的處理,確定無線電信號來波方向。
  • 用FPGA實現FFT算法(圖)
    快速傅立葉變換(fast fourier transformation,簡稱fft)使dft運算效率提高1~2個數量級。其原因是當n較大時,對dft進行了基4和基2分解運算。fft算法除了必需的數據存儲器ram和旋轉因子rom外,仍需較複雜的運算和控制電路單元,即使現在,實現長點數的fft仍然是很困難。
  • 基於CORDIC算法的32位浮點三角超越函數之正餘弦函數的FPGA實現
    關鍵詞: CORDIC;自定義指令;IEEE-754標準化處理引言浮點超越函數的應用領域十分廣泛,涉及航空航天、機器人技術、實時語音、圖像信號處理、濾波技術、FFT變換等領域。因此,設計並實現浮點三角超越函數是非常重要的。
  • 期望、方差與協方差
    方差期望幫助我們得到了每一局能夠期望得到的平均收益,但是如果每一次都賠錢的話,那麼賭博的樂趣在哪兒?誰還願意去賭博?期望只是表示每一局都會賠錢但是並不是表示一丁點贏錢的機會都沒有。和均值一樣,期望也有它的局限性,並沒有全面體現每一局有可能存在的收益,這時候我們就需要用到方差。
  • 矩陣與矩陣乘積簡介
    矩陣乘積接下來我們將在數據科學基礎數學中學習乘積。矩陣的等價運算稱為矩陣乘積或矩陣乘法,它接受兩個矩陣並返回另一個矩陣。這是線性代數中的一個核心運算。矩陣乘積的更簡單的情況是介於矩陣和向量之間(可以將其視為矩陣乘積,其中一個向量只有一列)。上圖說明了矩陣和向量之間乘積的步驟。
  • 三菱PLC浮點運算應用指令
    浮點運算應用指令能實現浮點數的轉換、比較、四則運算、開方運算、三角函數等功能,浮點運算應用指令大都為32位指令。一、二進位浮點比較與區間比較指令本文引用地址:http://www.eepw.com.cn/article/201612/331348.htm二進位浮點比較ECMP指令比較源操作數S1與源操作數S2內的32位二進位浮點數,根據大小一致比較結果,對應輸出驅動目的操作數D指定軟元件開始的連續3個位軟元件的狀態,二、二進位浮點數與十進位浮點數轉換指令二進位浮點數轉換為十進位浮點數
  • 基於改進的CORDIC算法的FFT復乘及其FPGA實現
    在FFT運算中,核心操作是蝶形運算,而蝶形運算的主要操作是向量旋轉,實現向量旋轉可用複數乘法運算來實現,但複數乘耗費了FFT運算中大量的乘法器資源。CORDIC算法只需簡單的移位與加減運算就能實現向量旋轉,具有使用資源少、硬體規模小等優勢。因此在FFT蝶形運算中用其代替傳統FFT運算中的複數乘法器,可以獲得更好的性能。
  • 協方差與相關係數
    協方差協方差這個玩意兒,好多同學仍舊是一頭霧水,而後面再加上相關係數更是讓人一臉懵逼,今天我們就來認認真真研究下。在此之前呢,我們來看一下方差。方差總該知道是啥吧?假設有這麼兩個集合:[0,8,12,20]和[8,9,11,12]兩個集合呢,均值都是10,但顯然兩者的差別還是蠻大的,我們通過計算方差即可得出二者的差異:第一個集合表現的比較動蕩(不是放蕩),第二個集合表現比較平穩,方差就是衡量這個的。好啦,既然有了方差,問題又來了。假設你統計了兩組樣本: