基於小波包變換和壓縮感知的人臉識別算法

2021-01-09 電子產品世界

  引言

本文引用地址:http://www.eepw.com.cn/article/235426.htm

  人臉識別是一個經典的模式識別問題。壓縮感知理論的出現和發展,給人臉識別帶來了新的啟發,使得基於稀疏表示的人臉識別技術得到了廣泛研究。傳統的基於稀疏表示的人臉識別是利用壓縮感知超完備庫下的稀疏表示,將訓練圖片直接構造為冗餘字典,再求解重構算法下的最優稀疏線性組合係數,然後根據這些係數來對人臉圖像進行分類。

  鄭軼、蔡體健[1]針對人臉求解稀疏表示時正交匹配追蹤算法運算度高,提出了一種改進的算法,加快了逆矩陣和大矩陣乘積的求解,但在構成訓練字典時對光照[2]、表情[3]、姿態[4]等考慮較少。Allen Y. Yang[5]等針對壓縮感知基於最小一範數求解最優稀疏表示時算法運算度高,提出了一種凸優化算法,取得了不錯的識別率,但仍然是超完備庫下的稀疏表示。平強、莊連生[6]等針對人臉識別姿態問題提出了基於仿射變換的人臉分塊稀疏表示,提升了算法的識別性能,但仿射變換和分塊稀疏表示都增加了運算複雜度。

  本文針對上述字典構成問題,提出基於基函數字典下的稀疏表示,尋找一個正交基,使得信號表示的稀疏係數儘可能的少,小波基符合這一要求,同時小波包變換能提取人臉低頻、高頻四個頻帶的特徵,包括人臉的整體特徵和局部紋理特徵,小波包多層變換後還可以2n的速度對人臉圖像進行降維。本文在運用壓縮感知時,只利用壓縮感知對高維人臉圖片進行降維,不進行重構算法尋求最優稀疏解,大大降低了算法的複雜度。實驗結果表明本算法與相關算法比較識別率較高,運算時間基本無劣勢,對訓練樣本的數目要求較低。

  1 基本理論

  1.1 小波變換的基本理論

  小波變換是一種變換分析方法,它將原始圖像與小波基函數進行內積運算,圖像經小波分解後可得到一個近似分量和三個方向的細節分量,三個細節分量分別具有高度的局部相關性,而整體相關性能最大限度地消除。選擇小波基時具體要考慮小波基的正交性,使得各子帶間數據相關性最小;緊支性使應用精度較高,不需要人為截斷數據;小波基的對稱性也是十分重要的,因為可以構造緊支的正則小波基,從而具有線性相位[7]。

  小波包變換區別於小波變換,它不僅對信號的低頻分量進行連續分解,而且對高頻分量也進行連續分解,不僅可得到許多解析度較低的低頻分量,而且也可得到許多解析度較低的高頻分量,如圖1所示,這種變換稱之為小波包變換 [8]。

  圖1中,箭頭向左表示當前層低通濾波變換,箭頭向右表示當前層高通濾波變換。

  1.2 壓縮感知理論

  壓縮感知理論[9]指出,只要信號是可壓縮的或在某個變換域是稀疏的,那麼就可以用一個與變換基不相關的觀測矩陣將變換所得高維信號投影到一個低維空間上。壓縮感知信號稀疏表示主要有兩個方向[10],一是基函數字典下的稀疏表示,二是超完備庫下的稀疏表示。稀疏信號通過觀測矩陣投影如公式(1)所示:

 

  其中為觀測矩陣,為稀疏信號,為信號經觀測矩陣投影后所得列向量。

  將壓縮感知作為特徵提取的方法,必須保證觀測矩陣不會把兩個不同的稀疏信號映射到同一個採樣集合中,這就要求從觀測矩陣中抽取的每M個列向量構成的矩陣是非奇異的,同時需要保證觀測矩陣和稀疏基不相干。

  2 本文稀疏表示的人臉識別算法

  本文將小波包變換和壓縮感知結合應用於人臉識別,具體識別過程如圖2所示。

  2.1 二層小波包分解構成基函數字典

  根據前文描述小波包變換,2D-WPT 是一維離散小波變換的擴展,其實質是將二維信號在不同尺度上進行分解,得到原始信號的近似分量和細節分量。原始圖像經過1層2D-DWT分解後圖像被分成4個部分:近似部分,水平細節,垂直細節以及對角細節。

  近似部分是對人臉的全局描述,主要受光照、姿態和位置影響,三個細節分量是對人臉的局部細節描述,主要受表情和遮擋飾物(如眼鏡,鬍鬚等)的影響[11]。每部分圖像大小為原始圖像的四分之一大小,對圖像起到了降維的作用。

  圖3是對一幅大小為100×100的人臉圖像進行小波變換的結果。

  圖3(a)為原始人臉圖像,圖(b)為對原始圖像進行的一層小波分解,分別為原始圖像的低頻分量(左上)垂直高頻分量(右上)、水平高頻分量(左下)和對角高頻分量(右下),圖(c)為低頻分量進行兩層分解。上述小波變換選取的小波基為db1,考慮了小波基的緊支撐、高階消失矩和對稱性,db1是比較適合對人臉圖像進行小波變換的小波基,大量實驗也證明了db1在進行人臉重構時,平均重構誤差是最小的,即db1更適合提取人臉特徵,證明了分析的正確性。

  本文進行了小波包的分解,既完成了基於基函數字典下的稀疏表示,也提取了人臉識別的整體信息和局部細節信息。在構成基函數字典時,需將低頻、高頻分量分別構成列向量,最後組成一個大的列向量,保留其中的結構信息。

  小波包變換採用兩層分解,取第二層分解結果作為特徵,使得圖像維數得到降低,進而也使得降維時壓縮感知的運算量大大減少。如果小波包分解層數過多,會造成計算耗時,同時圖像信息也會因為多次分解而部分丟失。

  2.2 壓縮感知降維

  人臉圖像經小波包變換構成基函數字典後,信息具有稀疏性,同時包含人臉表情、姿態等細節信息,從而用壓縮感知進行進一步的有效信息的提取和降維,將基函數字典矩陣與觀測矩陣運算後得到一個維數較低的向量,作為人臉的最終特徵向量。最後本文用訓練圖像和測試圖像特徵向量之差二範數分類器進行分類,得到了良好的識別效果。

  本文選用的觀測矩陣為哈達瑪矩陣,它是由+1和-1元素構成的正交方陣,它的任意兩行(或兩列)都是正交的,即保證了觀測矩陣是非奇異的,符合壓縮感知對觀測矩陣的要求,同時哈達瑪矩陣也便於硬體實現。

  本文算法應用於人臉識別具體做法描述如下:

  (1)輸入c類N個訓練樣本,進行二層小波包分解將訓練樣本投映到小波域,進而構成基函數字典訓練空間A;

  (2)給定一個測試圖像,用二層小波包分解將其投映到小波域空間,進而構成測試空間x;

  (3)將訓練樣本的字典空間按結構排成列向量,運用壓縮感知計算 (i=1,2…N)將Yi的每一列作為最終進行比較的特徵向量;

  (4)將測試圖像小波域的測試空間按結構排成列向量,運用壓縮感知計算:;

  (5)在每個最終特徵向量上用 (i=1,2…N)計算特徵向量之差的二範數;

  (6)若,則x與第i個訓練樣本為同一類。

  3 實驗結果

  選用Yale人臉資料庫和ORL人臉資料庫[12]作為實驗素材,其中Yale A人臉總數165,15類,大小為,影響識別因素為光照、表情、姿態、飾物。訓練樣本為每類4幅圖片,測試圖像為每類其他7幅人臉。ORL人臉總數為400,40類,大小為,影響識別的因素為姿態。訓練樣本為每類3幅圖片,測試圖片為每類其他7幅人臉。實驗環境為Intel Core2 Duo CPU--E7500 2.93GHz,2.00GB RAM,matlab7.0(R2009a)。

  為驗證本文算法的識別率和運行時間的有效性進行了實驗,並與基於壓縮感知的FOMP人臉識別算法[1]進行了比較。如表1所示為Yale A 人臉識別結果,其中運行時間為105幅測試圖像運行總時間。如表2所示為ORL人臉識別結果,其中運行時間為240幅測試圖像運行總時間。

  (1)由表1實驗結果,本文算法因進行了小波包變換構成基函數字典,提取了整體特徵和局部細節特徵,對表情、姿態的變化魯棒性高一些,進而識別率有一定優勢。雖然本文未進行運算量高的正交匹配算法尋找最優稀疏解,小波包變換也能起到降維作用,但由於進行小波包變換佔用時間,使得本算法時間上仍有一定劣勢。

  (2)由表2實驗結果,得知兩個算法的識別率都有提升,說明壓縮感知對姿態有一定的魯棒性,而本文算法識別率上仍然有一定優勢,說明小波包變換構成基函數字典,增強了算法的姿態魯棒性。

  (3)通過對表1實驗結果分析,發現本算法錯誤識別的人臉圖像大多光照較弱或光照不均勻,說明本文算法對光照的魯棒性能較差。分析其原因,在光照較差的情況下,圖像是人臉的概貌,紋理信息較弱,使得小波包變換不能有效的提取細節特徵,影響了識別率。

  4 結束語

  本文提出了一種基於小波包變換和壓縮感知的人臉識別算法,與傳統方法相比,本文採用基函數字典表示,將小波包變換和壓縮感知相結合,充分利用了小波包變換和壓縮感知的優勢,克服其缺點,使得識別率得到了提升,時間複雜度也得到了有效的控制。同時本算法不需要對圖片進行預處理,對遮擋物、表情有很好的魯棒性。但本文算法對光照的魯棒性能較差,還需要進一步研究加以改善。

  參考文獻:

  [1]鄭軼,蔡體健.稀疏表示的人臉識別及其優化算法[J].華東交通大學學報,2012,29(1):10-14

  [2]Wagner A,Wright J.Toward a practical face recognition system: robust alignment and illumination by sparse representation[J]. IEEE Transactions on Pattern Analysis and Mac-hine Intelligence,2012,34(2):372-386

  [3]Hsieh C K,Lai S H.Expression-invariant face recognition with Constrained optical flow warping[J].IEEE Transactions on Multimedia,2009,11(4):600-610

  [4]Huang J,Yuen P C.Choosing Parameters of kernel subspace LDA for recognition of face images under pose and illumination variations[J].IEEE Transactions on Cybernetics,2007,37(4):847-862

  [5]Yang A Y,Zhou Z H.Fast L1-Minimization Algorithms for Robust Face Recognition[J].IEEE TRANSACTIONS ON IMAGE PROCESSING,2013,22(8):3234-3246

  [6]平強,莊連生,等.姿態魯棒的分塊稀疏表示人臉識別算法[J].中國科學技術大學學報,2011,41(11):975-981

  [7]李月琴,慄蘋,等.無線電引信信號去噪的最優小波基選擇[J].北京理工大學學報,2008,28(8):723-726

  [8]Chan W L,Choi H,Baraniuk R G.Coherent multiscale image processing using dual-tree quaternion wavelets[J].IEEE Transactions on Image,2008,17(7):1069-1082

  [9]Inoue K,Kuroki Y.Illumination-robust face recognition via sparse representation[C].IEEE of Visual Communications and Image Processing, 2011:1-4

  [10]Donoho D.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306

  [11]Soulard R,Carre P. Quaternionic wavelets for texture classification[J]. Pattern Recognition Letters,2011,32(13)1669-1678

  [12]Oliver research laboratory[DB/OL].http//www.uk.research.att.Com/data/att_faces.Zip.Cambridge

相關焦點

  • 基於Gabor小波與RBF神經網絡的人臉識別新方法
    上述特點使Gabor小波被廣泛應用於視覺信息理解。二維Gabor小波變換是在時頻域進行信號分析處理的重要工具,其變換係數有著良好的視覺特性和生物學背景,因此被廣泛應用於圖像處理、模式識別等領域。與傳統的傅立葉變換相比,Gabor小波變換具有良好的時頻局部化特性。
  • 一種基於小波域的分形圖像編碼改進算法
    自1995年以來,Rinaldo和Calvagno首次提出並實現了一種小波與分形圖像編碼相結合的算法[4]。此後,又出現多種小波變換與分形相結合的圖像編碼算法[5-8]。這些算法,有的證明了小波域的分形圖像解碼可以通過低解析度小波係數向高解析度係數連續外推實現,即解碼無需循環迭代,是無條件收斂的;有的通過採用平滑小波基消除重構圖像在高壓縮比時的方塊效應;有的推導出仿射變換的收縮因子取值不受限制,能保證解碼收斂;同時小波係數的樹狀結構提供了自然高效的Domain塊分類方法等[9]。
  • 學術簡報︱基於同步擠壓小波變換的抗混疊低頻振蕩模態參數識別
    廣東電網有限責任公司佛山供電局的研究人員謝家安,在2019年第12期《電氣技術》上撰文,針對經驗模態分解法對低頻振蕩信號模態提取時,存在相鄰頻率分量混疊而導致分析結果不正確的問題,本文提出基於同步擠壓小波變換的抗混疊低頻振蕩模態參數識別新方法。
  • 探秘人臉識別技術
    即將已檢測到的待識別人臉與資料庫中已知人臉進行比較匹配,得出相關信息,該過程的關鍵是選擇適當的人臉表徵方式與匹配策略,系統的構造與人臉的表徵方式密切相關。一般根據所提特徵而選擇不同識別算法進行度量,常用的包括距離度量、支持向量機、神經網絡、k均值聚類等。人臉識別技術的主要算法主流的人臉識別技術基本上可以歸結為三類,即:基於幾何特徵的方法、基於模板的方法和基於模型的方法。
  • 小波變換和motion信號處理:第一篇
    我們實驗室主要是搞圖像的,實力在全國也是很強的,進去後和師兄師姐聊,大家都在搞什麼小波變換,H264之類的。當時的我心思都不在這方面,盡搞什麼作業系統移植,ARM+FPGA這些東西了。對小波變換的認識也就停留在神秘的「圖像視頻壓縮算法之王」上面。後來我才發現,在別的很廣泛的領域中,小波也逐漸開始流行。比如話說很早以前,我們接觸的信號頻域處理基本都是傅立葉和拉普拉斯的天下。
  • 讓人臉識別算法失靈 還能抵抗微信微博照片壓縮!
    魚羊 編輯整理 凹非寺上回書說到,現在,:通過給照片添加肉眼看不出來的對抗性噪聲,來蒙蔽人臉識別AI,達到保護隱私的效果。研究人員設計了一個基於編碼-解碼的壓縮近似模型,稱為ComModel。該模型被用於學習如何像黑盒壓縮算法一樣轉換圖像,以達到近似壓縮的目的。
  • 這個對抗算法讓人臉識別算法失靈,還能抵抗微信微博照片壓縮
    上回書說到,現在,對抗攻擊的理念已經被應用到隱私保護領域:通過給照片添加肉眼看不出來的對抗性噪聲,來蒙蔽人臉識別AI,達到保護隱私的效果。步驟二:壓縮近似利用原始圖像-壓縮圖像對構成的數據集進行監督學習。研究人員設計了一個基於編碼-解碼的壓縮近似模型,稱為ComModel。該模型被用於學習如何像黑盒壓縮算法一樣轉換圖像,以達到近似壓縮的目的。其中,編碼器從原始圖像中提取多尺度特徵,如內在紋理和空間內容特徵。
  • 這個對抗算法讓人臉識別算法失靈,還能抵抗微信微博照片壓縮
    魚羊 編輯整理 凹非寺量子位 報導 | 公眾號 QbitAI上回書說到,現在,對抗攻擊的理念已經被應用到隱私保護領域:通過給照片添加肉眼看不出來的對抗性噪聲,來蒙蔽人臉識別AI,達到保護隱私的效果。研究人員設計了一個基於編碼-解碼的壓縮近似模型,稱為ComModel。該模型被用於學習如何像黑盒壓縮算法一樣轉換圖像,以達到近似壓縮的目的。
  • 虹膜識別原理及算法
    虹膜識別算法——二維Gabor小波此算法是Daugman博士於1993年在文獻中提出的。在定位虹膜時使用了從粗到精的策略最後達到單像素的精度,並估計出虹膜和瞳孔的中心以及半徑。一般來說,瞳孔的中心和虹膜是不同心的,瞳孔中心的重要性比虹膜的中心稍差一些,它的半徑是虹膜半徑的0.1到0.8倍。因此,決定瞳孔的圓周的三個參數必須與虹膜的圓周分開估算。
  • 小波變換和motion信號處理:第二篇
    這是《小波變換和motion信號處理》系列的第二篇,深入小波。第一篇我進行了基礎知識的鋪墊,第三篇主要講解應用。本文引用地址:http://www.eepw.com.cn/article/247254.htm在上一篇中講到,每個小波變換都會有一個mother wavelet,我們稱之為母小波,同時還有一個father wavelet,就是scaling function。而該小波的basis函數其實就是對這個母小波和父小波縮放和平移形成的。
  • 深度學習之圖像視頻壓縮技術
    深度學習技術設計壓縮算法的目的通過深度學習技術設計壓縮算法的目的之一是學習一個比離散餘弦變換或小波變換更優的變換,同時藉助於深度學習技術還可以設計更簡潔的端到端算法,因而能夠設計出比 JPEG2000 等商用算法性能更優的算法。在圖片、視頻壓縮領域,使用最多的深度學習技術就是卷積神經網絡(CNN),下面會就卷積神經網絡進行簡單介紹。
  • 人臉識別技術:STN空間變換對人臉對齊啟發
    人臉識別技術:STN空間變換對人臉對齊啟發 2016年09月01日 11:04作者:廣州分站編輯:廣州分站文章出處:泡泡網原創   G3商訊:作者簡介
  • 基於深度學習的人臉識別技術全解
    該算法在複雜背景下誤檢率比較高,但是與其他的特徵相融合後可以獲得很好的效果。 3、 基於統計理論方法:本文重點介紹基於統計理論方法中的Adaboost人臉檢測算法。Adaboost算法是通過無數次循環迭代來尋求最優分類器的過程。用弱分類器Haar特徵中任一特徵放在人臉樣本上,求出人臉特徵值,通過更多分類器的級聯便得到人臉的量化特徵,以此來區分人臉和非人臉。
  • JPEG2000數據壓縮的FPGA實現
    在有效實現數據壓縮基礎上,系統還具有較好擴展性。研究利用FPGA實現圖像數據壓縮,將壓縮算法映射到專用集成電路(ASIC)設計,具有非常廣闊的市場應用前景。1 基本原理 數字圖像的壓縮就是用一定的規律對需要處理的圖像數據進行變換和排列,以儘可能少的數據信息來表示儘可能多的圖像信息。圖像的壓縮是通過編碼算法來完成實現的。
  • 大熱的虹膜識別系統的硬體設計與實現,系統方案、軟體流程、算法設計
    虹膜定位和歸一化算法:採集的圖像包括大量的非虹膜區,如部分人臉、眼鞏膜、眼睫毛等。這些區域的信息不被虹膜識別所利用,進行虹膜定位通過確定虹膜的內外邊界去除這些無用的信息。這裡的關鍵問題有兩個:快速精確地從包含大量非虹膜部分的圖像中定位虹膜,並對其邊界或數學模型進行描述;利用幾何變換抵消拍攝時的虹膜圖像變形的幹擾。特徵提取和編碼算法:由於虹膜的結構組織較複雜(分四層),其中的纖維細胞、結締組織、毛細血管和色素等都會對虹膜的紋理產生較大的影響,因此虹膜的紋理結構極為複雜,不像指紋識別一樣能提供清晰的特徵點(指紋的交叉點和端點)或特徵線。
  • 語音識別算法有哪些_語音識別特徵提取方法
    第一種:基於動態時間規整(Dynamic Time Warping)的算法   在連續語音識別中仍然是主流方法。   該方法的運算量較大,但技術上較簡單,識別正確率高。   在小詞彙量、孤立字(詞)識別系統中,也已有許多改進的DTW算法被提出。例如,利用頻率尺度的DTW算法進行孤立字(詞)識別的方法。
  • DWT域數字水印算法的FPGA實現
    空域算法是通過直接改變原始圖像的像素值來嵌入水印,通常具有較快的速度,但魯棒性差,且水印容量也會受到限制;變換域算法是通過改變某些變換係數來嵌入水印,通常具有很好的魯棒性和不可見性,其實現一般基於圖像變換(如DCT、DFT、DWT等)。大多數水印算法採用軟體實現,軟體實現具有易於應用、升級和適應性較好等特點,但存在速度受限、難以滿足實時處理的問題。而採用硬體實現則可以克服這些問題。
  • 基於LabVIEW和Matlab混合編程的小波降噪方法
    本文採用LabVIEW 和Matlab 混合編程的方法,將LabVIEW 完美的圖形編程技術和Matlab強大的數學解算功能結合起來,實現了小波降噪的數學建模和信號圖像顯示。  1 小波變換原理  小波變換的理論主要包括連續小波變換、離散小波變換和多分辨分析。
  • 基於OpenCV的人臉識別設計方案
    導讀: 本文提出了一種在Linux平臺下開發臉識別系統的方案,通過QT 來開發用戶界面,調用OpenCV圖像處理庫對相機進行採集和處理採集圖像,從而實現了人臉檢測、身份識別、簡單表情識別的功能。
  • 大駱駝人臉識別算法離線版和網絡雲端版部署區別
    人臉識別人臉識別(Facial Recognition),就是通過視頻採集設備獲取用戶的面部圖像,再利用核心的算法對其臉部的五官位置、臉型和角度進行計算分析,進而和自身資料庫裡已有的範本進行比對,後判斷出用戶的真實身份。人臉識別技術基於局部特徵區域的單訓練樣本人臉識別方法。