LBP特徵的描述、原理以及特徵向量進行提取的步驟解析

2021-01-11 電子發燒友

LBP(Local Binary Pattern,局部二值模式)是一種用來描述圖像局部紋理特徵的算子;它具有旋轉不變性和灰度不變性等顯著的優點。它是首先由T. Ojala, M.Pietikäinen, 和 D. Harwood 在1994年提出,用於紋理特徵提取。而且,提取的特徵是圖像的局部的紋理特徵;

1、LBP特徵的描述

原始的LBP算子定義為在3*3的窗口內,以窗口中心像素為閾值,將相鄰的8個像素的灰度值與其進行比較,若周圍像素值大於中心像素值,則該像素點的位置被標記為1,否則為0。這樣,3*3鄰域內的8個點經比較可產生8位二進位數(通常轉換為十進位數即LBP碼,共256種),即得到該窗口中心像素點的LBP值,並用這個值來反映該區域的紋理信息。如下圖所示:

LBP的改進版本:

原始的LBP提出後,研究人員不斷對其提出了各種改進和優化。

(1)圓形LBP算子:

基本的 LBP算子的最大缺陷在於它只覆蓋了一個固定半徑範圍內的小區域,這顯然不能滿足不同尺寸和頻率紋理的需要。為了適應不同尺度的紋理特徵,並達到灰度和旋轉不變性的要求,Ojala等對 LBP 算子進行了改進,將 3×3鄰域擴展到任意鄰域,並用圓形鄰域代替了正方形鄰域,改進後的 LBP 算子允許在半徑為 R 的圓形鄰域內有任意多個像素點。從而得到了諸如半徑為R的圓形區域內含有P個採樣點的LBP算子;

(2)LBP旋轉不變模式

從 LBP 的定義可以看出,LBP 算子是灰度不變的,但卻不是旋轉不變的。圖像的旋轉就會得到不同的 LBP值。

Maenpaa等人又將 LBP算子進行了擴展,提出了具有旋轉不變性的 LBP 算子,即不斷旋轉圓形鄰域得到一系列初始定義的 LBP值,取其最小值作為該鄰域的 LBP 值。

圖 2.5 給出了求取旋轉不變的 LBP 的過程示意圖,圖中算子下方的數字表示該算子對應的 LBP值,圖中所示的 8 種 LBP模式,經過旋轉不變的處理,最終得到的具有旋轉不變性的 LBP值為 15。也就是說,圖中的 8種 LBP 模式對應的旋轉不變的 LBP模式都是 00001111。

(3)LBP等價模式

一個LBP算子可以產生不同的二進位模式,對於半徑為R的圓形區域內含有P個採樣點的LBP算子將會產生P2種模式。很顯然,隨著鄰域集內採樣點數的增加,二進位模式的種類是急劇增加的。例如:5×5鄰域內20個採樣點,有220=1,048,576種二進位模式。如此多的二值模式無論對於紋理的提取還是對於紋理的識別、分類及信息的存取都是不利的。同時,過多的模式種類對於紋理的表達是不利的。例如,將LBP算子用於紋理分類或人臉識別時,常採用LBP模式的統計直方圖來表達圖像的信息,而較多的模式種類將使得數據量過大,且直方圖過於稀疏。因此,需要對原始的LBP模式進行降維,使得數據量減少的情況下能最好的代表圖像的信息。

為了解決二進位模式過多的問題,提高統計性,Ojala提出了採用一種「等價模式」(Uniform Pattern)來對LBP算子的模式種類進行降維。Ojala等認為,在實際圖像中,絕大多數LBP模式最多只包含兩次從1到0或從0到1的跳變。因此,Ojala將「等價模式」定義為:當某個LBP所對應的循環二進位數從0到1或從1到0最多有兩次跳變時,該LBP所對應的二進位就稱為一個等價模式類。如00000000(0次跳變),00000111(只含一次從0到1的跳變),10001111(先由1跳到0,再由0跳到1,共兩次跳變)都是等價模式類。除等價模式類以外的模式都歸為另一類,稱為混合模式類,例如10010111(共四次跳變)(這是我的個人理解,不知道對不對)。

通過這樣的改進,二進位模式的種類大大減少,而不會丟失任何信息。模式數量由原來的2P種減少為 P ( P-1)+2種,其中P表示鄰域集內的採樣點數。對於3×3鄰域內8個採樣點來說,二進位模式由原始的256種減少為58種,這使得特徵向量的維數更少,並且可以減少高頻噪聲帶來的影響。

2、LBP特徵用於檢測的原理

顯而易見的是,上述提取的LBP算子在每個像素點都可以得到一個LBP「編碼」,那麼,對一幅圖像(記錄的是每個像素點的灰度值)提取其原始的LBP算子之後,得到的原始LBP特徵依然是「一幅圖片」(記錄的是每個像素點的LBP值)。

LBP的應用中,如紋理分類、人臉分析等,一般都不將LBP圖譜作為特徵向量用於分類識別,而是採用LBP特徵譜的統計直方圖作為特徵向量用於分類識別。

因為,從上面的分析我們可以看出,這個「特徵」跟位置信息是緊密相關的。直接對兩幅圖片提取這種「特徵」,並進行判別分析的話,會因為「位置沒有對準」而產生很大的誤差。後來,研究人員發現,可以將一幅圖片劃分為若干的子區域,對每個子區域內的每個像素點都提取LBP特徵,然後,在每個子區域內建立LBP特徵的統計直方圖。如此一來,每個子區域,就可以用一個統計直方圖來進行描述;整個圖片就由若干個統計直方圖組成;

例如:一幅100*100像素大小的圖片,劃分為10*10=100個子區域(可以通過多種方式來劃分區域),每個子區域的大小為10*10像素;在每個子區域內的每個像素點,提取其LBP特徵,然後,建立統計直方圖;這樣,這幅圖片就有10*10個子區域,也就有了10*10個統計直方圖,利用這10*10個統計直方圖,就可以描述這幅圖片了。之後,我們利用各種相似性度量函數,就可以判斷兩幅圖像之間的相似性了;

3、對LBP特徵向量進行提取的步驟

(1)首先將檢測窗口劃分為16×16的小區域(cell);

(2)對於每個cell中的一個像素,將相鄰的8個像素的灰度值與其進行比較,若周圍像素值大於中心像素值,則該像素點的位置被標記為1,否則為0。這樣,3*3鄰域內的8個點經比較可產生8位二進位數,即得到該窗口中心像素點的LBP值;

(3)然後計算每個cell的直方圖,即每個數字(假定是十進位數LBP值)出現的頻率;然後對該直方圖進行歸一化處理。

(4)最後將得到的每個cell的統計直方圖進行連接成為一個特徵向量,也就是整幅圖的LBP紋理特徵向量;然後便可利用SVM或者其他機器學習算法進行分類了。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 圖像特徵工程:HOG特徵描述子介紹
    準備好對圖像數據進行特徵提取形式的特徵工程吧!在本文中,我將向你介紹一種流行的圖像特徵提取技術——方向梯度直方圖(Histogram of Oriented Gradients),或俗稱的HOG。我們將了解什麼是HOG特徵描述子,它是如何工作的(算法背後的完整數學原理),最後,用Python實現它。
  • Curvelet變換用於人臉特徵提取與識別
    人臉檢測是一個非常複雜的模式,人臉面部特徵提取及識別成為當前計算機圖像處理相關學科的一個極具挑戰的課題。而基於Carvelet變換的人臉特徵提取及識別的意義在於Curvelet繼承了小波分析優良的空域和頻域局部特性,是又一個新的圖像多尺度兒何分析工其,其相對於小波的優勢在於更加適合描述圖像的幾何特徵,因此也更適合人臉特徵提取及識別分析。。
  • 使用DeepWalk從圖中提取特徵
    我們首先從文本或圖像中提取數字特徵,然後將這些特徵作為輸入提供給機器學習模型:從圖中提取的特徵可以大致分為三類:節點屬性:我們知道圖中的節點代表實體,並且這些實體具有自己的特徵屬性。我們可以將這些屬性用作每個節點的特徵。例如,在航空公司航線網絡中,節點將代表機場。這些節點將具有飛機容量,航站樓數量,著陸區等特徵。
  • 矩陣的特徵值與特徵向量
    ,也稱v為特徵值λ對應的特徵向量。求解特徵值和特徵向量的步驟如下:(1) 計算特徵多項式|A-λE|;(2) 求|A-λE|=0的所有根,即A的所有特徵值;(3) 對每個特徵值λ0,求解齊次線性方程組
  • 2015考研數學大綱解析:特徵值和特徵向量學習方法指導
    當然,特徵值和特徵向量部分也沒有發生變化。下面我以特徵值和特徵向量為例,深度解析考研數學大綱,希望對大家的學習有所幫助。  一、考試內容  矩陣的特徵值和特徵向量的概念、性質  相似矩陣的概念及性質  矩陣可相似對角化的充分必要條件及相似對角矩陣  實對稱矩陣的特徵值、特徵向量及其相似對角矩陣  二、考試要求  理解矩陣的特徵值和特徵向量的概念及性質,會求矩陣特徵值和特徵向量;理解相似矩陣的概念
  • 基於協方差矩陣的目標特徵提取與跟蹤
    該方法在確定融合了LBP紋理特徵的目標特徵向量基礎上,建立目標區域協方差矩陣作為模板矩陣,並從下一幀中提取協方差矩陣,與模板矩陣進行矩陣相似性度量,形成相似度矩陣,使用閾值進行矩陣元素的選擇,並計算剩餘元素的權值,再按重心公式確定跟蹤中心點。實驗結果表明:在較複雜環境中,可以對目標的旋轉、遮擋和形狀變化進行具有更高準確度的跟蹤,驗證了該方法的有效性。
  • 線性代數的本質:特徵向量與特徵值
    一般情況下,一個二維矩陣有兩個特徵值,而對應的特徵向量在兩條直線上,但也存在一些特殊情況。如有時候只有一個特徵值,以及特徵向量分布在一條直線上,如下面的矩陣,只有1個特徵值,為1:首先要將一個向量在另一個坐標系中的坐標轉換到我們的空間中坐標,然後在進行線性變換M,最後在變回到另一個空間中的坐標:
  • 眾人皆醉我獨醒——深入理解「特徵值」和「特徵向量」
    我們用公式可以表示成:也就是說,矩陣A對向量v所做的線性變換,就相當於對向量v做了拉伸或者壓縮,λ就是拉伸或者縮放的倍數。此時,我們將λ稱作特徵值,而向量v稱作特徵向量。再仔細觀察(1)式,是否可以把等式兩邊的v消去,得到A=λ呢?
  • 矩陣的重要特性:特徵向量
    凡是能被A拉長(縮短)的向量稱為A的特徵向量 (Eigenvector);拉長(縮短)量就為這個特徵向量對應的特徵值 (Eigenvalue)。值得注意的是,我們說的特徵向量是一類向量,因為任意一個特徵向量隨便乘以一個標量結果肯定也滿足以上方程,當然這兩個向量都可以看成是同一個特徵向量,而且它們也都對應同一個特徵值。
  • 矩陣:特徵向量(Eigenvector)
    矩陣的特徵方程式是:A * x = lamda * x這個方程可以看出什麼?矩陣實際可以看作一個變換,方程左邊就是把向量x變到另一個位置而已;右邊就是把向量x作了一個拉伸,拉伸量是lamda。那麼它的意義就很明顯了,表達了矩陣A的一個特性就是這個矩陣可以把向量x拉長(或縮短)lamda倍,僅此而已。任意給定一個矩陣A,並不是對所有的x它都能拉長(縮短)。
  • 一文解析基於特徵點的視覺全局定位技術
    為了提高效率,一些二值描述子被學者們提出。一般地,這些方法都是在特徵關鍵點周圍進行點採 樣。然後比較一對點的灰度大小,結果以 0/1 表示,形成 N 維的二進位描述向量,構成特徵點的二值模式。而不同二值描述子最大的差別,主要在於特徵採樣模式不同、點對選取方法不同。
  • 矩陣特徵值與特徵向量的幾何意義
    即, 如果對於數 λ,存在一個 n 維非零列向量X(即 X∈Rn 且 X≠0),使得AX= λX則稱數 λ 為矩陣 A 的一個特徵值, X 稱為矩陣 A 對應於 λ 的特徵向量。在線性代數中,研究線性變換就是研究相應的矩陣 A,矩陣 A 的特徵向量和特徵值是線性變換研究的重要內容。
  • 語音識別算法有哪些_語音識別特徵提取方法
    能將語音信號轉換為計算機能夠處理的語音特徵向量   2. 能夠符合或類似人耳的聽覺感知特性   3. 在一定程度上能夠增強語音信號、抑制非語音信號   常用特徵提取方法有如下幾種:   (1)線性預測分析(LinearPredictionCoefficients,LPC)   擬人類的發聲原理,通過分析聲道短管級聯的模型得到的。
  • 從手工提取特徵到深度學習的三種圖像檢索方法
    圖片檢索的的大體框架大致可以分成兩步,抽取某種特徵,計算相似度。其中像上述提及的幾種方法,都是對應抽取特徵這一步,而計算相似度,則常使用歐式距離/漢明距離/Triplet 等方法。顯然的,上述方法都屬於人工設計的方法來進行抽取特徵,很自然的就想到使用當今很火熱的深度學習來代替人工的設計的方法,所以這篇文章主要介紹的就是基於深度學習的圖片檢索。
  • 特徵值和特徵向量的物理意義,振動離不開它
    長時間以來一直不了解矩陣的特徵值和特徵向量到底有何意義(估計很多兄弟有同樣感受)。知道它的數學公式,但卻找不出它的幾何含義,教科書裡沒有真正地把這一概念從各種角度實例化地進行講解,只是一天到晚地列公式玩理論——有個屁用啊。
  • 特徵值和特徵向量計算證明題
    對應於 的所有特徵向量. 解.>於是對應於 的全部特徵向量為 ( ).>的公共特徵向量, 對應的特徵值為 .令 得解向量(對應於 的特徵向量令 得解向量(對應於 的特徵向量
  • 銳騏皮卡造型語義特徵分析,皮卡車造型特徵部位的提取
    皮卡車造型特徵不僅關注造型元素的形式、走勢 、比例,更關注整車的風格特徵以及與造型相關的結構、工藝等信息。汽車造型特徵除了攜帶著形狀、材料等物理信息以外, 還攜帶了大量的風格意象、品牌、色彩、空氣動力學、人機工程和製造工藝、規範等與造型設計相關的信息。
  • 圖說冪法求特徵值和特徵向量
    如圖中坐標原點是兩條粗藍線的交點,紅色的向量是[1, - 0.8]』。圖中綠色的線是A的特徵向量[-1,2]』, [1,3]』。在特徵向量的方向上的向量,如粗黑色的向量[-0.3162, -0.9487]』,經A乘後,如下圖:
  • 京東高級算法工程師34頁PPT詳解基於分布式向量檢索系統Vearch的大...
    然而深度學習可以利用生物特徵的唯一性以及難以作假的特性。以上這些場景,都是新的query與資料庫中數據做搜索對比得到排序結果的應用。傳統方案是採用人工提取特徵,但是由於特徵量少,無法刻畫事物的唯一性,比如人臉識別過閘機場景,證件等外部性證明都容易作假,靠保安人員記憶,容貌相近的無關人員有可能亂入,還有銀行卡靠帳戶密碼轉帳的盜刷事件時有發生。
  • 一種用於SLAM/SFM的深度學習特徵點 SuperPoint
    雖然過去了挺久,但是仍然是經典,值得學習這篇文章設計了一種自監督網絡框架,能夠同時提取特徵點的位置以及描述子。相比於patch-based方法,本文提出的算法能夠在原始圖像提取到像素級精度的特徵點的位置及其描述子。