圖像局部紋理特征——LBP(Local Binary Pattern)

原文參考自?目標(biāo)檢測(cè)的圖像特征提取之(二)LBP特征,做了少量修改并添加自己的理解

LBP是由T. Ojala, M.Pietik?inen, 和 D. Harwood 在1994年提出,具有旋轉(zhuǎn)不變性和灰度不變性。

1. 基本的(正方形鄰域)LBP

在3*3的窗口內(nèi),將相鄰的8個(gè)像素的灰度值與窗口中心像素進(jìn)行比較,若周圍像素值大于中心像素值,則該像素點(diǎn)的位置被標(biāo)記為1,否則為0。顯然3*3鄰域內(nèi)可產(chǎn)生8位二進(jìn)制數(shù)(共256種),轉(zhuǎn)換為十進(jìn)制即得到該窗口中心像素點(diǎn)的LBP值。如下圖所示:

但其缺點(diǎn)也很明顯——它只覆蓋了一個(gè)固定半徑范圍內(nèi)的小區(qū)域,無(wú)法滿足不同尺寸和頻率紋理的需要。

2.尺度不變的(圓形鄰域)LBP

為了適應(yīng)不同尺度的紋理特征,Ojala等對(duì) LBP 算子進(jìn)行了改進(jìn),將 3×3鄰域擴(kuò)展到任意鄰域,并用圓形鄰域代替了正方形鄰域,改進(jìn)后的 LBP 算子允許在半徑為 R 的圓形鄰域內(nèi)有任意多個(gè)像素點(diǎn)。從而得到半徑為R的圓形區(qū)域內(nèi)含有P個(gè)采樣點(diǎn)的LBP算子,如圖

3.?旋轉(zhuǎn)不變的 LBP(取模式中的最小值)

從1中的定義可以看出,LBP 算子是灰度不變的,但卻不是旋轉(zhuǎn)不變的。旋轉(zhuǎn)的圖像會(huì)得到不同的 LBP值。

Maenpaa等人又將 LBP算子進(jìn)行了擴(kuò)展,提出了具有旋轉(zhuǎn)不變性的 LBP 算子,即不斷旋轉(zhuǎn)圓形鄰域得到一系列初始定義的 LBP值,取其最小值作為該鄰域的 LBP 值。

如下圖所示

經(jīng)過(guò)旋轉(zhuǎn)不變的處理,最終得到的具有旋轉(zhuǎn)不變性的 LBP值(圖中算子下方的數(shù)字表示該算子對(duì)應(yīng)的 LBP值)為 15(8種模式中的最小值)。即圖中的 8種 LBP 模式對(duì)應(yīng)的旋轉(zhuǎn)不變的 LBP模式都是 00001111

4. 等價(jià)模式的 LBP(降維,跳變<=2)

提出等價(jià)模式的原因:以圓形 LBP 為例,對(duì)于半徑為R的圓形區(qū)域內(nèi)含有P個(gè)采樣點(diǎn)的LBP算子將會(huì)產(chǎn)生2^P種模式。很顯然,隨著鄰域集內(nèi)采樣點(diǎn)數(shù)的增加,二進(jìn)制模式的種類是急劇增加的。如此多的二進(jìn)制模式無(wú)論對(duì)于紋理的提取還是對(duì)于紋理的識(shí)別、分類及信息的存取都是不利的。例如,將LBP算子用于紋理分類或人臉識(shí)別時(shí),常采用LBP模式的統(tǒng)計(jì)直方圖來(lái)表達(dá)圖像的信息,而較多的模式種類將使得數(shù)據(jù)量過(guò)大,且直方圖過(guò)于稀疏。因此,需要對(duì)原始的LBP模式進(jìn)行降維,使得數(shù)據(jù)量減少的情況下能最好的代表圖像的信息。

為了解決二進(jìn)制模式過(guò)多的問(wèn)題,提高統(tǒng)計(jì)性,Ojala提出了采用一種“等價(jià)模式”(Uniform Pattern)來(lái)對(duì)LBP算子的模式種類進(jìn)行降維。Ojala等認(rèn)為,在實(shí)際圖像中,絕大多數(shù)LBP模式最多只包含兩次從1到0或從0到1的跳變。因此,Ojala將“等價(jià)模式”定義為:當(dāng)某個(gè)LBP所對(duì)應(yīng)的循環(huán)二進(jìn)制數(shù)從0到1或從1到0最多有兩次跳變時(shí),該LBP所對(duì)應(yīng)的二進(jìn)制就稱為一個(gè)等價(jià)模式類。如00000000(0次跳變),00000111(只含一次從0到1的跳變),10001111(先由1跳到0,再由0跳到1,共兩次跳變)都是等價(jià)模式類。除等價(jià)模式類以外的模式都?xì)w為另一類,稱為混合模式類,例如10010111(共四次跳變)。

通過(guò)這樣的改進(jìn),二進(jìn)制模式的種類大大減少。模式數(shù)量由原來(lái)的2^P種減少為 P ( P-1)+2種,其中P表示鄰域集內(nèi)的采樣點(diǎn)數(shù)。

對(duì)于3×3鄰域內(nèi)8個(gè)采樣點(diǎn)來(lái)說(shuō),二進(jìn)制模式由原始的256種減少為58種(0-255中只有58個(gè)數(shù)跳變數(shù)<= 2),這使得特征向量的維數(shù)更少,并且可以減少高頻噪聲帶來(lái)的影響。

實(shí)際開發(fā)中可以事先建立等價(jià)模式查找表,例如0-255中跳變數(shù)小于等于2的個(gè)數(shù),以加速計(jì)算。

5. 實(shí)際應(yīng)用的 LBP(統(tǒng)計(jì)直方圖)

LBP的應(yīng)用中,如紋理分類、人臉?lè)治龅龋话愣疾粚BP圖譜作為特征向量用于分類識(shí)別,而是采用LBP特征的統(tǒng)計(jì)直方圖作為特征向量用于分類識(shí)別。

因?yàn)椋瑥纳厦娼榻B的原理我們可以看出,這個(gè)“特征”跟位置信息是緊密相關(guān)的。直接對(duì)兩幅圖片提取這種“特征”,并進(jìn)行判別分析的話,會(huì)因?yàn)椤拔恢脹](méi)有對(duì)準(zhǔn)”而產(chǎn)生很大的誤差。后來(lái),研究人員發(fā)現(xiàn),可以將一幅圖片劃分為若干的子區(qū)域,對(duì)每個(gè)子區(qū)域內(nèi)的每個(gè)像素點(diǎn)都提取LBP特征,然后,在每個(gè)子區(qū)域內(nèi)建立LBP特征的統(tǒng)計(jì)直方圖。如此一來(lái),每個(gè)子區(qū)域,就可以用一個(gè)統(tǒng)計(jì)直方圖來(lái)進(jìn)行描述;整個(gè)圖片就由若干個(gè)統(tǒng)計(jì)直方圖組成;

具體步驟

(1)首先假設(shè)小區(qū)域(cell)的大小為16×16,據(jù)此將圖像分為若干小區(qū)域(一幅512x512的圖像可分出32x32個(gè)小區(qū)域);

(2)對(duì)于每個(gè)cell中的一個(gè)像素,將其與相鄰的8個(gè)像素的灰度值進(jìn)行比較,若周圍像素值大于中心像素值,則該像素點(diǎn)的位置被標(biāo)記為1,否則為0。

這樣,3*3鄰域內(nèi)的8個(gè)點(diǎn)經(jīng)比較可產(chǎn)生8位二進(jìn)制數(shù),即得到該窗口中心像素點(diǎn)的LBP值;

(3)然后計(jì)算每個(gè)cell的直方圖,即每個(gè)數(shù)字(十進(jìn)制數(shù)LBP值)出現(xiàn)的頻率;然后對(duì)該直方圖進(jìn)行歸一化處理;

(4)然后將得到的每個(gè)cell的統(tǒng)計(jì)直方圖進(jìn)行連接成為一個(gè)特征向量,也就是整幅圖的LBP紋理特征向量;

(5)最后便可利用機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練分類了。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容