圖像學習-HOG特征

好久沒寫東西了，由于樓主換了個城市工作，發(fā)現(xiàn)工作量蹭蹭的上來了，周末又喜歡出去覓食，導致沒學習很久，今天準備水一篇來翻譯一下如何理解HOG（Histogram Of Gradient, 方向梯度直方圖）。本文主要翻譯了這篇文章，也是我非常喜歡的博主之一(奈何他開的課程錯過了T-T~~)。

特征描述子(Feature Descriptor)

特征描述子就是圖像的表示，抽取了有用的信息丟掉了不相關(guān)的信息。通常特征描述子會把一個w*h*3(寬*高*3，3個channel)的圖像轉(zhuǎn)換成一個長度為n的向量/矩陣。比如一副64*128*3的圖像，經(jīng)過轉(zhuǎn)換后輸出的圖像向量長度可以是3780。

什么樣子的特征是有用的呢？假設(shè)我們想要預測一張圖片里面衣服上面的扣子，扣子通常是圓的，而且上面有幾個洞，那你就可以用邊緣檢測(edge detector)，把圖片變成只有邊緣的圖像，然后就可以很容易的分辨了，那么對于這張圖邊緣信息就是有用的，顏色信息就是沒有用的。而且好的特征應(yīng)該能夠區(qū)分紐扣和其它圓形的東西的區(qū)別。

方向梯度直方圖(HOG)中，梯度的方向分布被用作特征。沿著一張圖片X和Y軸的方向上的梯度是很有用的，因為在邊緣和角點的梯度值是很大的，我們知道邊緣和角點包含了很多物體的形狀信息。

（HOG特征描述子可以不局限于一個長度的，也可以用很多其他的長度，這里只記錄一種計算方法。）

怎么計算方向梯度直方圖呢？

我們會先用圖像的一個patch來解釋。

第一步：預處理

Patch可以是任意的尺寸，但是有一個固定的比列，比如當patch長寬比1:2，那patch大小可以是100*200, 128*256或者1000*2000但不可以是101*205。

這里有張圖是720*475的，我們選100*200大小的patch來計算HOG特征，把這個patch從圖片里面摳出來，然后再把大小調(diào)整成64*128。

hog_preprocess

第二步：計算梯度圖像

首相我們計算水平和垂直方向的梯度，再來計算梯度的直方圖。可以用下面的兩個kernel來計算，也可以直接用OpenCV里面的kernel大小為1的Sobel算子來計算。

horizontal_vertical_gradient_kernel

調(diào)用OpenCV代碼如下：

// C++ gradient calculation.
// Read image
Mat img = imread("bolt.png");
img.convertTo(img, CV_32F, 1/255.0);
 
// Calculate gradients gx, gy
Mat gx, gy; 
Sobel(img, gx, CV_32F, 1, 0, 1);
Sobel(img, gy, CV_32F, 0, 1, 1);

# Python gradient calculation 
 
# Read image
im = cv2.imread('bolt.png')
im = np.float32(im) / 255.0
 
# Calculate gradient 
gx = cv2.Sobel(img, cv2.CV_32F, 1, 0, ksize=1)
gy = cv2.Sobel(img, cv2.CV_32F, 0, 1, ksize=1)

接著，用下面的公式來計算梯度的幅值g和方向theta:

gradient_direction_formula

可以用OpenCV的cartToPolar函數(shù)來計算：

// C++ Calculate gradient magnitude and direction (in degrees)
Mat mag, angle; 
cartToPolar(gx, gy, mag, angle, 1);

# Python Calculate gradient magnitude and direction ( in degrees ) 
mag, angle = cv2.cartToPolar(gx, gy, angleInDegrees=True)

計算得到的gradient圖如下：

左邊：x軸的梯度絕對值中間：y軸的梯度絕對值右邊：梯度幅值

從上面的圖像中可以看到x軸方向的梯度主要凸顯了垂直方向的線條，y軸方向的梯度凸顯了水平方向的梯度，梯度幅值凸顯了像素值有劇烈變化的地方。(注意：圖像的原點是圖片的左上角，x軸是水平的，y軸是垂直的)

圖像的梯度去掉了很多不必要的信息(比如不變的背景色)，加重了輪廓。換句話說，你可以從梯度的圖像中還是可以輕而易舉的發(fā)現(xiàn)有個人。

在每個像素點，都有一個幅值(magnitude)和方向，對于有顏色的圖片，會在三個channel上都計算梯度。那么相應(yīng)的幅值就是三個channel上最大的幅值，角度(方向)是最大幅值所對應(yīng)的角。

第三步：在8*8的網(wǎng)格中計算梯度直方圖

在這一步，上面的patch圖像會被分割成8*8大小的網(wǎng)格(如下圖)，每個網(wǎng)格都會計算一個梯度直方圖。那為什么要分成8*8的呢？用特征描述子的一個主要原因是它提供了一個緊湊(compact)/壓縮的表示。一個8*8的圖像有8*8*3=192個像素值，每個像素有兩個值(幅值magnitude和方向direction，三個channel取最大magnitude那個)，加起來就是8*8*2=128，后面我們會看到這128個數(shù)如何用一個9個bin的直方圖來表示成9個數(shù)的數(shù)組。不僅僅是可以有緊湊的表示，用直方圖來表示一個patch也可以更加抗噪，一個gradient可能會有噪音，但是用直方圖來表示后就不會對噪音那么敏感了。

這個patch的大小是64*128,分割成8*8的cell，那么一共有64/8 * 128/8 = 8*16=128個網(wǎng)格

對于64*128的這幅patch來說，8*8的網(wǎng)格已經(jīng)足夠大來表示有趣的特征比如臉，頭等等。
直方圖是有9個bin的向量，代表的是角度0,20,40,60.....160。

我們先來看看每個8*8的cell的梯度都是什么樣子:

中間: 一個網(wǎng)格用箭頭表示梯度右邊: 這個網(wǎng)格用數(shù)字表示的梯度

中間這個圖的箭頭是梯度的方向，長度是梯度的大小，可以發(fā)現(xiàn)箭頭的指向方向是像素強度都變化方向，幅值是強度變化的大小。

右邊的梯度方向矩陣中可以看到角度是0-180度，不是0-360度，這種被稱之為"無符號"梯度("unsigned" gradients)因為一個梯度和它的負數(shù)是用同一個數(shù)字表示的，也就是說一個梯度的箭頭以及它旋轉(zhuǎn)180度之后的箭頭方向被認為是一樣的。那為什么不用0-360度的表示呢？在事件中發(fā)現(xiàn)unsigned gradients比signed gradients在行人檢測任務(wù)中效果更好。一些HOG的實現(xiàn)中可以讓你指定signed gradients。

下一步就是為這些8*8的網(wǎng)格創(chuàng)建直方圖，直方圖包含了9個bin來對應(yīng)0,20,40,...160這些角度。

下面這張圖解釋了這個過程。我們用了上一張圖里面的那個網(wǎng)格的梯度幅值和方向。根據(jù)方向選擇用哪個bin, 根據(jù)副值來確定這個bin的大小。先來看藍色圈圈出來的像素點，它的角度是80，副值是2，所以它在第五個bin里面加了2，再來看紅色的圈圈出來的像素點，它的角度是10，副值是4，因為角度10介于0-20度的中間(正好一半)，所以把幅值一分為二地放到0和20兩個bin里面去。

梯度直方圖

這里有個細節(jié)要注意，如果一個角度大于160度，也就是在160-180度之間，我們知道這里角度0，180度是一樣的，所以在下面這個例子里，像素的角度為165度的時候，要把幅值按照比例放到0和160的bin里面去。

角度大于160的情況

把這8*8的cell里面所有的像素點都分別加到這9個bin里面去，就構(gòu)建了一個9-bin的直方圖，上面的網(wǎng)格對應(yīng)的直方圖如下:

8*8網(wǎng)格直方圖

這里，在我們的表示中，Y軸是0度(從上往下)。你可以看到有很多值分布在0,180的bin里面，這其實也就是說明這個網(wǎng)格中的梯度方向很多都是要么朝上，要么朝下。

第四步: 16*16塊歸一化

上面的步驟中，我們創(chuàng)建了基于圖片的梯度直方圖，但是一個圖片的梯度對于整張圖片的光線會很敏感。如果你把所有的像素點都除以2，那么梯度的幅值也會減半，那么直方圖里面的值也會減半，所以這樣并不能消除光線的影響。所以理想情況下，我們希望我們的特征描述子可以和光線變換無關(guān)，所以我們就想讓我們的直方圖歸一化從而不受光線變化影響。

先考慮對向量用l2歸一化的步驟是:
v = [128, 64, 32]
[(128^2) + (64^2) + (32^2) ]^0.5=146.64
把v中每一個元素除以146.64得到[0.87,0.43,0.22]
考慮另一個向量2*v，歸一化后可以得到向量依舊是[0.87, 0.43, 0.22]。你可以明白歸一化是把scale給移除了。

你也許想到直接在我們得到的9*1的直方圖上面做歸一化，這也可以，但是更好的方法是從一個16*16的塊上做歸一化，也就是4個9*1的直方圖組合成一個36*1的向量，然后做歸一化，接著，窗口再朝后面挪8個像素(看動圖)。重復這個過程把整張圖遍歷一邊。

hog-16x16-block-normalization

第五步：計算HOG特征向量

為了計算這整個patch的特征向量，需要把36*1的向量全部合并組成一個巨大的向量。向量的大小可以這么計算:

我們有多少個16*16的塊？水平7個，垂直15個，總共有7*15=105次移動。
每個16*16的塊代表了36*1的向量。所以把他們放在一起也就是36*105=3780維向量。

可視化HOG

通常HOG特征描述子是畫出8*8網(wǎng)格中9*1歸一化的直方圖，見下圖。你可以發(fā)現(xiàn)直方圖的主要方向捕捉了這個人的外形，特別是軀干和腿。

visualizing_histogram

最后編輯于：2017.12.07 07:57:33

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,461評論 6贊 532
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 98,538評論 3贊 417
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,423評論 0贊 375
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,991評論 1贊 312
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,761評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 55,207評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,268評論 3贊 441
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,419評論 0贊 288
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 48,959評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 40,782評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,983評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,528評論 5贊 359
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 44,222評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,653評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,901評論 1贊 286
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,678評論 3贊 392
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,978評論 2贊 374

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

圖像學習-HOG特征

圖像學習-HOG特征

特征描述子(Feature Descriptor)

怎么計算方向梯度直方圖呢？

第一步：預處理

第二步：計算梯度圖像

第三步：在8*8的網(wǎng)格中計算梯度直方圖

第四步: 16*16塊歸一化

第五步：計算HOG特征向量

可視化HOG

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

圖像學習-HOG特征

特征描述子(Feature Descriptor)

怎么計算方向梯度直方圖呢？

第一步：預處理

第二步：計算梯度圖像

第三步：在8*8的網(wǎng)格中計算梯度直方圖

第四步: 16*16塊歸一化

第五步：計算HOG特征向量

可視化HOG

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频