When I read the paper3,I get the?contention of the features descriptor?of??bag of visual words of the recognition framework.Then I attempt to know its theory.
Here,I'd like to put the blog which I think is great to give the informations primary-learners want to know.http://blog.csdn.net/wsj998689aa/article/details/47089153
Notes:Bag-of words是SIFT算法在目標識別方面的應用
對于圖像處理而言,關鍵在于找出“視覺詞匯”構建出圖片的檢索字典,然后對圖片進行編碼。雖然同類圖片不同實例之間存在差異,但其局部的一些特征時基本相似的,故由此可以利用SIFT算法提取圖像中局部不變特征來構建圖像的視覺詞典,然后對圖像進行編碼。其具體步驟如下:
于是便可用一個相對較少維度的數值向量來描述一幅圖像,相比于用SIFT來描述一幅圖像(每個SIFT矢量為128維,且每幅圖像通常包含成百上千個SIFT矢量),用Bag-of-words來描述使得在進行圖像間相似度計算時效率能大大提高。然后將用bag of words表示的圖片用于進行分類器的訓練。
博文最后還說明了如何實現BOW來表示一幅圖像,稍晚點試試~