CV常用傳統算法

1.K-D樹

概念:一種分割k維數據空間的數據結構。

構造過程:

(1)針對k條坐標軸方向,分別在每個方向上統計所有點的數據方差。并在k個方差選擇最大的,將其方向作為分割方向。(數據方差大表明沿該坐標軸方向上的數據分散得比較開,在這個方向上進行數據分割有較好的分辨率。)

(2)選出分割方向上中間的一點,用其將數據點分割成左右兩部分。

(3)對左右兩部分數據重復(1)(2)操作,直至每個子空間中只剩一個數據點。

查詢步驟:

(1)從根節點開始,通過二叉搜索,查找到與目標點距離最近的一點A,并在棧中順序存儲已經遍歷的節點。

(2)以目標點為圓心,以兩點間距離為半徑作圓,若與父節點的分割線(超平面)相交,則對分割線另一邊進行二叉搜索。

(3)若不相交,則按棧中存儲的節點進行回溯,若當前節點比A距離更近,則更新A。

(4)直至回溯到root點,此時的A點即為最近鄰接點。

2.Bag of words

概念:該模型忽略掉文本的語法和語序,用一組無序的單詞(words)來表達一段文字或一個文檔。近年來,BoW模型被廣泛應用于計算機視覺中。與應用于文本的BoW類比,圖像的特征(feature)被當作單詞(Word)。文本方面:例如有下面兩句話:

John likes to watch movies. Mary likes movies too.

John also likes to watch football games.

可生成如下詞典:

[“John”,?“likes”,?“to”,?“watch”,?“movies”,?“also”,?“football”,?“games”,?“Mary”,?“too”]

根據這個詞典,可以將這兩句話轉換成兩個向量:

[1, 2, 1, 1, 2, 0, 0, 0, 1, 1]

[1, 1, 1, 1, 0, 1, 1, 1, 0, 0]

這兩個向量共包含10個元素,其中第i個元素表示詞典中第i個單詞在句子中出現的次數。因此BoW模型可認為是一種統計直方圖(histogram)。在文本檢索和處理應用中,可以通過該模型很方便的計算詞頻。

計算機視覺方面:將圖像可以類比作文檔,圖像中的特征點類比成詞匯,那么圖像的BoW模型即是“圖像中所有圖像塊的特征點得到的直方圖”.建立BoW模型主要分為如下幾個步驟:

(1)特征提取

假設有N張圖像,第i張圖像可由n(i)個特征點表示,則總共能得到sum(n(i))個特征點。

(2)生成詞典/碼本(codebook)

對上一步得到的特征向量進行聚類(可以使用K-means等聚類方法),得到K個聚類中心,用聚類中心構建碼本。

(3)根據碼本生成直方圖

對每張圖片,通過最近鄰計算該圖片的每個特征點應該屬于codebook中的“哪一類”特征點,從而得到該圖片對應于該碼本的BoW表示。匹配兩個圖片的直方圖,就可判斷其相似度。

3.TF-IDF

概念:term frequency–inverse document frequency是一種用于信息檢索與數據挖掘的常用加權技術。

TF:詞頻,計算方法:,分子為詞條i在文檔j中出現的次數,分母為文檔j所有詞條出現的總次數。

IDF:逆向文件頻率(inverse document frequency,IDF)是一個詞語普遍重要性的度量,計算方法:


分子為庫中文檔數目,分母為庫中所有包含詞條i的文檔數目。

TF-IDF:即為TF*IDF,以此來計算某個詞條的權重,形式較多,上面僅列出其中一種表示。

4.K-means clustering

概念:把數據分成幾組,按照定義的測量標準,同組內數據與其他組數據相比具有較強的相似性,這就叫聚簇。聚簇是數據挖掘最基礎的操作,但現在存在的一些傳統聚簇方法已不能滿足處理復雜類型的、高維的、任意分布形狀的數據集合的需要。

k-means算法就是用得最多的一種傳統的聚簇方法,是一種劃分法,相似度的計算是求數據對象與簇中心的距離,與簇中心距離近的就劃為一個簇。工作流程:

(1)隨機地選擇k個對象,每個對象初始地代表了一個簇的平均值或中心。

(2)對剩余的每個對象,根據其與各個簇中心的距離,將其賦給最近的簇。

(3)重新計算每個簇的平均值,求出新的簇中心,再重新聚簇。

(4)不斷重復(2)(3),直到準則函數收斂。

分析:該算法的時間復雜度是O(nkt),其中n是所有對象數目,k是簇的數目,t是迭代次數。它的效率比較高;缺點是只能處理數值型數據,不能處理分類數據,對例外數據非常敏感,不能處理非凸面形狀的聚簇。

5.SIFT

6.SVM

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,763評論 6 539
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,238評論 3 428
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,823評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,604評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,339評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,713評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,712評論 3 445
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,893評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,448評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,201評論 3 357
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,397評論 1 372
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,944評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,631評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,033評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,321評論 1 293
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,128評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,347評論 2 377

推薦閱讀更多精彩內容