Person Re-Identification by Unsupervised l1 Graph Learning

ECCV 2016 person re-identification相關 第五篇

作者采用的方法是無監督學習,由于沒有用有監督學習 所以作者放寬了對discriminativity的定義——Instead of enforcing that data points corresponding to the same person to be as close as possible whilst being further away from other people in the learned subspace as in supervised learning, we constrain the visually similar people to be close to each other.

作者通過在字典學習中引入graph Laplacian regularisation term(這是啥我也不懂)來實現無監督學習

但是 傳統的graph Laplacian regularisation term在reID這個領域有兩個問題。1、傳統的graph Laplacian regularisation term使用L2范數,使得這個term對outliers特別敏感。而reID正是有許多data outliers(caused by various reasons such as the person detection boxes being imperfect and severe (self-)occlusions. ) 2、不懂The visual similarity is encoded in a graph whose topology and edge weights are all determined by distances computed using the original high-dimensional low-level features. However, these features are not ideal for people matching, hence learning a new representation in the first place. As illustrated in Fig. 1(a), a graph constructed using the low-level features connects many visually dissimilar neighbours to each node. This diminishes the power of the graph regularisation term as a visual similarity constraint.

所以在這篇文章里,作者引入一個魯棒的graph regularisation term ,and propose to learn the new representation and the optimal graph jointly.他用了L1范數來應對outliers,但是L1的話是非光滑且非凸的,所以作者又想了一個迭代優化的方法來解決這個問題。

最后采用cos作為度量

主要思想之一 Robust Graph Regularisation

傳統的目標函數長這樣:


s.t.約束項是為了讓D緊湊(di是D的一列) 正則項是為了讓X在低維空間的表示更加稀疏

接下來是數據的圖表示:


V是每個數據點,這是一個無向圖,用W表示鄰接矩陣。
因為reID問題關注cross view的data point,所以要限制這個圖只連接不同相機的data points

這里的正則項不用常規的這個:


而是用這個:



可以想象,這樣做可以讓不同數據點之間變得平滑

但是這個二范數是不適用的,原因上面講過,outliers

所以作者提出了Robust Graph Regularisation


其中下面這個式子是特征值分解:

Lw是拉普拉斯矩陣(不懂),Dii是度矩陣:

然后由于上面的4式是二范數,作者改用下面這個式子來替代1式中的正則項:


最后的目標函數就變成這樣:


這樣做的兩個好處:

  • 非線性(不懂)


  • 稀疏性(因為采用了L1范數)

主要思想之二 Joint graph and dictionary learning


上面這段話對第二個正則項的解釋我不是很懂, 第二個約束的意思大概就是,因為一個相機中的一個人應該只能匹配另一個相機中的一個人。(single shot)

優化

然后就是對7式的優化求解了,原文的2.3 Optimisation一節寫的比較詳細,因為比較多,而且都是數學式子,就不貼了,有興趣的童鞋可以自己去看。

用于測試集測試 Cross-View Matching

在有監督學習上也能拓展

在有label標注的時候,這要把標注信息反映在W鄰接矩陣上就好了。

特征

作者采用三種特征結合的形式,一是HS RGB Lab 二是HOG 三是LBP

實驗結果

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 每年春夏之交換裝的時候,都會變天,或刮風或下雨,總之是要降溫的節奏。回頭看,第一次經歷的時候全是新鮮的感覺。 ...
    側面閱讀 275評論 0 1
  • 官網入門簡介附小例子概述Overviewdebugging tutorialchrome.* APIs docum...
    JaiUnChat閱讀 433評論 0 1
  • 作 者 :安芮嫻 01 多年前,我在一所學校當老師,隔壁住著一對不一樣的中年夫婦,男的在我們學校教體育、女的是鎮上...
    安芮嫻閱讀 340評論 0 1