ECCV 2016 person re-identification相關 第五篇
作者采用的方法是無監督學習,由于沒有用有監督學習 所以作者放寬了對discriminativity的定義——Instead of enforcing that data points corresponding to the same person to be as close as possible whilst being further away from other people in the learned subspace as in supervised learning, we constrain the visually similar people to be close to each other.
作者通過在字典學習中引入graph Laplacian regularisation term(這是啥我也不懂)來實現無監督學習
但是 傳統的graph Laplacian regularisation term在reID這個領域有兩個問題。1、傳統的graph Laplacian regularisation term使用L2范數,使得這個term對outliers特別敏感。而reID正是有許多data outliers(caused by various reasons such as the person detection boxes being imperfect and severe (self-)occlusions. ) 2、不懂The visual similarity is encoded in a graph whose topology and edge weights are all determined by distances computed using the original high-dimensional low-level features. However, these features are not ideal for people matching, hence learning a new representation in the first place. As illustrated in Fig. 1(a), a graph constructed using the low-level features connects many visually dissimilar neighbours to each node. This diminishes the power of the graph regularisation term as a visual similarity constraint.
所以在這篇文章里,作者引入一個魯棒的graph regularisation term ,and propose to learn the new representation and the optimal graph jointly.他用了L1范數來應對outliers,但是L1的話是非光滑且非凸的,所以作者又想了一個迭代優化的方法來解決這個問題。
最后采用cos作為度量
主要思想之一 Robust Graph Regularisation
傳統的目標函數長這樣:
s.t.約束項是為了讓D緊湊(di是D的一列) 正則項是為了讓X在低維空間的表示更加稀疏
接下來是數據的圖表示:
V是每個數據點,這是一個無向圖,用W表示鄰接矩陣。
因為reID問題關注cross view的data point,所以要限制這個圖只連接不同相機的data points
這里的正則項不用常規的這個:
而是用這個:
可以想象,這樣做可以讓不同數據點之間變得平滑
但是這個二范數是不適用的,原因上面講過,outliers
所以作者提出了Robust Graph Regularisation:
其中下面這個式子是特征值分解:
Lw是拉普拉斯矩陣(不懂),Dii是度矩陣:
然后由于上面的4式是二范數,作者改用下面這個式子來替代1式中的正則項:
最后的目標函數就變成這樣:
這樣做的兩個好處:
-
非線性(不懂)
- 稀疏性(因為采用了L1范數)
主要思想之二 Joint graph and dictionary learning
上面這段話對第二個正則項的解釋我不是很懂, 第二個約束的意思大概就是,因為一個相機中的一個人應該只能匹配另一個相機中的一個人。(single shot)
優化
然后就是對7式的優化求解了,原文的2.3 Optimisation一節寫的比較詳細,因為比較多,而且都是數學式子,就不貼了,有興趣的童鞋可以自己去看。
用于測試集測試 Cross-View Matching
在有監督學習上也能拓展
在有label標注的時候,這要把標注信息反映在W鄰接矩陣上就好了。
特征
作者采用三種特征結合的形式,一是HS RGB Lab 二是HOG 三是LBP