姓名:王正帥
學(xué)號(hào):14020120007
【嵌牛導(dǎo)讀】:行人重識(shí)別(Person re-identification),是利用計(jì)算機(jī)視覺(jué)技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。給定一個(gè)監(jiān)控行人圖像,檢索跨設(shè)備下的該行人圖像。旨在彌補(bǔ)目前固定的攝像頭的視覺(jué)局限,并可與行人檢測(cè)/行人跟蹤技術(shù)相結(jié)合,可廣泛應(yīng)用于智能視頻監(jiān)控、智能安保等領(lǐng)域。自2010年以來(lái),行人重識(shí)別技術(shù)的訓(xùn)練庫(kù)趨于大規(guī)模化,廣泛采用深度學(xué)習(xí)框架。隨著高校、研究所以及一些廠商的研究持續(xù)深入,行人重識(shí)別技術(shù)得到了飛速的發(fā)展。新的主流科研方案之一是在人體上檢測(cè)部件(手,腿,軀干等等)再進(jìn)行匹配識(shí)別——人體關(guān)節(jié)點(diǎn)定位檢測(cè),提出一種新的網(wǎng)絡(luò)Spindle Net(主軸網(wǎng)絡(luò))。
【嵌牛鼻子】:行人重識(shí)別、計(jì)算機(jī)視覺(jué) 、人體關(guān)節(jié)點(diǎn)定位、Spindle Net
【嵌牛提問(wèn)】:行人重識(shí)別技術(shù)可以做啥?行人重識(shí)別技術(shù)現(xiàn)在遇到了哪些問(wèn)題,如何解決?
【嵌牛正文】:
行人重識(shí)別技術(shù)研究?jī)r(jià)值伴隨技術(shù)挑戰(zhàn)并存,該技術(shù)廣泛應(yīng)用于智能視頻監(jiān)控、智能安防等領(lǐng)域:當(dāng)一個(gè)孩子在繁忙的街道上迷路時(shí),ReID系統(tǒng)可以自動(dòng)搜索從附近捕獲的所有監(jiān)控視頻相機(jī)并立即找到這個(gè)孩子。還可幫助警方抓捕盜賊、逃犯;衣服顏色確實(shí)是行人重識(shí)別做出判斷一個(gè)重要因素,但光靠顏色是不足的。首先,攝像頭之間是有色差,并且會(huì)有光照的影響。其次,有撞衫(顏色相似)的人怎么辦,要找細(xì)節(jié),但比如顏色直方圖這種統(tǒng)計(jì)的特征就把細(xì)節(jié)給忽略了。在多個(gè)數(shù)據(jù)集上的測(cè)試表明,光用顏色特征是難以達(dá)到50%的top1正確率的。人臉識(shí)別技術(shù)較難拿來(lái)應(yīng)用:首先,廣泛存在后腦勺和側(cè)臉的情況,做正臉的人臉識(shí)別難。其次,攝像頭拍攝的像素可能不高,尤其是遠(yuǎn)景攝像頭里面人臉截出來(lái)很可能都沒(méi)有32x32的像素。所以人臉識(shí)別在實(shí)際的重識(shí)別應(yīng)用中很可能有限。
1、行人重識(shí)別技術(shù)現(xiàn)有挑戰(zhàn):
現(xiàn)有Person ReID技術(shù)面臨的挑戰(zhàn):
挑戰(zhàn)1.對(duì)于細(xì)微差異個(gè)體不易提取詳細(xì)細(xì)節(jié)信息
挑戰(zhàn)2.檢測(cè)人體區(qū)域不能很好地對(duì)齊圖像
挑戰(zhàn)3.遮擋干擾
2、Spindle Net 的提出
新的主流科研方案之一是在人體上檢測(cè)部件(手,腿,軀干等等)再進(jìn)行匹配識(shí)別——人體關(guān)節(jié)點(diǎn)定位檢測(cè)Spindle Net:以人體區(qū)域?yàn)閷?dǎo)向的人體特征分解與融合。一種基于人體區(qū)域引導(dǎo)多階段特征分解和樹(shù)結(jié)構(gòu)競(jìng)爭(zhēng)特征融合的新型卷積神經(jīng)網(wǎng)絡(luò)(CNN),稱(chēng)為主軸網(wǎng)。這是CNN框架中第一次考慮人體結(jié)構(gòu)信息來(lái)促進(jìn)特征學(xué)習(xí)。
3、Spindle Net的結(jié)構(gòu)特點(diǎn)
身體部位提議網(wǎng)絡(luò)RPN
第一步是身體關(guān)節(jié)定位,從一個(gè)輸入圖像中定位十四個(gè)人體關(guān)節(jié)。第二步是身體區(qū)域生成,根據(jù)身體關(guān)節(jié)位置Pi獲得七個(gè)身體子區(qū)域,包括三個(gè)宏觀子區(qū)域(頭肩,上身,下身)和四個(gè)微觀子區(qū)域(兩臂,兩腿)。
人體區(qū)域引導(dǎo)多階段特征提取網(wǎng)絡(luò)(FEN):FEN將人物圖像與區(qū)域提議一起作為輸入,計(jì)算全圖像的一個(gè)全局特征向量和與所提出的七個(gè)子體區(qū)域?qū)?yīng)的七個(gè)子區(qū)域特征向量。
樹(shù)結(jié)構(gòu)競(jìng)爭(zhēng)特征融合網(wǎng)絡(luò)(FFN):FFN將全圖像特征矢量和子區(qū)域特征矢量合并在一起來(lái)計(jì)算最終特征矢量。 最終的特征向量可以用來(lái)區(qū)分不同的人。
4、Spindle Net 實(shí)驗(yàn)結(jié)果分析
測(cè)試過(guò)程重復(fù)100次,平均結(jié)果報(bào)告顯示,Spindle可以在大多數(shù)現(xiàn)有的ReID數(shù)據(jù)集上達(dá)到最佳的Top-1精度。特別是Spindle在CUHK03數(shù)據(jù)集上可以達(dá)到88.5的Top1精度,比最好的比較方法高出10.1%。此外,Spindle可以在具有挑戰(zhàn)性的Market-1501數(shù)據(jù)集上實(shí)現(xiàn)76.9%的Top-1精度,比最佳比較好11.0%。這是因?yàn)镾pindle考慮了人身的地標(biāo)信息,并且在ReID管道中使用了身體區(qū)域多階段特征提取。此外,特征選擇和融合策略也有助于獲得良好的緊湊特征。