北大計算所王勇濤團隊工作 是與阿里巴巴AI實驗室橫向合作課題 智能駕駛場景下車輛目標3D包圍框回歸算法研究,2018.01-2018.09
http://www.icst.pku.edu.cn/cpdp/index.php/research-team/11-wangyongtao
使用的是淺層特征來檢測小目標,淺層特征不具備豐富的語義信息,因此對分類來說區分度不高,是否就會分錯。
refinedet提供的方案,用encode-decode 結構來加深網絡 ,并且用上采樣特征圖的方式來使大的特征圖能獲取更多的語義信息。 用級聯回歸的方式,encode模塊獲取粗糙的位置,decode模塊獲取準確位置。
ssd是特征金字塔的架構 conv4_3 是用來檢測小目標,其他的用來檢測大一些的目標, anchor size 根據訓練集數據scale 分布決定 這篇是從增強特征的角度來改善ssd
主要是cfe模塊, 融合了xception ,resnext, large separable(引文8) 模塊。
加了四個cfe模塊 和兩個ffb模塊 cfe模塊分為兩個branch,長的都差不多,就是K*1和1×k卷積的次序不一樣(不一樣的好處是什么,為什么要這么設計?)
查了一下,這個是inception v3里面的
用n×1 和1×n的來代替 n×n的 factorization conv 在feature map 在12到20的時候work well 早期用效果不好
K*1和1×k卷積 出自于large kernel matters 里面的 global convolutional network 模塊這個模塊感覺就是用提升大的感受野,然后做了一系列的實驗來驗證這個模塊還是很work的
看light_head 里面,孫劍的新的一篇文章引用了這個 MetaAnchor: Learning to Detect Objects with Customized Anchors是從anchor這個角度切入的 nips2018 有空的時候可以翻一下 然后又翻到一篇文章 iou-net Acquisition of Localization Con?dence for Accurate Object Detection 這個直覺上看還是可以的 就是把iou 融入到了sgd的優化目標中
添加不同模塊的效果
multiscale 的效果很明顯 直接將效果提升從22.34 到29.69