In this work, we introduce a Region Proposal Network(RPN) that shares full-image convolutional features with the detection network, thus enabling nearly cost-free region proposals.
文章是將RPN和 R-CNN做一個(gè)共享和融合,從而達(dá)到加速的目的。
整個(gè)文章最大的亮點(diǎn)就是RPN 與 R-CNN的統(tǒng)一化。
Region Proposal Networks
以圖片為輸入,輸出一系列方框及對(duì)應(yīng)的分?jǐn)?shù),本文通過(guò)全卷積網(wǎng)絡(luò)實(shí)現(xiàn)
滑動(dòng)窗口對(duì)應(yīng)出一個(gè)更低維度的vector,分別給兩個(gè)網(wǎng)絡(luò)做輸入:box-regression layer( reg) 和 Box-Classification layer(cls)
Translation-Invariant Anchors
cls : 產(chǎn)生分?jǐn)?shù) 是/不是 兩個(gè)分?jǐn)?shù)
reg: 產(chǎn)生box的位置 每個(gè)框四個(gè)數(shù)值
A loss Function for Learning Region Proposals
提出了訓(xùn)練中的loss函數(shù),個(gè)別參數(shù)的意義
Optimization
bp算法+SGD(隨機(jī)梯度下降)+ mini-batch
闡述了初始化策略(大家都沒(méi)差)
learning rate 等各種超參數(shù)
Sharing convolutional features for region proposal and object detection
兩個(gè)網(wǎng)絡(luò)的卷積網(wǎng)絡(luò)部分分別做一定的修改(兩個(gè)網(wǎng)絡(luò)的訓(xùn)練是獨(dú)立進(jìn)行的),使得兩個(gè)網(wǎng)絡(luò)可以共享卷積層部分
Implementation Details
列舉出了各個(gè)部分具體的細(xì)節(jié)和參數(shù)