2019-01-25 探索攻擊邏輯回歸圖像多分類

盤一下多分類邏輯回歸的攻擊方案。

#修改label分布, 對(duì)于non-target

D(t|y(w,x)) = \prod_{n=1}^{N} \prod_{k=1}^{K} y_{n,k}^{1-t_{n,k}}

#還是梯度下降那一套

\nabla_{x} \hat{D} = \nabla_{x} log D = \nabla_{x} \sum_{n=1}^{N} \sum_{k=1}^{K} (1-t_{k}) \log y_{k}

\hat{D} = \sum_{n=1}^{N} \sum_{k=1}^{K} (1-t_{n,k}) \log y_{n,k}

 \partial_{x} \hat{D} = \sum_{n=1}^{N} \sum_{k=1}^{K} \frac {\partial \hat{D}}{\partial y_{k}} \frac {\partial y_{k}}{\partial x}

#求偏導(dǎo)數(shù)

\frac {\partial \hat{D}}{\partial y_{k}}  = \frac {1-t_{k}} {y_{k}}

 \frac {\partial y_{k}}{\partial x} = \frac{\Sigma \cdot \partial_{x} \exp(a_{k}) - \exp(a_{k}) \partial_{x} \Sigma}{\Sigma^{2}} = \frac {\sum_{c=1}^{K} \exp(a_{c}) \cdot \vec{w}_{k} \exp(a_{k}) - \exp(a_{k}) \sum_{c=1}^{K} \vec{w}_{c} \exp(a_{c})} {\sum_{c=1}^{K}\exp(a_{c}) \cdot \sum_{c=1}^{K}\exp(a_{c})}

 \frac {\partial y_{k}}{\partial x} =  y_{k} \vec{w}_{k} - y_{k} \cdot \sum_{c=1}^{K} y_{c} \vec{w}_{c}

結(jié)果為

 \nabla_{x} \log D = \sum_{k=1}^{K} (1-t_{k}) \cdot  (\vec{w}_{k} - \sum_{c=1}^{K} y_{c} \vec{w}_{c})

上式展開

 x_{p, m} = x_{m} + \delta x_{m} = x_{m} + \eta \cdot \nabla_{x_{m,c}} D_{m,c}

x_{p, m} = x_{m} + \eta \sum_{k=1}^{K} (1-t_{m,k}) \cdot  (\vec{w}_{k} - \sum_{c=1}^{K} y_{m,c} \vec{w}_{c})

#攻擊經(jīng)驗(yàn)總結(jié)

在不定向攻擊里,得到fooltaget存在著 隨著攻擊參數(shù)變化的分布。可以用混淆矩陣描述這種攻擊分布地圖,在大部分的攻擊里,盡量給圖片造成微小的擾動(dòng),同時(shí)保證安全的區(qū)域。

攻擊完后的fooledtaget樣本,自然可以進(jìn)行更強(qiáng)防御性模型的訓(xùn)練,有可能需要整整一層來(lái)進(jìn)行防止。

#攻擊的通用化,思考向GAN演化可能性

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容

  • 文章作者:Tyan博客:noahsnail.com | CSDN | 簡(jiǎn)書 聲明:作者翻譯論文僅為學(xué)習(xí),如有侵權(quán)請(qǐng)...
    SnailTyan閱讀 5,139評(píng)論 0 8
  • 昨天是期中考試的日子,雖然這次改了考察形式,但我和他爹還是挺在意兒子的表現(xiàn)和成績(jī),數(shù)學(xué)是口算檢測(cè),計(jì)算能力一直是兒...
    燕飛飛2017閱讀 151評(píng)論 1 1
  • 轉(zhuǎn)自: http://web.jobbole.com/92875/ 一、xss攻擊 XSS這類安全問(wèn)題發(fā)生的本質(zhì)原...
    胡儒清閱讀 876評(píng)論 0 1
  • 虛偽與激進(jìn)偽裝的本我在欲望中貪婪的汲取最后的快感——11月30
    takeshi_勇閱讀 203評(píng)論 0 0