盤一下多分類邏輯回歸的攻擊方案。
#修改label分布, 對(duì)于non-target
#還是梯度下降那一套
#求偏導(dǎo)數(shù)
結(jié)果為
上式展開
#攻擊經(jīng)驗(yàn)總結(jié)
在不定向攻擊里,得到fooltaget存在著 隨著攻擊參數(shù)變化的分布。可以用混淆矩陣描述這種攻擊分布地圖,在大部分的攻擊里,盡量給圖片造成微小的擾動(dòng),同時(shí)保證安全的區(qū)域。
攻擊完后的fooledtaget樣本,自然可以進(jìn)行更強(qiáng)防御性模型的訓(xùn)練,有可能需要整整一層來(lái)進(jìn)行防止。
#攻擊的通用化,思考向GAN演化可能性