卷積神經(jīng)網(wǎng)絡(luò)中的卷積與數(shù)學(xué)中卷積的區(qū)別

數(shù)學(xué)中的卷積和卷積神經(jīng)網(wǎng)絡(luò)中的卷積嚴(yán)格意義上是兩種不同的運(yùn)算

兩種卷積的區(qū)別

  • 數(shù)學(xué)上的卷積,要經(jīng)過180度旋轉(zhuǎn),然后對應(yīng)位置相乘并求和;而卷積神經(jīng)網(wǎng)絡(luò)中的卷積不需要經(jīng)過旋轉(zhuǎn)
  • 數(shù)學(xué)上的“卷積核”是給定的或者預(yù)知的,而卷積神經(jīng)網(wǎng)絡(luò)中的卷積是首先隨機(jī)初始化然后經(jīng)過訓(xùn)練而學(xué)習(xí)得到的。

數(shù)學(xué)上的卷積(這里指二維離散卷積)

原理

公式為
(f * g)(m, n) = \sum_{i}\sum_{j}f(i, j)g(m - i, n - j) ,(1)
如圖1所示,a矩陣是m \times n的矩陣,a矩陣經(jīng)過數(shù)學(xué)卷積運(yùn)算后得到c矩陣。現(xiàn)在我們計(jì)算c_{1,1}處的值,c矩陣其他值的計(jì)算方式與c_{1,1}一致。

圖1

根據(jù)公式(1),可得到c_{1,1}的計(jì)算過程如圖2,抽象為公式為
(f * g)(1, 1)=\sum_{i=0}^{2}\sum_{j=0}^{2}f(i, j)g(1-i, 1-j)

圖2

會(huì)發(fā)現(xiàn)圖2的計(jì)算過程就是圖3中顏色相同的塊相乘,并求和的過程。


圖3

總之,fg卷積的過程是,卷積核g繞中心點(diǎn)旋轉(zhuǎn)180度,然后與f對應(yīng)位置相乘并求和

應(yīng)用

  • 數(shù)學(xué)上的卷積能稱之為一種運(yùn)算,一定是因?yàn)橛兄鴱V泛應(yīng)用的
  • 數(shù)學(xué)上的卷積主要是為了諸如信號(hào)處理、求兩個(gè)隨機(jī)變量和的分布等而定義的運(yùn)算,所以需要“翻轉(zhuǎn)”是根據(jù)問題的需要而確定的

我們以“丟骰子為例”,使用單個(gè)下標(biāo)的離散卷積,公式為(f*g)(n)=\sum_{\tau=-\infty}^{+\infty}f(\tau)g(n-\tau)
。我們投擲兩顆骰子,求解兩顆骰子點(diǎn)數(shù)為4的概率,則

那么,兩枚骰子點(diǎn)數(shù)加起來為4的情況有:


因此,兩枚骰子點(diǎn)數(shù)加起來為4的概率為:
f(1)g(3) + f(2)g(2)+f(3)g(1)

符合卷積的定義,把它寫成標(biāo)準(zhǔn)的形式就是:
(f*g)(4)=\sum_{\tau=1}^{3}f(\tau)g(4-\tau)

卷積神經(jīng)網(wǎng)絡(luò)中的卷積

原理

本質(zhì)上就是卷積核與圖片局部區(qū)域?qū)?yīng)位置相乘并求和,或者為圖片的局部區(qū)域像素值加權(quán)求和,其中權(quán)值就是卷積核心。

應(yīng)用(圖像濾波)

  • 平滑濾波
  • 邊緣提取

這兩種操作,很容易通過設(shè)計(jì)特定的“卷積核”,然后將其與像素矩陣的對應(yīng)像素(不進(jìn)行旋轉(zhuǎn))相乘得到

舉例說明

我們對下述的圖像進(jìn)行平滑濾波和邊緣提取處理

使用下面的卷積核,就可以得到預(yù)期的效果

實(shí)現(xiàn)原理:

  • 平滑濾波,就是將中心像素與周圍鄰近的像素進(jìn)行平均,自然能夠“削峰填谷”,實(shí)現(xiàn)平滑濾波
  • 邊緣提取,就是將像素值復(fù)制n份,然后減去周圍的n個(gè)鄰近像素值。所以說所在區(qū)域位置像素值很相近,那么經(jīng)過卷積操作后,像素值就“減”為0;只有在邊緣位置時(shí)(與周圍像素值相差較大),像素值才不會(huì)被“減”為0,進(jìn)而被保留下來。

參考文獻(xiàn)

哪位高手能解釋一下卷積神經(jīng)網(wǎng)絡(luò)的卷積核?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容