數(shù)學(xué)中的卷積和卷積神經(jīng)網(wǎng)絡(luò)中的卷積嚴(yán)格意義上是兩種不同的運(yùn)算
兩種卷積的區(qū)別
- 數(shù)學(xué)上的卷積,要經(jīng)過180度旋轉(zhuǎn),然后對應(yīng)位置相乘并求和;而卷積神經(jīng)網(wǎng)絡(luò)中的卷積不需要經(jīng)過旋轉(zhuǎn)。
- 數(shù)學(xué)上的“卷積核”是給定的或者預(yù)知的,而卷積神經(jīng)網(wǎng)絡(luò)中的卷積是首先隨機(jī)初始化然后經(jīng)過訓(xùn)練而學(xué)習(xí)得到的。
數(shù)學(xué)上的卷積(這里指二維離散卷積)
原理
公式為
如圖1所示,a矩陣是的矩陣,a矩陣經(jīng)過數(shù)學(xué)卷積運(yùn)算后得到c矩陣。現(xiàn)在我們計(jì)算
處的值,c矩陣其他值的計(jì)算方式與
一致。
圖1
根據(jù)公式(1),可得到的計(jì)算過程如圖2,抽象為公式為
圖2
會(huì)發(fā)現(xiàn)圖2的計(jì)算過程就是圖3中顏色相同的塊相乘,并求和的過程。
圖3
總之,和
卷積的過程是,卷積核
繞中心點(diǎn)旋轉(zhuǎn)180度,然后與
對應(yīng)位置相乘并求和
應(yīng)用
- 數(shù)學(xué)上的卷積能稱之為一種運(yùn)算,一定是因?yàn)橛兄鴱V泛應(yīng)用的
- 數(shù)學(xué)上的卷積主要是為了諸如信號(hào)處理、求兩個(gè)隨機(jī)變量和的分布等而定義的運(yùn)算,所以需要“翻轉(zhuǎn)”是根據(jù)問題的需要而確定的
我們以“丟骰子為例”,使用單個(gè)下標(biāo)的離散卷積,公式為
。我們投擲兩顆骰子,求解兩顆骰子點(diǎn)數(shù)為4的概率,則
那么,兩枚骰子點(diǎn)數(shù)加起來為4的情況有:
因此,兩枚骰子點(diǎn)數(shù)加起來為4的概率為:
符合卷積的定義,把它寫成標(biāo)準(zhǔn)的形式就是:
卷積神經(jīng)網(wǎng)絡(luò)中的卷積
原理
本質(zhì)上就是卷積核與圖片局部區(qū)域?qū)?yīng)位置相乘并求和,或者為圖片的局部區(qū)域像素值加權(quán)求和,其中權(quán)值就是卷積核心。
應(yīng)用(圖像濾波)
- 平滑濾波
- 邊緣提取
這兩種操作,很容易通過設(shè)計(jì)特定的“卷積核”,然后將其與像素矩陣的對應(yīng)像素(不進(jìn)行旋轉(zhuǎn))相乘得到
舉例說明
我們對下述的圖像進(jìn)行平滑濾波和邊緣提取處理
使用下面的卷積核,就可以得到預(yù)期的效果
實(shí)現(xiàn)原理:
- 平滑濾波,就是將中心像素與周圍鄰近的像素進(jìn)行平均,自然能夠“削峰填谷”,實(shí)現(xiàn)平滑濾波
- 邊緣提取,就是將像素值復(fù)制n份,然后減去周圍的n個(gè)鄰近像素值。所以說所在區(qū)域位置像素值很相近,那么經(jīng)過卷積操作后,像素值就“減”為0;只有在邊緣位置時(shí)(與周圍像素值相差較大),像素值才不會(huì)被“減”為0,進(jìn)而被保留下來。