姓名:楊安東;學號:21021210846;學院:電子工程學院
轉載自:https://blog.csdn.net/aBlueMouse/article/details/78710553
【嵌牛導讀】超分辨率技術(Super-Resolution, SR)是指從觀測到的低分辨率圖像重建出相應的高分辨率圖像,在監控設備、衛星圖像和醫學影像等領域都有重要的應用價值。
繼上篇,從VDSR之后開始繼續敘述。
【嵌牛鼻子】SRCNN,高分辨重構技術,深度學習
【嵌牛提問】什么是亞像素卷積層?
【嵌牛正文】
5. DRCN
(Deeply-Recursive Convolutional Network for Image Super-Resolution, CVPR2016)
DRCN與上面的VDSR都是來自首爾國立大學計算機視覺實驗室的工作,兩篇論文都發表在CVPR2016上,兩種方法的結果非常接近。DRCN第一次將之前已有的遞歸神經網絡(Recursive Neural Network)結構應用在超分辨率處理中。同時,利用殘差學習的思想(文中的跳躍連接(Skip-Connection)),加深了網絡結構(16個遞歸),增加了網絡感受野,提升了性能。DRCN網絡結構如下圖所示。
DRCN輸入的是插值后的圖像,分為三個模塊,第一個是Embedding network,相當于特征提取,第二個是Inference network, 相當于特征的非線性映射,第三個是Reconstruction network,即從特征圖像恢復最后的重建結果。其中的Inference network是一個遞歸網絡,即數據循環地通過該層多次。將這個循環進行展開,等效于使用同一組參數的多個串聯的卷積層,如下圖所示。
其中的?H1 到? HD 是D個共享參數的卷積層。將這D個卷積層的每一層的結果都通過相同的Reconstruction Net,在Reconstruction Net中與輸入的圖像相加,得到D個輸出重建結果。這些所有的結果在訓練時都同時被監督,即所有的遞歸都被監督,作者稱之為遞歸監督(Recursive-Supervision),避免了梯度消失/爆炸問題。將D個遞歸得到的結果再加權平均:
,得到一個總輸出。每個加權wd在訓練的過程中也不斷地更新。最終的目標函數就需要優化每一個遞歸層輸出的誤差和總輸出的誤差:
β表示的是權值衰減(weight decay)。α的初始值設置得比較高以使得訓練過程穩定,因為訓練開始的階段遞歸更容易收斂。隨著訓練的進行,α逐漸衰減來提升最終輸出的性能。
code: https://cv.snu.ac.kr/research/DRCN/
githug(tensorflow): https://github.com/jiny2001/deeply-recursive-cnn-tfhttps://
6. RED
(Image Restoration Using Convolutional Auto-encoders with Symmetric Skip Connections, NIPS2016)
這篇文章提出了由對稱的卷積層-反卷積層構成的網絡結構,作為一個編碼-解碼框架,可以學習由低質圖像到原始圖像端到端的映射。網絡結構如下圖所示。
RED網絡的結構是對稱的,每個卷積層都有對應的反卷積層。卷積層用來獲取圖像的抽象內容,反卷積層用來放大特征尺寸并且恢復圖像細節。卷積層將輸入圖像尺寸減小后,再通過反卷積層上采樣變大,使得輸入輸出的尺寸一樣。每一組鏡像對應的卷積層和反卷積層有著跳線連接結構,將兩部分具有同樣尺寸的特征(要輸入卷積層的特征和對應的反卷積層輸出的特征)做相加操作(ResNet那樣的操作)后再輸入到下一個反卷積層。這樣的結構能夠讓反向傳播信號能夠直接傳遞到底層,解決了梯度消失問題,同時能將卷積層的細節傳遞給反卷積層,能夠恢復出更干凈的圖片。可以看到,網絡中有一條線是將輸入的圖像連接到后面與最后的一層反卷積層的輸出相加,也就是VDSR中用到的方式,因此RED中間的卷積層和反卷積層學習的特征是目標圖像和低質圖像之間的殘差。RED的網絡深度為30層,損失函數用的均方誤差。
————————————————
版權聲明:本文為CSDN博主「aBlueMouse」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/aBlueMouse/article/details/78710553