遷移網絡的應用-圖像風格遷移

圖片風格遷移指的是將一個圖片的風格轉換到另一個圖片中，如圖所示：

原圖片經過一系列的特征變換，具有了新的紋理特征，這就叫做風格遷移。

VGG網絡

在實現風格遷移之前，需要先簡單了解一下VGG網絡（由于VGG網絡不斷使用卷積提取特征的網絡結構和準確的圖像識別效率，在這里我們使用VGG網絡來進行圖像的風格遷移）。

圖1

如上圖所示，從A-E的每一列都表示了VGG網絡的結構原理，其分別為：VGG-11，VGG-13，VGG-16，VGG-19，如下圖，一副圖片經過VGG-19網絡結構可以最后得到一個分類結構。

風格遷移

對一副圖像進行風格遷移，需要清楚的有兩點。

生成的圖像需要具有原圖片的內容特征
生成的圖像需要具有風格圖片的紋理特征

根據這兩點，可以確定，要想實現風格遷移，需要有兩個loss值：
一個是生成圖片的內容特征與原圖的內容特征的loss，另一個是生成圖片的紋理特征與風格圖片的紋理特征的loss。

而對一張圖片進行不同的特征（內容特征和紋理特征）提取，只需要使用不同的卷積結構進行訓練即可以得到。這時我們需要用到兩個神經網絡。

再回到VGG網絡上，VGG網絡不斷使用卷積層來提取特征，利用特征將物品進行分類，所以該網絡中提取內容和紋理特征的參數都可以進行遷移使用。故需要將生成的圖片經過VGG網絡的特征提取，再分別針對內容和紋理進行特征的loss計算。

如圖，假設初始化圖像x（Input image）是一張隨機圖片，我們經過fw（image Transform Net）網絡進行生成，生成圖片y。
此時y需要和風格圖片ys進行特征的計算得到一個loss_style，與內容圖片yc進行特征的計算得到一個loss_content，假設loss=loss_style+loss_content，便可以對fw的網絡參數進行訓練。

現在就可以看網上很常見的一張圖片了：

圖1

相較于我畫的第一張圖，這即對VGG內的loss求值過程進行了細化。細化的結果可以分為兩個方面：（1）內容損失（2）風格損失

內容損失

由于圖1中使用的模型是VGG-16，那么即相當于在VGG-16的relu3-3處，對兩張圖片求得的特征進行計算求損失，計算的函數如下：

簡言之，假設yc求得的特征矩陣是φ(y)，生成圖片求得的特征矩陣為φ(y^)，且

c=φ.channel，w=φ.weight，h=φ.height，則有：

可以簡單使用代碼實現：

def content_loss(content_img, rand_img):
    content_layers = [('relu3_3', 1.0)]
    content_loss = 0.0
    # 逐個取出衡量內容損失的vgg層名稱及對應權重
    for layer_name, weight in content_layers:

        # 計算特征矩陣
        p = get_vgg(content_img, layer_name)
        x = get_vgg(rand_img, layer_name)
        # 長x寬xchannel
        M = p.shape[1] * p.shape[2] * p.shape[3]

        # 根據公式計算損失，并進行累加
        content_loss += (1.0 / M) * tf.reduce_sum(tf.pow(p - x, 2)) * weight

    # 將損失對層數取平均
    content_loss /= len(content_layers)
    return content_loss

風格損失

風格損失由多個特征一同計算，首先需要計算Gram Matrix

Gram Matrix實際上可看做是feature之間的偏心協方差矩陣（即沒有減去均值的協方差矩陣），在feature map中，每一個數字都來自于一個特定濾波器在特定位置的卷積，因此每個數字就代表一個特征的強度，而Gram計算的實際上是兩兩特征之間的相關性，哪兩個特征是同時出現的，哪兩個是此消彼長的等等，同時，Gram的對角線元素，還體現了每個特征在圖像中出現的量，因此，Gram有助于把握整個圖像的大體風格。有了表示風格的Gram Matrix，要度量兩個圖像風格的差異，只需比較他們Gram Matrix的差異即可。故在計算損失的時候函數如下：

在實際使用時，該loss的層級一般選擇由低到高的多個層，比如VGG16中的第2、4、7、10個卷積層，然后將每一層的style loss相加。

第三個部分不是必須的，被稱為Total Variation Loss。實際上是一個平滑項（一個正則化項），目的是使生成的圖像在局部上盡可能平滑，而它的定義和馬爾科夫隨機場（MRF）中使用的平滑項非常相似。其中yn+1是yn的相鄰像素。

代碼實現以上函數：

# 求gamm矩陣
def gram(x, size, deep):
    x = tf.reshape(x, (size, deep))
    g = tf.matmul(tf.transpose(x), x)
    return g

def style_loss(style_img, rand_img):
    style_layers = [('relu1_2', 0.25), ('relu2_2', 0.25), ('relu3_3', 0.25), ('reluv4_3', 0.25)]
    style_loss = 0.0
    # 逐個取出衡量風格損失的vgg層名稱及對應權重
    for layer_name, weight in style_layers:

        # 計算特征矩陣
        a = get_vgg(style_img, layer_name)
        x = get_vgg(rand_img, layer_name)

        # 長x寬
        M = a.shape[1] * a.shape[2]
        N = a.shape[3]

        # 計算gram矩陣
        A = gram(a, M, N)
        G = gram(x, M, N)

        # 根據公式計算損失，并進行累加
        style_loss += (1.0 / (4 * M * M * N * N)) * tf.reduce_sum(tf.pow(G - A, 2)) * weight
    # 將損失對層數取平均
    style_loss /= len(style_layers)
    return style_loss

主代碼實現

代碼實現主要分為4步：

1、隨機生成圖片
2、讀取內容和風格圖片
3、計算總的loss
4、訓練修改生成圖片的參數，使得loss最小

簡單實現主要函數

def main():
    # 生成圖片
    rand_img = tf.Variable(random_img(WIGHT, HEIGHT), dtype=tf.float32）
    with tf.Session() as sess:

        content_img = cv2.imread('content.jpg')
        style_img = cv2.imread('style.jpg')

        # 計算loss值
        cost = ALPHA * content_loss(content_img, rand_img) + BETA * style_loss(style_img, rand_img)
        optimizer = tf.train.AdamOptimizer(LEARNING_RATE).minimize(cost)

        sess.run(tf.global_variables_initializer())
        
        for step in range(TRAIN_STEPS):
            # 訓練
            sess.run([optimizer,  rand_img])

            if step % 50 == 0:
                img = sess.run(rand_img)
                img = np.clip(img, 0, 255).astype(np.uint8)
                name = OUTPUT_IMAGE + "http://" + str(step) + ".jpg"
                cv2.imwrite(name, img)

遷移模型實現

由于在進行loss值求解時，需要在多個網絡層求得特征值，并根據特征值進行帶權求和，所以需要根據已有的VGG網絡，取其參數，重新建立VGG網絡。
注意：在這里使用到的是VGG-19網絡：

在重建的之前，首先應該下載Google已經訓練好的VGG-19網絡，以便提取出已經訓練好的參數，在重建的VGG-19網絡中重新利用。
下載地址：http://www.vlfeat.org/matconvnet/models/beta16/imagenet-vgg-verydeep-19.mat

下載得到.mat文件以后，便可以進行網絡重建了。已知VGG-19網絡的網絡結構如上述圖1中的E網絡，則可以根據E網絡的結構對網絡重建，VGG-19網絡：

進行重建即根據VGG-19模型的結構重新創建一個結構相同的神經網絡，提取出已經訓練好的參數作為新的網絡的參數，設置為不可改變的常量即可。

def vgg19():
    layers=(
        'conv1_1','relu1_1','conv1_2','relu1_2','pool1',
        'conv2_1','relu2_1','conv2_2','relu2_2','pool2',
        'conv3_1','relu3_1','conv3_2','relu3_2','conv3_3','relu3_3','conv3_4','relu3_4','pool3',
        'conv4_1','relu4_1','conv4_2','relu4_2','conv4_3','relu4_3','conv4_4','relu4_4','pool4',
        'conv5_1','relu5_1','conv5_2','relu5_2','conv5_3','relu5_3','conv5_4','relu5_4','pool5'
    )
    vgg = scipy.io.loadmat('D://python//imagenet-vgg-verydeep-19.mat')
    weights = vgg['layers'][0]

    network={}
    net = tf.Variable(np.zeros([1, 300, 450, 3]), dtype=tf.float32)
    network['input'] = net
    for i,name in enumerate(layers):
        layer_type=name[:4]
        if layer_type=='conv':
            kernels = weights[i][0][0][0][0][0]
            bias = weights[i][0][0][0][0][1]
            conv=tf.nn.conv2d(net,tf.constant(kernels),strides=(1,1,1,1),padding='SAME',name=name)
            net=tf.nn.relu(conv + bias)
        elif layer_type=='pool':
            net=tf.nn.max_pool(net,ksize=(1,2,2,1),strides=(1,2,2,1),padding='SAME')
        network[name]=net
    return network

由于計算風格特征和內容特征時數據都不會改變，所以為了節省訓練時間，在訓練之前先計算出特征結果(該函數封裝在以下代碼get_neck()函數中)。
總的代碼如下：

import tensorflow as tf
import numpy as np
import scipy.io
import cv2
import scipy.misc

HEIGHT = 300
WIGHT = 450
LEARNING_RATE = 1.0
NOISE = 0.5
ALPHA = 1
BETA = 500

TRAIN_STEPS = 200

OUTPUT_IMAGE = "D://python//img"
STYLE_LAUERS = [('conv1_1', 0.2), ('conv2_1', 0.2), ('conv3_1', 0.2), ('conv4_1', 0.2), ('conv5_1', 0.2)]
CONTENT_LAYERS = [('conv4_2', 0.5), ('conv5_2',0.5)]


def vgg19():
    layers=(
        'conv1_1','relu1_1','conv1_2','relu1_2','pool1',
        'conv2_1','relu2_1','conv2_2','relu2_2','pool2',
        'conv3_1','relu3_1','conv3_2','relu3_2','conv3_3','relu3_3','conv3_4','relu3_4','pool3',
        'conv4_1','relu4_1','conv4_2','relu4_2','conv4_3','relu4_3','conv4_4','relu4_4','pool4',
        'conv5_1','relu5_1','conv5_2','relu5_2','conv5_3','relu5_3','conv5_4','relu5_4','pool5'
    )
    vgg = scipy.io.loadmat('D://python//imagenet-vgg-verydeep-19.mat')
    weights = vgg['layers'][0]

    network={}
    net = tf.Variable(np.zeros([1, 300, 450, 3]), dtype=tf.float32)
    network['input'] = net
    for i,name in enumerate(layers):
        layer_type=name[:4]
        if layer_type=='conv':
            kernels = weights[i][0][0][0][0][0]
            bias = weights[i][0][0][0][0][1]
            conv=tf.nn.conv2d(net,tf.constant(kernels),strides=(1,1,1,1),padding='SAME',name=name)
            net=tf.nn.relu(conv + bias)
        elif layer_type=='pool':
            net=tf.nn.max_pool(net,ksize=(1,2,2,1),strides=(1,2,2,1),padding='SAME')
        network[name]=net
    return network


# 求gamm矩陣
def gram(x, size, deep):
    x = tf.reshape(x, (size, deep))
    g = tf.matmul(tf.transpose(x), x)
    return g


def style_loss(sess, style_neck, model):
    style_loss = 0.0
    for layer_name, weight in STYLE_LAUERS:
        # 計算特征矩陣
        a = style_neck[layer_name]
        x = model[layer_name]
        # 長x寬
        M = a.shape[1] * a.shape[2]
        N = a.shape[3]

        # 計算gram矩陣
        A = gram(a, M, N)
        G = gram(x, M, N)

        # 根據公式計算損失，并進行累加
        style_loss += (1.0 / (4 * M * M * N * N)) * tf.reduce_sum(tf.pow(G - A, 2)) * weight
        # 將損失對層數取平均
    style_loss /= len(STYLE_LAUERS)
    return style_loss


def content_loss(sess, content_neck, model):
    content_loss = 0.0
    # 逐個取出衡量內容損失的vgg層名稱及對應權重

    for layer_name, weight in CONTENT_LAYERS:
        # 計算特征矩陣
        p = content_neck[layer_name]
        x = model[layer_name]
        # 長x寬xchannel

        M = p.shape[1] * p.shape[2]
        N = p.shape[3]

        lss = 1.0 / (M * N)
        content_loss += lss * tf.reduce_sum(tf.pow(p - x, 2)) * weight
        # 根據公式計算損失，并進行累加

    # 將損失對層數取平均
    content_loss /= len(CONTENT_LAYERS)
    return content_loss


def random_img(height, weight, content_img):
    noise_image = np.random.uniform(-20, 20, [1, height, weight, 3])
    random_img = noise_image * NOISE + content_img * (1 - NOISE)
    return random_img


def get_neck(sess, model, content_img, style_img):
    sess.run(tf.assign(model['input'], content_img))
    content_neck = {}
    for layer_name, weight in CONTENT_LAYERS:
        # 計算特征矩陣
        p = sess.run(model[layer_name])
        content_neck[layer_name] = p
    sess.run(tf.assign(model['input'], style_img))
    style_content = {}
    for layer_name, weight in STYLE_LAUERS:
        # 計算特征矩陣
        a = sess.run(model[layer_name])
        style_content[layer_name] = a
    return content_neck, style_content


def main():
    model = vgg19()
    content_img = cv2.imread('D://a//content1.jpg')
    content_img = cv2.resize(content_img, (450, 300))
    content_img = np.reshape(content_img, (1, 300, 450, 3)) - [128.0, 128.2, 128.0]
    style_img = cv2.imread('D://a//style1.jpg')
    style_img = cv2.resize(style_img, (450, 300))
    style_img = np.reshape(style_img, (1, 300, 450, 3)) - [128.0, 128.2, 128.0]

    # 生成圖片
    rand_img = random_img(HEIGHT, WIGHT, content_img)

    with tf.Session() as sess:
        # 計算loss值
        content_neck, style_neck = get_neck(sess, model, content_img, style_img)
        cost = ALPHA * content_loss(sess, content_neck, model) + BETA * style_loss(sess, style_neck, model)
        optimizer = tf.train.AdamOptimizer(LEARNING_RATE).minimize(cost)

        sess.run(tf.global_variables_initializer())
        sess.run(tf.assign(model['input'], rand_img))
        for step in range(TRAIN_STEPS):
            print(step)
            # 訓練
            sess.run(optimizer)

            if step % 10 == 0:
                img = sess.run(model['input'])
                img += [128, 128, 128]
                img = np.clip(img, 0, 255).astype(np.uint8)
                name = OUTPUT_IMAGE + "http://" + str(step) + ".jpg"
                img = img[0]
                cv2.imwrite(name, img)

        img = sess.run(model['input'])
        img += [128, 128, 128]
        img = np.clip(img, 0, 255).astype(np.uint8)
        cv2.imwrite("D://end.jpg", img[0])

main()

由于時間原因，我訓練了200次后得出的結果為：

可以增加訓練迭代次數，獲得效果更佳的風格遷移圖像。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,443評論 6贊 532
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,530評論 3贊 416
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,407評論 0贊 375
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,981評論 1贊 312
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,759評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,204評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,263評論 3贊 441
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,415評論 0贊 288
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,955評論 1贊 336
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,782評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,983評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,528評論 5贊 359
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,222評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,650評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,892評論 1贊 286
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,675評論 3贊 392
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,967評論 2贊 374

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

遷移網絡的應用-圖像風格遷移

遷移網絡的應用-圖像風格遷移

VGG網絡

風格遷移

內容損失

風格損失

主代碼實現

遷移模型實現

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

遷移網絡的應用-圖像風格遷移

VGG網絡

風格遷移

內容損失

風格損失

主代碼實現

遷移模型實現

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频