TensorFlow 學習之三TensorBoard實戰

TensorBoard簡介

TensorFlow 的計算過程其實是一個黑盒過程,為了便于使用者對TensorFlow程序的理解,調試和優化 ,TensorFlow 提供TensorBoard 這套組件來支持對代碼的可視化理解。TensorBoard 是一組Web應用組件;其主要的作用是用可視化的方式展示TensorFlow的計算過程和計算圖的形態;


TensorBoard可視化

TensorBoard 是通過讀取TensorFlow的事件文件信息來進行可視化的。TensorFlow的事件文件包含的是tensorflow運行時的summary data。

Summary Operations

Summary Operation提供了這樣一些工具用來記錄computational graph的運行信息:
下面兩個類提供了output 接口,用來將summary信息寫到事件文件中去。

  • tf.summary.FileWriter
  • tf.summary.FileWriterCache

下面是一些Summary Operation

  • tf.summary.tensor_summary: Outputs a Summary protocol buffer with a serialized tensor.proto
  • tf.summary.scalar: Outputs a Summary protocol buffer containing a single scalar value
  • tf.summary.histogram: Outputs a Summary protocol buffer with a histogram
  • tf.summary.audio: Outputs a Summary protocol buffer with audio.
  • tf.summary.image: Outputs a Summary protocol buffer with images.
  • tf.summary.merge: This op creates a Summary protocol buffer that contains the union of all the values in the input summaries.
  • tf.summary.merge_all: Merges all summaries collected in the default graph

生成summary 過程

  1. 首先創建需要進行收集summary data 的 computational graph,并且確定需要觀察的節點。
    例如:假設在訓練一個cnn去識別MNIST的數字的模型中, 你可能需要記錄learning rate, 損失函數值的變化過程,這時你可以給輸出learning rate的值和輸出損失函數值的節點分別附加一個tf.summary.scalar操作。
  2. 合并summary Ops:
    tensorflow 中的Operation不會做任何事情,直到有人去運行它,或者有其它的運行的Operation依賴于它的輸出作為輸入;而我們在第一步附加給compuatiaonal graph 節點上的summary operation 是一種相對于目標graph 是外圍的節點,他們并不被依賴,所以需要我們主動的去運行summary Operatiton;當然一個一個手動的去運行summary operation 顯然是很麻煩的,所以這一步需要用tf.summary.merge_all 將所有的summary operation 合并成單個operation。
  3. 運行合并后的summary operation:
    運行summary operation將生成序列化的Summary protobuf object, 之后將其傳給 tf.summary.FileWriter , FileWrite 會將summary object 寫入到事件文件中去。
  4. 設置運行的頻次:
    在模型的訓練過程中往往都要進行多步迭代,我們可以在圖每次計算一次時運行summary, 但當次數迭代較多時這就沒必要了,一般可以設置每訓練多少步運行一次summary operation。

launch Tensorboard

可以用下面兩中方式啟動tensorbord:

  • python -m tensorflow.tensorboard --logdir=path/to/log-directory
  • tensorboard --logdir=path/to/log-directory
    這里的logdir 指的是tf.summary.FileWriter 寫的事件文件的文件夾;如果logdir 文件夾含有子文件夾,且這個子文件夾中含有不同的事件文件,Tensorboard 也會對其進行可視話。當Tensorboard 啟動好后,可以通過瀏覽器訪問 localhost:6006 去查看Tensorboard的可視化結果。

TensorBoard: Embedding Visualization

前面我們介紹了tensorborad的流程和用法,這里我們介紹Tensorboard另外一個有用的功能,embedding visuaslization, 其實質就是將高維的數據按照特定的算法映射到2維或者3維進行展示。

TensorBoard 有一個內置的可是話工具叫做 Embedding Projector,主要是為了方便交互式的展示和分析高維數據, embedding projector 會讀取在模型文件中的embedings, 并且加載模型中任何2維的tensor。

Embedding Projector 默認的使用PCA將高維數據,映射到3維空間,但其也提供了t-SNE 用來做映射。

創建embedding

需要這么三步來可視化embeddings:

  • 創建一個2維的tensor來記錄embedding :
    embedding_var = tf.Variable(....)
  • 周期性的將模型變量保存在logdir 下面的checkpoint文件中
 saver = tf.train.Saver()
 saver.save(session, os.path.join(LOG_DIR, "model.ckpt"), step)
  • (可選)對embedding 附加元數據:
    如果你想對embedding 的數據添加元數據(如標簽,圖片),你可以通過在log_dir文件夾下面保存一個projector_config.pbtxt指定元數據信息,或者通過python API
    例如:下面的projector_config.pbtxt為word_embedding附加一個存在logdir/metadata.tsv下的元數據:
 embeddings {
  tensor_name: 'word_embedding'
  metadata_path: '$LOG_DIR/metadata.tsv'
}

元數據

通常,embeddings都會有附加元數據, 元數據必須在模型的checkpoint 外面用一個單獨的文件保存。 元數據文件的格式是TSV格式的文件, 即用tab鍵分隔的文件,并且這個文件必須帶有文件頭;
一個具體的文件內容的例子:

Word\tFrequency
Airplane\t345
Car\t241
...

需要注意的一點是元文件中數據的順序必須和embedding tenor的順序一致;

圖片元數據

如果你需要將圖片數據附加到embeddings 上去,你需要將每個數據點代表的圖片合成一張整的圖片,這張圖片叫做sprite image。
生成完sprite image后,需要告訴Embedding projector 去加載文件:

  embedding.sprite.image_path = PATH_TO_SPRITE_IMAGE
 # Specify the width and height of a single thumbnail.
  embedding.sprite.single_image_dim.extend([w, h])

Graph的可視化:

TensorFlow 的computation graphs 一般都會比較復雜. 對其進行可視化能幫助人們理解和調試程序。
對圖進行可視化,只需運行TensorBoard命令,并且點擊graph 按件就可以看到了。
這里主要講的一點是name scoping

name scope

由于深度學習模型往往有成千上萬個節點,在有限的空間中展示這么多細節是很不友好的,tensorflow 里面有個name scope 的機制,可以將一些variable 劃到一個scope中去, 然后在展示graph的時候,在同一個name scope 都會被折疊進一個節點中去,用戶可以自己去展開。
另外name scope 也類似java的包一樣,解決了variable 命名的問題,這里就不細講了。

實戰:基于CNN對mnist數字識別

import os
import tensorflow as tf
import sys
import urllib

if sys.version_info[0] >= 3:
    from urllib.request import urlretrieve
else:
    from urllib import urlretrieve

LOGDIR = '/tmp/mnist_tutorial/'
GITHUB_URL = 'https://raw.githubusercontent.com/mamcgrath/TensorBoard-TF-Dev-Summit-Tutorial/master/'

### MNIST EMBEDDINGS ###
mnist = tf.contrib.learn.datasets.mnist.read_data_sets(train_dir=LOGDIR + 'data', one_hot=True)
### Get a sprite and labels file for the embedding projector ###
urlretrieve(GITHUB_URL + 'labels_1024.tsv', LOGDIR + 'labels_1024.tsv')
urlretrieve(GITHUB_URL + 'sprite_1024.png', LOGDIR + 'sprite_1024.png')


# Add convolution layer
def conv_layer(input, size_in, size_out, name="conv"):
  with tf.name_scope(name):
    w = tf.Variable(tf.truncated_normal([5, 5, size_in, size_out], stddev=0.1), name="W")
    b = tf.Variable(tf.constant(0.1, shape=[size_out]), name="B")
    conv = tf.nn.conv2d(input, w, strides=[1, 1, 1, 1], padding="SAME")
    act = tf.nn.relu(conv + b)
    tf.summary.histogram("weights", w)
    tf.summary.histogram("biases", b)
    tf.summary.histogram("activations", act)
    return tf.nn.max_pool(act, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")


# Add fully connected layer
def fc_layer(input, size_in, size_out, name="fc"):
  with tf.name_scope(name):
    w = tf.Variable(tf.truncated_normal([size_in, size_out], stddev=0.1), name="W")
    b = tf.Variable(tf.constant(0.1, shape=[size_out]), name="B")
    act = tf.nn.relu(tf.matmul(input, w) + b)
    tf.summary.histogram("weights", w)
    tf.summary.histogram("biases", b)
    tf.summary.histogram("activations", act)
    return act


def mnist_model(learning_rate, use_two_conv, use_two_fc, hparam):
  tf.reset_default_graph()
  sess = tf.Session()

  # Setup placeholders, and reshape the data
  x = tf.placeholder(tf.float32, shape=[None, 784], name="x")
  x_image = tf.reshape(x, [-1, 28, 28, 1])
  tf.summary.image('input', x_image, 3)
  y = tf.placeholder(tf.float32, shape=[None, 10], name="labels")

  if use_two_conv:
    conv1 = conv_layer(x_image, 1, 32, "conv1")
    conv_out = conv_layer(conv1, 32, 64, "conv2")
  else:
    conv1 = conv_layer(x_image, 1, 64, "conv")
    conv_out = tf.nn.max_pool(conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")

  flattened = tf.reshape(conv_out, [-1, 7 * 7 * 64])


  if use_two_fc:
    fc1 = fc_layer(flattened, 7 * 7 * 64, 1024, "fc1")
    embedding_input = fc1
    embedding_size = 1024
    logits = fc_layer(fc1, 1024, 10, "fc2")
  else:
    embedding_input = flattened
    embedding_size = 7*7*64
    logits = fc_layer(flattened, 7*7*64, 10, "fc")

  with tf.name_scope("xent"):
    xent = tf.reduce_mean(
        tf.nn.softmax_cross_entropy_with_logits(
            logits=logits, labels=y), name="xent")
    tf.summary.scalar("xent", xent)

  with tf.name_scope("train"):
    train_step = tf.train.AdamOptimizer(learning_rate).minimize(xent)

  with tf.name_scope("accuracy"):
    correct_prediction = tf.equal(tf.argmax(logits, 1), tf.argmax(y, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
    tf.summary.scalar("accuracy", accuracy)

  summ = tf.summary.merge_all()


  embedding = tf.Variable(tf.zeros([1024, embedding_size]), name="test_embedding")
  assignment = embedding.assign(embedding_input)
  saver = tf.train.Saver()

  sess.run(tf.global_variables_initializer())
  writer = tf.summary.FileWriter(LOGDIR + hparam)
  writer.add_graph(sess.graph)

  config = tf.contrib.tensorboard.plugins.projector.ProjectorConfig()
  embedding_config = config.embeddings.add()
  embedding_config.tensor_name = embedding.name
  embedding_config.sprite.image_path = LOGDIR + 'sprite_1024.png'
  embedding_config.metadata_path = LOGDIR + 'labels_1024.tsv'
  # Specify the width and height of a single thumbnail.
  embedding_config.sprite.single_image_dim.extend([28, 28])
  tf.contrib.tensorboard.plugins.projector.visualize_embeddings(writer, config)

  for i in range(2001):
    batch = mnist.train.next_batch(100)
    if i % 5 == 0:
      [train_accuracy, s] = sess.run([accuracy, summ], feed_dict={x: batch[0], y: batch[1]})
      writer.add_summary(s, i)
    if i % 500 == 0:
      sess.run(assignment, feed_dict={x: mnist.test.images[:1024], y: mnist.test.labels[:1024]})
      saver.save(sess, os.path.join(LOGDIR, "model.ckpt"), i)
    sess.run(train_step, feed_dict={x: batch[0], y: batch[1]})


def make_hparam_string(learning_rate, use_two_fc, use_two_conv):
  conv_param = "conv=2" if use_two_conv else "conv=1"
  fc_param = "fc=2" if use_two_fc else "fc=1"
  return "lr_%.0E,%s,%s" % (learning_rate, conv_param, fc_param)


def main():
  # You can try adding some more learning rates
  for learning_rate in [1E-4]:

    # Include "False" as a value to try different model architectures
    for use_two_fc in [True]:
      for use_two_conv in [True]:
        # Construct a hyperparameter string for each one (example: "lr_1E-3,fc=2,conv=2)
        hparam = make_hparam_string(learning_rate, use_two_fc, use_two_conv)
        print('Starting run for %s' % hparam)

        # Actually run with the new settings
        mnist_model(learning_rate, use_two_fc, use_two_conv, hparam)


if __name__ == '__main__':
  main()

總結

本文主要介紹了如下內容:

  • tensorboard 是什么及其左右
  • tensorboard 如何進行可視化
  • tensorboard 進行embedding 可視化
  • tensorboard 對graph進行可視化
  • 最后以一個完整的例子演示了上面所講的內容,這個例子是完整可以運行的。

Reference

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,505評論 6 533
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,556評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,463評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,009評論 1 312
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,778評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,218評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,281評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,436評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,969評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,795評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,993評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,537評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,229評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,659評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,917評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,687評論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,990評論 2 374

推薦閱讀更多精彩內容