您的位置:

如何使用tf.summary.histogram记录数据分布

一、什么是tf.summary.histogram

在TensorFlow中,tf.summary.histogram是一种用于跟踪变量和张量分布的TensorBoard摘要类型。这个方法可以在TensorBoard中显示任何给定张量的分布,因此我们可以很好地了解模型中每个变量的状态。

histogram用于显示某个变量的取值分布情况,通过它可以更好的观察变量取值的跨度、分布和偏离情况,方便调优和发现异常情况。

二、如何使用tf.summary.histogram

使用tf.summary.histogram记录变量在TensorBoard中的分布只需要将summar_writer和tf.summary.histogram用于变量的更新,当然可能为了获得更好的观察效果你可以根据需要设置其他参数。


# 其中scalar, image, text 和 audio 四种不同的 summary 类型不再赘述。
with tf.name_scope('summaries'):
    tf.summary.histogram('MSE_per_batch', mse_batch)
    tf.summary.scalar('loss', loss)
    tf.summary.histogram('weights1', weights1)
    tf.summary.histogram('weights2', weights2)
    tf.summary.histogram('grads', grads)
    tf.summary.histogram('grad_hist', grad_hist)
    tf.summary.histogram('activation', y)
    tf.summary.scalar('ave_activations', tf.reduce_mean(y))
    tf.summary.scalar('max_activations', tf.reduce_max(y))
    tf.summary.scalar('min_activations', tf.reduce_min(y))
    tf.summary.scalar('sparsity', tf.nn.zero_fraction(layer1))
    merged = tf.summary.merge_all()

三、tf.summary.histogram参数详解

在使用tf.summary.histogram的时候,我们一般需要了解其主要参数,以便更好的记录变量分布,下面我们来详细介绍一下:

1. 名称(name)

可选项。摘要的名称,这个名称将会在TensorBoard中展示,以便你能够更好地识别你所记录的是什么数据。需要注意的是,相同名称的摘要将会被合并展示在一起。

2. 容器(family)

可选项。为了更好的管理你的摘要信息,你可以将他们存放在同一个容器中。通过使用family参数,你可以将摘要分组在一起。

3. 值(values)

必选项,这是需要记录的数据,tensorflow输入的是张量类型的值。这个张量代表了需要记录的变量。通常情况下,如果你需要记录的是一个权重张量的话,那么使用tf.summary.histogram和这个张量的名字就可以工作了。如果你想要查看多个变量,可以分别使用多个tf.summary.histogram().

4. 子图(collections)

可选项。有时候,你希望在不同的子图(如train/train_or_test)中记录摘要的值。你可以使用collections参数实现这个功能。

5. 优先级(priority)

可选项。默认情况下,摘要的优先级为0。如果你有多个摘要要记录,那么按照你输入的顺序每个摘要的优先级+1。

四、总结

在本文中,我们学习了如何使用tf.summary.histogram记录TensorFlow变量的分布,同时也了解了tf.summary.histogram的主要参数。