对比分析BN和dropout在预测和训练时区别

更新时间：2022年05月09日 15:47:59 作者：微笑sun

这篇文章主要为大家介绍了对比分析BN和dropout在预测和训练时区别，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪

Batch Normalization

BN在训练时是在每个batch上计算均值和方差来进行归一化，每个batch的样本量都不大，所以每次计算出来的均值和方差就存在差异。预测时一般传入一个样本，所以不存在归一化，其次哪怕是预测一个batch，但batch计算出来的均值和方差是偏离总体样本的，所以通常是通过滑动平均结合训练时所有batch的均值和方差来得到一个总体均值和方差。

以tensorflow代码实现为例：

def bn_layer(self, inputs, training, name='bn', moving_decay=0.9, eps=1e-5):
        # 获取输入维度并判断是否匹配卷积层(4)或者全连接层(2)
        shape = inputs.shape
        param_shape = shape[-1]
        with tf.variable_scope(name):
            # 声明BN中唯一需要学习的两个参数，y=gamma*x+beta
            gamma = tf.get_variable('gamma', param_shape, initializer=tf.constant_initializer(1))
            beta  = tf.get_variable('beat', param_shape, initializer=tf.constant_initializer(0))
            # 计算当前整个batch的均值与方差
            axes = list(range(len(shape)-1))
            batch_mean, batch_var = tf.nn.moments(inputs , axes, name='moments')
            # 采用滑动平均更新均值与方差
            ema = tf.train.ExponentialMovingAverage(moving_decay, name="ema")
            def mean_var_with_update():
                ema_apply_op = ema.apply([batch_mean, batch_var])
                with tf.control_dependencies([ema_apply_op]):           
                    return tf.identity(batch_mean), tf.identity(batch_var)
            # 训练时，更新均值与方差，测试时使用之前最后一次保存的均值与方差
            mean, var = tf.cond(tf.equal(training,True), mean_var_with_update,
                    lambda:(ema.average(batch_mean), ema.average(batch_var)))
            # 最后执行batch normalization
            return tf.nn.batch_normalization(inputs ,mean, var, beta, gamma, eps)

training参数可以通过tf.placeholder传入，这样就可以控制训练和预测时training的值。

self.training = tf.placeholder(tf.bool, name="training")

Dropout

Dropout在训练时会随机丢弃一些神经元，这样会导致输出的结果变小。而预测时往往关闭dropout，保证预测结果的一致性（不关闭dropout可能同一个输入会得到不同的输出，不过输出会服从某一分布。另外有些情况下可以不关闭dropout，比如文本生成下，不关闭会增大输出的多样性）。

为了对齐Dropout训练和预测的结果，通常有两种做法，假设dropout rate = 0.2。一种是训练时不做处理，预测时输出乘以(1 - dropout rate)。另一种是训练时留下的神经元除以(1 - dropout rate)，预测时不做处理。以tensorflow为例。

x = tf.nn.dropout(x, self.keep_prob)

self.keep_prob = tf.placeholder(tf.float32, name="keep_prob")

tf.nn.dropout就是采用了第二种做法，训练时除以(1 - dropout rate)，源码如下：

binary_tensor = math_ops.floor(random_tensor)
 ret = math_ops.div(x, keep_prob) * binary_tensor
 if not context.executing_eagerly():
   ret.set_shape(x.get_shape())
 return ret

binary_tensor就是一个mask tensor，即里面的值由0或1组成。keep_prob = 1 - dropout rate。

以上就是对比分析BN和dropout在预测和训练时区别的详细内容，更多关于BN与dropout预测训练对比的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

python模块离线安装方式
这篇文章主要介绍了python模块离线安装方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-09-09
Python的这些库,你知道多少?
最近整理了一些好用的库但是只是初级介绍,如果大家用得到的话还请自己到官网上查一下,因为东西太多我一一介绍的话可能不太现实,需要的朋友可以参考下
2021-06-06
Python中的递归函数使用详解
这篇文章主要介绍了Python中的递归函数使用详解,递归函数是指某个函数调用自己或者调用其他函数后再次调用自己,由于不能无限嵌套调用,所以某个递归函数一定存在至少两个分支,一个是退出嵌套,不再直接或者间接调用自己；另外一个则是继续嵌套,需要的朋友可以参考下
2023-12-12
python替换文件中的某几行操作技巧
这篇文章主要介绍了python替换文件中的某几行,本文介绍使用python正则库打开文件并替换文件中某几行数据的可行方法，需要的朋友可以参考下
2023-09-09
Python中的XML库4Suite Server的介绍
这篇文章主要介绍了Python中的XML库4Suite Server,来自于IBM官方网站,需要的朋友可以参考下
2015-04-04
简单实现Python爬取网络图片
这篇文章主要教大家如何简单实现Python爬取网络图片，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-04-04
WxPython开发之列表数据的自定义打印处理
这篇文章主要为大家详细介绍了如何利用WxPython内置的打印数据组件实现列表数据的自定义打印处理,以及对记录进行分页等常规操作,需要的可以参考下
2025-03-03
python中的列表推导浅析
这篇文章主要介绍了python中的列表推导,需要的朋友可以参考下
2014-04-04
浅谈Django QuerySet对象(模型.objects)的常用方法
这篇文章主要介绍了浅谈Django QuerySet对象(模型.objects)的常用方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-03-03
Python学习笔记之字典,元组,布尔类型和读写文件
这篇文章主要为大家详细介绍了Python的字典,元组,布尔类型和读写文件，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助
2022-02-02

对比分析BN和dropout在预测和训练时区别

目录

Batch Normalization

Dropout

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具