聊聊pytorch测试的时候为何要加上model.eval()

 更新时间:2021年05月22日 15:07:49   作者:qq_23304241  
这篇文章主要介绍了聊聊pytorch测试的时候为何要加上model.eval()的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

Do need to use model.eval() when I test?

Sure, Dropout works as a regularization for preventing overfitting during training.

It randomly zeros the elements of inputs in Dropout layer on forward call.

It should be disabled during testing since you may want to use full model (no element is masked)

使用PyTorch进行训练和测试时一定注意要把实例化的model指定train/eval,eval()时,框架会自动把BN和DropOut固定住,不会取平均,而是用训练好的值,不然的话,一旦test的batch_size过小,很容易就会被BN层导致生成图片颜色失真极大!!!!!!

补充:pytorch中model eval和torch no grad()的区别

model.eval()和with torch.no_grad()的区别

在PyTorch中进行validation时,会使用model.eval()切换到测试模式,在该模式下,

主要用于通知dropout层和batchnorm层在train和val模式间切换

在train模式下,dropout网络层会按照设定的参数p设置保留激活单元的概率(保留概率=p); batchnorm层会继续计算数据的mean和var等参数并更新。

在val模式下,dropout层会让所有的激活单元都通过,而batchnorm层会停止计算和更新mean和var,直接使用在训练阶段已经学出的mean和var值。

该模式不会影响各层的gradient计算行为,即gradient计算和存储与training模式一样,只是不进行反传(backprobagation)

而with torch.no_grad()则主要是用于停止autograd模块的工作,以起到加速和节省显存的作用,具体行为就是停止gradient计算,从而节省了GPU算力和显存,但是并不会影响dropout和batchnorm层的行为。

使用场景

如果不在意显存大小和计算时间的话,仅仅使用model.eval()已足够得到正确的validation的结果;而with torch.zero_grad()则是更进一步加速和节省gpu空间(因为不用计算和存储gradient),从而可以更快计算,也可以跑更大的batch来测试。

补充:Pytorch的modle.train,model.eval,with torch.no_grad的个人理解

1. 最近在学习pytorch过程中遇到了几个问题

不理解为什么在训练和测试函数中model.eval(),和model.train()的区别,经查阅后做如下整理

一般情况下,我们训练过程如下:

1、拿到数据后进行训练,在训练过程中,使用

model.train():告诉我们的网络,这个阶段是用来训练的,可以更新参数。

2、训练完成后进行预测,在预测过程中,使用

model.eval() : 告诉我们的网络,这个阶段是用来测试的,于是模型的参数在该阶段不进行更新。

2. 但是为什么在eval()阶段会使用with torch.no_grad()?

查阅相关资料:传送门

with torch.no_grad - disables tracking of gradients in autograd.

model.eval() changes the forward() behaviour of the module it is called upon

eg, it disables dropout and has batch norm use the entire population statistics

总结一下就是说,在eval阶段了,即使不更新,但是在模型中所使用的dropout或者batch norm也就失效了,直接都会进行预测,而使用no_grad则设置让梯度Autograd设置为False(因为在训练中我们默认是True),这样保证了反向过程为纯粹的测试,而不变参数。

另外,参考文档说这样避免每一个参数都要设置,解放了GPU底层的时间开销,在测试阶段统一梯度设置为False

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python数据结构集合的相关详解

    Python数据结构集合的相关详解

    集合是Python中一种无序且元素唯一的数据结构,主要用于存储不重复的元素,Python提供set类型表示集合,可通过{}或set()创建,集合元素不可重复且无序,不支持索引访问,但可迭代,集合可变,支持添加、删除元素,集合操作包括并集、交集、差集等,可通过运算符或方法执行
    2024-09-09
  • python等间距取值方式

    python等间距取值方式

    这篇文章主要介绍了python等间距取值方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • python中的多线程实例教程

    python中的多线程实例教程

    这篇文章主要介绍了python中的多线程用法,包括线程的创建、同步等核心问题,具有很好的参考借鉴价值,需要的朋友可以参考下
    2014-08-08
  • python跳出双层循环的方法

    python跳出双层循环的方法

    本文主要介绍了python跳出双层循环的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-01-01
  • python字典一键多值实例代码分享

    python字典一键多值实例代码分享

    在本篇文章里小编给大家整理了关于python字典一键多值实例代码以及相关知识点,需要的朋友们参考下。
    2019-06-06
  • 基于python实现一个简单的浏览器引擎

    基于python实现一个简单的浏览器引擎

    浏览器引擎是用来处理、渲染和显示网页内容的核心组件,其主要任务是将用户输入的URL所代表的网页资源加载并呈现出来,通常包括HTML、CSS、JavaScript以及各种多媒体内容,本文给大家介绍了如何基于python实现一个简单的浏览器引擎,需要的朋友可以参考下
    2024-10-10
  • Python3基础之基本数据类型概述

    Python3基础之基本数据类型概述

    这篇文章主要介绍了Python3的基本数据类型,需要的朋友可以参考下
    2014-08-08
  • 使用Python删除文本文件中特定行的操作方法

    使用Python删除文本文件中特定行的操作方法

    文件操作是编程中的重要方面,Python作为强大的编程语言,提供了处理文件的能力,删除特定行是文件处理中常见的需求,本文给大家介绍了Python快速删除文本文件中指定行的方法,文中有详细的代码示例供大家参考,需要的朋友可以参考下
    2023-12-12
  • 详解如何使用pandas进行时间序列数据的周期转换

    详解如何使用pandas进行时间序列数据的周期转换

    时间序列数据是数据分析中经常遇到的类型,为了更多的挖掘出数据内部的信息,我们常常依据原始数据中的时间周期,将其转换成不同跨度的周期,下面以模拟的K线数据为例,演示如何使用pandas来进行周期转换,感兴趣的朋友可以参考下
    2024-05-05
  • Python全面解析xml文件

    Python全面解析xml文件

    这篇文章主要介绍了Python全面解析xml文件方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02

最新评论