Pytorch模型参数的保存和加载

 更新时间:2023年03月11日 15:52:26   作者:云隐雾匿  
pytorch中state_dict()和load_state_dict()函数配合使用可以实现状态的获取与重载,load()和save()函数配合使用可以实现参数的存储与读取,这篇文章主要介绍了Pytorch模型参数的保存和加载,需要的朋友可以参考下

一、前言

在模型训练完成后,我们需要保存模型参数值用于后续的测试过程。由于保存整个模型将耗费大量的存储,故推荐的做法是只保存参数,使用时只需在建好模型的基础上加载。

通常来说,保存的对象包括网络参数值、优化器参数值、epoch值等。本文将简单介绍保存和加载模型参数的方法,同时也给出保存整个模型的方法供大家参考。

二、参数保存

在这里我们使用 torch.save() 函数保存模型参数:

import torch
path = './model.pth'
torch.save(model.state_dict(), path)

model——指定义的模型实例变量,如model=net( )

state_dict()——state_dict( )是一个可以轻松地保存、更新、修改和恢复的python字典对象, 对于model来说,表示模型的每一层的权重及偏置等参数信息;对于 optimizer 来说,其包含了优化器的状态以及被使用的超参数(如lr, momentum,weight_decay等)

path——path是保存参数的路径,一般设置为 path='./model.pth' , path='./model.pkl'等形式。

此外,如果想保存某一次训练采用的optimizer、epochs等信息,可将这些信息组合起来构成一个字典保存起来:

import torch
path = './model.pth'
state = {'model': model.state_dict(), 'optimizer': optimizer.state_dict(), 'epoch': epoch}
torch.save(state, path)

三、参数的加载

使用 load_state_dict()函数加载参数到模型中, 当仅保存了模型参数,而没有optimizer、epochs等信息时:

model.load_state_dict(torch.load(path))

model——事先定义好的跟原模型一致的模型

path——之前保存的模型参数文件

如若保存了optimizer、epochs等信息,我们这样载入信息:

# 使用torch.load()函数将文件中字典信息载入 state_dict 变量中
state_dict = torch.load(path)
# 分布加载参数到模型和优化器
model.load_state_dict(state_dict['model'])
optimizer.load_state_dict(state_dict['optimizer'])
epoch = state_dict(['epoch'])

我们还可以在每n个epoch后保存一次参数,以观察不同迭代次数模型的表现此时我们可设置不同的path,如 path='./model' + str(epoch) +'.pth',这样,不同epoch的参数就能保存在不同的文件中。

四、保存和加载整个模型

使用上文提到的方法即可:

torch.save(model, path)
model = torch.load(path)

五、总结

pytorch中state_dict()和load_state_dict()函数配合使用可以实现状态的获取与重载,load()和save()函数配合使用可以实现参数的存储与读取。掌握对应的函数使用方法就可以游刃有余地进行运用。

到此这篇关于Pytorch模型参数的保存和加载的文章就介绍到这了,更多相关Pytorch模型参数保存内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python实现的远程文件自动打包并下载功能示例

    Python实现的远程文件自动打包并下载功能示例

    这篇文章主要介绍了Python实现的远程文件自动打包并下载功能,结合实例形式分析了Python使用spawn()方法执行ssh、scp 命令实现远程文件的相关操作技巧,需要的朋友可以参考下
    2019-07-07
  • Python+Pygame实战之吃豆豆游戏的实现

    Python+Pygame实战之吃豆豆游戏的实现

    这篇文章主要为大家介绍了如何利用Python中的Pygame模块实现仿吃豆豆游戏,文中的示例代码讲解详细,对我们学习Python游戏开发有一定帮助,需要的可以参考一下
    2022-06-06
  • 用python给csv里的数据排序的具体代码

    用python给csv里的数据排序的具体代码

    在本文里小编给大家分享的是关于用python给csv里的数据排序的具体代码内容,需要的朋友们可以学习下。
    2020-07-07
  • python神经网络Keras构建CNN网络训练

    python神经网络Keras构建CNN网络训练

    这篇文章主要为大家介绍了python神经网络学习使用Keras构建CNN网络训练,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • python 留一交叉验证的实例

    python 留一交叉验证的实例

    这篇文章主要介绍了python 留一交叉验证的实例代码,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • 让你一文弄懂Pandas文本数据处理

    让你一文弄懂Pandas文本数据处理

    文本数据具有数据维度高、数据量大且语义复杂等特点,是一种较为复杂的数据类型,下面这篇文章主要给大家介绍了关于Pandas文本数据处理的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2021-08-08
  • Python 数据库操作 SQLAlchemy的示例代码

    Python 数据库操作 SQLAlchemy的示例代码

    这篇文章主要介绍了Python 数据库操作 SQLAlchemy的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-02-02
  • Python采用socket模拟TCP通讯的实现方法

    Python采用socket模拟TCP通讯的实现方法

    这篇文章主要介绍了Python采用socket模拟TCP通讯的实现方法,程序分为TCP的server端与client端两部分,分别对这两部分进行了较为深入的分析,需要的朋友可以参考下
    2014-11-11
  • 七牛云的python sdk 批量删除资源的操作方法

    七牛云的python sdk 批量删除资源的操作方法

    今天做项目的时候用到七牛云,关于对资源的操作是在后端做的,用的SDK,这篇文章主要介绍了七牛云的python sdk 是如何 批量删除资源的,需要的朋友可以参考下
    2021-10-10
  • Flask框架URL管理操作示例【基于@app.route】

    Flask框架URL管理操作示例【基于@app.route】

    这篇文章主要介绍了Flask框架URL管理操作,结合实例形式分析了@app.route进行URL控制的相关操作技巧,需要的朋友可以参考下
    2018-07-07

最新评论