Pytorch模型参数的保存和加载

 更新时间:2023年03月11日 15:52:26   作者:云隐雾匿  
pytorch中state_dict()和load_state_dict()函数配合使用可以实现状态的获取与重载,load()和save()函数配合使用可以实现参数的存储与读取,这篇文章主要介绍了Pytorch模型参数的保存和加载,需要的朋友可以参考下

一、前言

在模型训练完成后,我们需要保存模型参数值用于后续的测试过程。由于保存整个模型将耗费大量的存储,故推荐的做法是只保存参数,使用时只需在建好模型的基础上加载。

通常来说,保存的对象包括网络参数值、优化器参数值、epoch值等。本文将简单介绍保存和加载模型参数的方法,同时也给出保存整个模型的方法供大家参考。

二、参数保存

在这里我们使用 torch.save() 函数保存模型参数:

import torch
path = './model.pth'
torch.save(model.state_dict(), path)

model——指定义的模型实例变量,如model=net( )

state_dict()——state_dict( )是一个可以轻松地保存、更新、修改和恢复的python字典对象, 对于model来说,表示模型的每一层的权重及偏置等参数信息;对于 optimizer 来说,其包含了优化器的状态以及被使用的超参数(如lr, momentum,weight_decay等)

path——path是保存参数的路径,一般设置为 path='./model.pth' , path='./model.pkl'等形式。

此外,如果想保存某一次训练采用的optimizer、epochs等信息,可将这些信息组合起来构成一个字典保存起来:

import torch
path = './model.pth'
state = {'model': model.state_dict(), 'optimizer': optimizer.state_dict(), 'epoch': epoch}
torch.save(state, path)

三、参数的加载

使用 load_state_dict()函数加载参数到模型中, 当仅保存了模型参数,而没有optimizer、epochs等信息时:

model.load_state_dict(torch.load(path))

model——事先定义好的跟原模型一致的模型

path——之前保存的模型参数文件

如若保存了optimizer、epochs等信息,我们这样载入信息:

# 使用torch.load()函数将文件中字典信息载入 state_dict 变量中
state_dict = torch.load(path)
# 分布加载参数到模型和优化器
model.load_state_dict(state_dict['model'])
optimizer.load_state_dict(state_dict['optimizer'])
epoch = state_dict(['epoch'])

我们还可以在每n个epoch后保存一次参数,以观察不同迭代次数模型的表现此时我们可设置不同的path,如 path='./model' + str(epoch) +'.pth',这样,不同epoch的参数就能保存在不同的文件中。

四、保存和加载整个模型

使用上文提到的方法即可:

torch.save(model, path)
model = torch.load(path)

五、总结

pytorch中state_dict()和load_state_dict()函数配合使用可以实现状态的获取与重载,load()和save()函数配合使用可以实现参数的存储与读取。掌握对应的函数使用方法就可以游刃有余地进行运用。

到此这篇关于Pytorch模型参数的保存和加载的文章就介绍到这了,更多相关Pytorch模型参数保存内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python中三元表达式的几种写法介绍

    Python中三元表达式的几种写法介绍

    今天小编就为大家分享一篇关于Python中三元表达式的几种写法介绍,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • Python访问MySQL封装的常用类实例

    Python访问MySQL封装的常用类实例

    这篇文章主要介绍了Python访问MySQL封装的常用类,实例详述了针对MySQL使用query执行select及使用update进行insert、delete等操作的方法,需要的朋友可以参考下
    2014-11-11
  • python每次处理固定个数的字符的方法总结

    python每次处理固定个数的字符的方法总结

    使用python每次处理固定个数的字符,很多情况下都会遇到。本文对可能的方法做下总结,供各位朋友学习参考
    2013-01-01
  • 基于Python实现微信自动回复功能

    基于Python实现微信自动回复功能

    这篇文章主要为大家详细介绍了Python如何通过WechatPCAPI来实现微信自动回复的功能,文中的示例代码讲解详细,快跟随小编一起动手尝试一下
    2022-06-06
  • Pandas数据分析之groupby函数用法实例详解

    Pandas数据分析之groupby函数用法实例详解

    这篇文章主要为大家介绍了Pandas数据分析之groupby函数用法实例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-10-10
  • python数据结构链表之单向链表(实例讲解)

    python数据结构链表之单向链表(实例讲解)

    下面小编就为大家带来一篇python数据结构链表之单向链表(实例讲解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-07-07
  • python如何寻找主串中所有指定子串下标

    python如何寻找主串中所有指定子串下标

    这篇文章主要介绍了python如何寻找主串中所有指定子串下标,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-01-01
  • 教你使用一行Python代码玩遍童年的小游戏

    教你使用一行Python代码玩遍童年的小游戏

    这篇文章主要介绍了一行Python代码玩遍童年的小游戏,帮助大家重回童年快乐时光,代码简单易懂,感兴趣的朋友一起学习下吧
    2021-08-08
  • Python pandas入门系列之众数和分位数

    Python pandas入门系列之众数和分位数

    分位数(Quantile),也称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,分析其数据变量的趋势,而众数(Mode)是代表数据的一般水平,这篇文章主要给大家介绍了Python pandas系列之众数和分位数的相关资料,需要的朋友可以参考下
    2021-08-08
  • 如何向scrapy中的spider传递参数的几种方法

    如何向scrapy中的spider传递参数的几种方法

    这篇文章主要介绍了如何向scrapy中的spider传递参数的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11

最新评论