PyTorch深度学习模型的保存和加载流程详解

更新时间：2021年10月21日 09:32:00 作者：软耳朵DONG

PyTorch是一个开源的Python机器学习库，基于Torch，用于自然语言处理等应用程序。2017年1月，由Facebook人工智能研究院（FAIR）基于Torch推出了PyTorch，这篇文章主要介绍了PyTorch模型的保存和加载流程

一、模型参数的保存和加载

torch.save(module.state_dict(), path)：使用module.state_dict()函数获取各层已经训练好的参数和缓冲区，然后将参数和缓冲区保存到path所指定的文件存放路径（常用文件格式为.pt、.pth或.pkl）。
torch.nn.Module.load_state_dict(state_dict)：从state_dict中加载参数和缓冲区到Module及其子类中。
torch.nn.Module.state_dict()函数返回python中的一个OrderedDict类型字典对象，该对象将每一层与它的对应参数和缓冲区建立映射关系，字典的键值是参数或缓冲区的名称。只有那些参数可以训练的层才会被保存到OrderedDict中，例如：卷积层、线性层等。
Python中的字典类以“键:值”方式存取数据，OrderedDict是它的一个子类，实现了对字典对象中元素的排序（OrderedDict根据放入元素的先后顺序进行排序）。由于进行了排序，所以顺序不同的两个OrderedDict字典对象会被当做是两个不同的对象。
示例：

import torch
import torch.nn as nn

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 2, 3)
        self.pool1 = nn.MaxPool2d(2, 2)

    def forward(self, x):
        x = self.conv1(x)
        x = self.pool1(x)
        return x

# 初始化网络
net = Net()
net.conv1.weight[0].detach().fill_(1)
net.conv1.weight[1].detach().fill_(2)
net.conv1.bias.data.detach().zero_()
# 获取state_dict
state_dict = net.state_dict()
# 字典的遍历默认是遍历key，所以param_tensor实际上是键值
for param_tensor in state_dict: 
    print(param_tensor,'：\n',state_dict[param_tensor])
# 保存模型参数
torch.save(state_dict,"net_params.pth")
# 通过加载state_dict获取模型参数
net.load_state_dict(state_dict)

输出：

在这里插入图片描述

二、完整模型的保存和加载

torch.save(module, path)：将训练完的整个网络模型module保存到path所指定的文件存放路径（常用文件格式为.pt或.pth）。
torch.load(path)：加载保存到path中的整个神经网络模型。
示例：

import torch
import torch.nn as nn

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 2, 3)
        self.pool1 = nn.MaxPool2d(2, 2)

    def forward(self, x):
        x = self.conv1(x)
        x = self.pool1(x)
        return x

# 初始化网络
net = Net()
net.conv1.weight[0].detach().fill_(1)
net.conv1.weight[1].detach().fill_(2)
net.conv1.bias.data.detach().zero_()
# 保存整个网络
torch.save(net,"net.pth")
# 加载网络
net = torch.load("net.pth")

到此这篇关于PyTorch深度学习模型的保存和加载流程详解的文章就介绍到这了,更多相关PyTorch 模型的保存内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

基于Python实现音乐播放器的实现示例代码
这篇文章主要介绍了如何利用Python编写简易的音乐播放器，文中的示例代码讲解详细，具有一的参考价值，需要的小伙伴可以参考一下
2022-04-04
python实现批量获取指定文件夹下的所有文件的厂商信息
这篇文章主要介绍了python实现批量获取指定文件夹下的所有文件的厂商信息的方法,是非常实用的技巧,涉及到文件的读写与字典的操作等技巧,需要的朋友可以参考下
2014-09-09
一文带你学会Python Flask框架设置响应头
本篇博客我们将带大家全面了解Python中Flask框架关于请求的相关设置的相关知识，文中的示例代码讲解详细，对我们学习Python有一定帮助，需要的可以参考一下
2023-01-01
Python爬虫获取基金基本信息
这篇文章主要介绍了Python爬虫获取基金基本信息，文章基于上一篇文章内容基于python的相关资料展开主题，需要的小伙伴可以参考一下
2022-05-05
Python3.5内置模块之time与datetime模块用法实例分析
这篇文章主要介绍了Python3.5内置模块之time与datetime模块用法,结合实例形式分析了Python3.5 time与datetime模块日期时间相关操作技巧,需要的朋友可以参考下
2019-04-04
基于Python实现最新房价信息的获取
这篇文章主要为大家介绍了如何利用Python获取房价信息（以北京为例），整个数据获取的信息是通过房源平台获取的，通过下载网页元素并进行数据提取分析完成整个过程，需要的可以参考一下
2022-04-04
Python中猜拳游戏与猜筛子游戏的实现方法
这篇文章主要给大家介绍了关于Python中猜拳游戏与猜筛子游戏的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-09-09
Python简单实现子网掩码转换的方法
这篇文章主要介绍了Python简单实现子网掩码转换的方法,涉及Python字符串相关操作技巧,需要的朋友可以参考下
2016-04-04
Python中的图像处理之Python图像平滑操作
本文主要介绍在Python中调用OpenCV库对图像进行图像平滑滤波处理与图像加噪处理，如双边滤波，高斯双边滤波，图像加随机噪声等操作，对Python图像平滑操作感兴趣的朋友一起看看吧
2022-06-06
Python入门教程(二十九)Python的RegEx正则表达式
这篇文章主要介绍了Python入门教程(二十九)Python的RegEx,RegEx 或正则表达式是形成搜索模式的字符序列。RegEx 可用于检查字符串是否包含指定的搜索模式,需要的朋友可以参考下
2023-04-04

PyTorch深度学习模型的保存和加载流程详解

一、模型参数的保存和加载

输出：

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具