pytorch机器学习softmax回归的简洁实现
通过深度学习框架的高级API也能更方便地实现分类模型。让我们继续使用Fashion-MNIST数据集,并保持批量大小为256。
import torch from torch import nn from d2l import torch as d2l
batch_size = 256 train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
初始化模型参数
由于sofrmax回归的输出层是一个全连接层,因此,为了实现我们的模型,我们只需在Sequential中添加一个带有10个输出的全连接层。同样,在这里,Sequential并不是必要的,但我们可能会形成这种习惯。因为在实现深度模型时,Sequential将无处不在。我们仍然以均值0和标准差0.01随机初始化权重。
# PyTorch不会隐式地调整输入的形状。因此,我们在线性层前定义了展平层(flatten),来调整网络输入的形状 net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10)) def init_weights(m): if type(m) == nn.Linear: nn.init.normal_(m.weight, std=0.01) net.apply(init_weights)
重新审视softmax的实现
在前面的例子中,我们计算了模型的输出,然后将此输出送入交叉熵损失。从数学上讲,这是一件完全合理的事情。然而,从计算角度来看,指数可能会造成数值稳定性的问题,包括上溢和下溢。
我们也希望保留传统的softmax函数,以备我们需要评估通过模型输出的概率。但是,我们没有将softmax概率传递到损失函数中,而是在交叉熵损失函数中传递未归一化的预测,并同时计算softmax及其对数。
loss = nn.CrossEntropyLoss()
优化算法
在这里,我们使用学习率为0.1的小批量随机梯度下降作为优化算法。这与我们在线性回归例子中的相同,这说明了优化器的普适性。
trainer = torch.optim.SGD(net.parameters(), lr=0.1)

以上就是pytorch机器学习softmax回归的简洁实现的详细内容,更多关于pytorch机器学习softmax回归的资料请关注脚本之家其它相关文章!
相关文章
Python实现提取JSON文件中指定数据并保存至CSV或Excel内
这篇文章主要介绍了如何基于Python语言实现读取JSON格式的数据,并将提取到的数据保存到.csv格式或.xlsx格式的表格文件中,感兴趣的小伙伴可以了解下2023-08-08
Python使用matplotlib.pyplot画热图和损失图的代码详解
众所周知,在完成论文相关工作时画图必不可少,如损失函数图、热力图等是非常常见的图,在本文中,总结了这两个图的画法,下面给出了完整的代码,开箱即用,感兴趣的同学可以自己动手尝试一下2023-09-09
linux平台使用Python制作BT种子并获取BT种子信息的方法
这篇文章主要介绍了linux平台使用Python制作BT种子并获取BT种子信息的方法,结合实例形式详细分析了Python BT模块的安装及针对BT种子文件的相关操作技巧,需要的朋友可以参考下2017-01-01
使用 Django Highcharts 实现数据可视化过程解析
这篇文章主要介绍了使用 Django Highcharts 实现数据可视化过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下2019-07-07


最新评论