pytorch中nn.RNN()汇总

 更新时间:2022年12月02日 15:05:19   作者:orangerfun  
这篇文章主要介绍了pytorch中nn.RNN()知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

nn.RNN(input_size, hidden_size, num_layers=1, nonlinearity=tanh, bias=True, batch_first=False, dropout=0, bidirectional=False)

参数说明

  • input_size输入特征的维度, 一般rnn中输入的是词向量,那么 input_size 就等于一个词向量的维度
  • hidden_size隐藏层神经元个数,或者也叫输出的维度(因为rnn输出为各个时间步上的隐藏状态)
  • num_layers网络的层数
  • nonlinearity激活函数
  • bias是否使用偏置
  • batch_first输入数据的形式,默认是 False,就是这样形式,(seq(num_step), batch, input_dim),也就是将序列长度放在第一位,batch 放在第二位
  • dropout是否应用dropout, 默认不使用,如若使用将其设置成一个0-1的数字即可
  • birdirectional是否使用双向的 rnn,默认是 False
  • 注意某些参数的默认值在标题中已注明

输入输出shape

  • input_shape = [时间步数, 批量大小, 特征维度] = [num_steps(seq_length), batch_size, input_dim]
  • 在前向计算后会分别返回输出和隐藏状态h,其中输出指的是隐藏层在各个时间步上计算并输出的隐藏状态,它们通常作为后续输出层的输⼊。需要强调的是,该“输出”本身并不涉及输出层计算,形状为(时间步数, 批量大小, 隐藏单元个数);隐藏状态指的是隐藏层在最后时间步的隐藏状态:当隐藏层有多层时,每⼀层的隐藏状态都会记录在该变量中;对于像⻓短期记忆(LSTM),隐藏状态是⼀个元组(h, c),即hidden state和cell state(此处普通rnn只有一个值)隐藏状态h的形状为(层数, 批量大小,隐藏单元个数)

代码

rnn_layer = nn.RNN(input_size=vocab_size, hidden_size=num_hiddens, )
# 定义模型, 其中vocab_size = 1027, hidden_size = 256
num_steps = 35
batch_size = 2
state = None    # 初始隐藏层状态可以不定义
X = torch.rand(num_steps, batch_size, vocab_size)
Y, state_new = rnn_layer(X, state)
print(Y.shape, len(state_new), state_new.shape)

输出

torch.Size([35, 2, 256])     1       torch.Size([1, 2, 256])

具体计算过程
H t = i n p u t ∗ W x h + H t − 1 ∗ W h h + b i a s H_t = input * W_{xh} + H_{t-1} * W_{hh} + bias Ht​=input∗Wxh​+Ht−1​∗Whh​+bias
[batch_size, input_dim] * [input_dim, num_hiddens] + [batch_size, num_hiddens] *[num_hiddens, num_hiddens] +bias
可以发现每个隐藏状态形状都是[batch_size, num_hiddens], 起始输出也是一样的
注意:上面为了方便假设num_step=1

GRU/LSTM等参数同上面RNN

到此这篇关于pytorch中nn.RNN()总结的文章就介绍到这了,更多相关pytorch nn.RNN()内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python多行字符串拼接使用小括号的方法

    python多行字符串拼接使用小括号的方法

    今天小编就为大家分享一篇python多行字符串拼接使用小括号的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • Python运算符重载用法实例分析

    Python运算符重载用法实例分析

    这篇文章主要介绍了Python运算符重载用法,实例分析了几种常见的Python运算符重载的使用技巧,需要的朋友可以参考下
    2015-06-06
  • 理解Python垃圾回收机制

    理解Python垃圾回收机制

    这篇文章主要为大家详细介绍了Python垃圾回收机制,Python中的垃圾回收以引用计数为主,分代收集为辅,想要深入理解Python垃圾回收机制,请阅读下文
    2016-02-02
  • Python中跳出循环的两种方法

    Python中跳出循环的两种方法

    在 Python 中,跳出循环通常指的是使用 break 语句来结束一个循环结构,比如 for 循环或 while 循环,当程序执行到 break 语句时,循环会立即终止,程序会继续执行循环后面的代码,本文给大家介绍了Python中跳出循环的两种方法,需要的朋友可以参考下
    2024-09-09
  • Python md5与sha1加密算法用法分析

    Python md5与sha1加密算法用法分析

    这篇文章主要介绍了Python md5与sha1加密算法,简单介绍了md5级sha1加密算法的概念、原理,并结合实例形式分析了Python使用hashlib模块实现加密功能的具体操作技巧,需要的朋友可以参考下
    2017-07-07
  • 详解Python中for循环的定义迭代方法

    详解Python中for循环的定义迭代方法

    for循环用于迭代序列(即列表、元组、字典、集合或字符串)。for 语句的写法如从对象开始按顺序给变量赋值,元素个数重复这个过程。对象可以是列表(数组)、元组、字符串等。本文将详细讲解Python中for定义迭代方法详解,需要的可以了解一下
    2022-04-04
  • Python+imbox库实现邮件读取与删除和附件下载

    Python+imbox库实现邮件读取与删除和附件下载

    这篇文章主要为大家详细介绍了Python如何使用imbox库实现邮件读取与删除以及附件下载,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2025-02-02
  • Python openpyxl库处理Excel文件高级应用技巧实例

    Python openpyxl库处理Excel文件高级应用技巧实例

    openpyxl是一个用于处理Excel文件的Python库,它提供了丰富的功能,使得用户能够轻松地读取、写入和操作Excel文件,而不需要依赖于Microsoft Excel软件,作为一个开源项目,openpyxl在Python生态系统中得到了广泛的应用,成为处理Excel数据的首选工具之一
    2024-01-01
  • Python利用Bokeh进行数据可视化的教程分享

    Python利用Bokeh进行数据可视化的教程分享

    Bokeh是Python中的数据可视化库,提供高性能的交互式图表和绘图。本文将利用Bokeh绘制一些可视化图表,文中的示例代码讲解详细,感兴趣的可以了解一下
    2022-08-08
  • Python如何绘制日历图和热力图

    Python如何绘制日历图和热力图

    这篇文章主要介绍了Python如何绘制日历图和热力图,帮助大家更好的理解和学习Python,感兴趣的朋友可以了解下
    2020-08-08

最新评论