python深度学习人工智能BackPropagation链式法则

 更新时间:2021年11月12日 09:39:43   作者:Swayzzu  
这篇文章主要为大家介绍了python深度学习人工智能BackPropagation链式法则的示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助

1.链式法则

根据以前的知识,如果我们需要寻找到目标参数的值的话,我们需要先给定一个初值,然后通过梯度下降,不断对其更新,直到最终的损失值最小即可。而其中最关键的一环,就是梯度下降的时候,需要的梯度,也就是需要求最终的损失函数对参数的导数。

如下图,假设有一个神经元,是输入层,有2个数据,参数分别是w1和w2,偏置项为b,那么我们需要把这些参数组合成一个函数z,然后将其输入到sigmoid函数中,便可得到该神经元的输出结果。过程中,z对w求导十分好算,就是x1和x2。根据链式法则,如下图左下角所示,我们整体的计算过程就是,通过前向传播求出z对w的偏导,再通过反向传播找到损失函数C对z的偏导。

2.前向传播

计算z对w的偏导:前向传播相当简单,对参数的偏导结果就是参数对应的输入数据,如下图所示。输入数据对于输入层来说就是原始数据1和-1,对于其他层,输入数据就是通过sigmoid转换后的输出结果。

3.后向传播

计算C对z的偏导:

设每一个神经元中,sigmoid函数最终的输出为a,则C对z的偏导,根据链式法则,就可以写作a对z的偏导,乘上C对a的偏导。

a对z的偏导,只是一个sigmoid函数,该函数偏导可以计算。

C对a的偏导,由于a输入进了下一层的多个神经元,假设有2个,因此,C对a的偏导,等于分别对这两个神经元求偏导并求和。比如第一个神经元z' = 输入a*权重w3+...,那么C对这个神经元求偏导,就是C对z'求偏导,乘上z'对a求偏导,后一项十分简单,就是w3;对于z''来说,对a求偏导就是w4

那么问题又变成了,C对z', z''求偏导的结果是什么?

假!如! 损失函数C对z'和z''的偏导已知了:

以上C对z求偏导的计算过程,可以写作以下的式子,括号外就是a对z求偏导,括号内就是C对a求偏导:

这个式子可以看做一个反向传播的神经元,如下图所示:

这个神经元中,损失函数C对sigmoid转化前的z' 和z''求导的结果,就是输入,权重w3,w4是输入对应的权重,将这两个输入乘上参数后相加,再和sigmoid函数对z的导数相乘,最终得到C对z的偏导。而sigmoid对z的导数,这个是常数,并且已经是确定了的,因为我们通过前向传播计算,就已经能够将其确定。

有了第一个反向传播的输出结果,那么就可以有隐藏层的其他神经元所需要的结果,以此类推,对于所有神经元,我们均可算出损失函数对其z的偏导。有了这个,那么我们结合z对w的偏导,就可以计算出每一个参数w的梯度。从而进行梯度下降。

4.计算方式整理

假设我们计算的是输出层,那么我们通过前向传播后,已经得到了一个输出了,于是就已经有损失函数C了,同时前向传播也让我们得到了z'和z'',那么所有需要的数据已就绪,可以直接计算出来C对z'和z''的偏导。

假如我们计算的是中间层,在计算C对z'的偏导的时候,还需要下一层通过反向传播给到的C对两个其他z的结果,那么我们就继续往下计算,继续寻找下一层计算的时候,需要的下下一层的信息,一直到输出层后,我们得到一个,再往回推,以此递归计算前面待定的所有项。

5.总结

既然我们需要输出层的内容作为反向传播的输入,我们在进行完前向传播之后,就别考虑前面需要什么求导了,干脆直接从结尾开始算起,得到每一层的损失函数C对每一个z的偏导即可。

至此,我们得到了每一个神经元前向传播的z对w的偏导(其实就是sigmoid转化后的输出a),以及每一个神经元反向传播后的C对z的偏导,二者相乘,就得到了我们需要的结果,也就是每一个参数的梯度。

以上就是python深度学习人工智能BackPropagation链式法则的详细内容,更多关于python人工智能BackPropagation链式法则的资料请关注脚本之家其它相关文章!

相关文章

  • Python连接和操作PostgreSQL数据库的流程步骤

    Python连接和操作PostgreSQL数据库的流程步骤

    PostgreSQL 是一种开源的对象关系型数据库管理系统(ORDBMS),以其强大的功能和稳定性而广受欢迎,本文将详细介绍如何使用 Python 连接和操作 PostgreSQL 数据库,需要的朋友可以参考下
    2024-10-10
  • python requests更换代理适用于IP频率限制的方法

    python requests更换代理适用于IP频率限制的方法

    今天小编就为大家分享一篇python requests更换代理适用于IP频率限制的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • python boto和boto3操作bucket的示例

    python boto和boto3操作bucket的示例

    这篇文章主要介绍了python boto和boto3操作bucket的示例,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-10-10
  • Python实现感知机(PLA)算法

    Python实现感知机(PLA)算法

    这篇文章主要为大家详细介绍了Python实现感知机(PLA)算法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-12-12
  • Python切割图片成九宫格的示例代码

    Python切割图片成九宫格的示例代码

    这篇文章主要介绍了Python切割图片成九宫格的相关知识,本文通过截图实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • python获取指定目录下所有文件名列表的方法

    python获取指定目录下所有文件名列表的方法

    这篇文章主要介绍了python获取指定目录下所有文件名列表的方法,涉及Python目录及文件操作的相关技巧,需要的朋友可以参考下
    2015-05-05
  • Python使用cx_Oracle库连接Oracle数据库指南

    Python使用cx_Oracle库连接Oracle数据库指南

    这篇文章主要为大家介绍了Python使用cx_Oracle库连接Oracle数据库指南,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-12-12
  • Python利用多线程同步锁实现多窗口订票系统(推荐)

    Python利用多线程同步锁实现多窗口订票系统(推荐)

    这篇文章主要介绍了Python利用多线程同步锁实现多窗口订票系统,主要是利用threading.lock()通过实例代码相结合给大家讲解的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-12-12
  • Python与机器学习库LightGBM使用详解

    Python与机器学习库LightGBM使用详解

    LightGBM是一种高效的梯度提升决策树框架,以其快速训练和高预测性能闻名,它通过直方图算法和基于叶子生长策略优化技术,能够在大规模数据集上提供卓越性能,本文详细介绍了如何使用LightGBM进行分类和回归任务,包括模型构建、参数调整
    2025-01-01
  • 详解在OpenCV中实现的图像标注技术

    详解在OpenCV中实现的图像标注技术

    图像标注在计算机视觉中很重要,计算机视觉是一种技术,它允许计算机从数字图像或视频中获得高水平的理解力,并以人类的方式观察和解释视觉信息,本文将重点讨论在OpenCV的帮助下创建这些注释,感兴趣的朋友一起看看吧
    2022-06-06

最新评论