- 内容介绍热点排行相关文章下载地址↓
-
《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。
基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。
除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。
目录
1 绪论 1
第一篇 强化学习基础 17
2 马尔科夫决策过程 18
3 基于模型的动态规划方法 36
第二篇 基于值函数的强化学习方法 57
4 基于蒙特卡罗的强化学习方法 58
5 基于时间差分的强化学习方法 75
6 基于值函数逼近的强化学习方法 88
第三篇 基于直接策略搜索的强化学习方法 125
7 基于策略梯度的强化学习方法 126
8 基于置信域策略优化的强化学习方法 142
9 基于确定性策略搜索的强化学习方法 165
10 基于引导策略搜索的强化学习方法 171
第四篇 强化学习研究及前沿 185
11 逆向强化学习 186
12 组合策略梯度和值函数方法 202
13 值迭代网络 207
14 基于模型的强化学习方法:PILCO及其扩展 214 -
人气书籍
-
算法导论 (原书第二版) 中文 PDF 清晰版 [48.6M]
48.6MB | 简体中文
-
61.03MB | 简体中文
-
Hadoop权威指南(第3版) 完整版(带目录书签) 中文PDF扫描版[108MB
108MB | 简体中文
-
WPF编程宝典 C#2010版 中文 PDF版 [118M]
118MB | 简体中文
-
Windows程序设计 (第5版 珍藏版)(Programming Windows, 5th Edit
390MB | 简体中文
-
17MB | 简体中文
-
深入理解计算机系统(原书第3版) 中文pdf完整版[500MB]
500.9MB | 简体中文
-
设计模式:可复用面向对象软件的基础 PDF 扫描版[21M]
21.58MB | 简体中文
-
OpenCV3编程入门 (毛星云著) PDF扫描版[61MB]
60.9MB | 简体中文
-
-
相关文章
-
网友评论
-
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的深入浅出强化学习:原理入门 中文pdf完整版[112MB] 含源代码资源来源互联网,版权归该下载资源的合法拥有者所有。