强化学习(Reinforcement Learning)的方法分类
2017-08-01 20:27
435 查看
强化学习(Reinforcement Learning)的方法分类
从Andrew Ng的cs229公开课开始接触强化学习已经有一段时间了,但对于强化学习中的各种方法一直很混乱,有必要简单归类整理一下,涉及的强化学习方法有:Value Iteration 值迭代
Policy Iteration 策略迭代
Monte Carlo Learing 蒙特卡洛学习
Q-learning
DQN(Deep Q-learning Network)
Sarsa
Policy Gradient
Actor-Critic
DDPG(Deep Deterministic Policy Gradient)
A3C(Asynchronous Advantage Actor-Critic)
所有的这些强化学习方法都是以马尔可夫决策过程(MDPs)为基础的
这些方法的具体总结以后有时间再做。
相关文章推荐
- 巴巴运动网学习笔记三之产品分类实体对象基本属性的JPA映射,用泛型技术对产品分类的业务管理Bean抽象,单元测试产品分类的业务管理Bean.,重载业务管理Bean的删除方法,
- Janki学习和强化记忆的方法
- 字符串strip()方法注意事项 分类: python基础学习 2013-08-16 12:01 422人阅读 评论(0) 收藏
- open()文件对象的seek、tell方法详解 分类: python基础学习 open()文件读写 python Module 2013-09-05 09:40 450人阅读 评论(0) 收藏
- python 调用shell命令三种方法 分类: python基础学习 python Module 2014-01-13 14:13 239人阅读 评论(0) 收藏
- FC网络学习笔记02 -网络配置方法 分类: 网络基础 2013-10-10 09:43 765人阅读 评论(0) 收藏
- linux下项目开发中防止重复定义和重复包含的方法 分类: 嵌入式开发学习 2011-06-12 23:45 1393人阅读 评论(0) 收藏
- 黑马程序员-我的第十一篇学习日记:OC构造方法和分类的使用
- 黑马程序员——OC语言学习——关键字id、构造方法、Category-分类、类的本质、 description方法、 SEL方法
- Python的静态方法和类成员方法 分类: python基础学习 2014-08-13 14:21 205人阅读 评论(0) 收藏
- Python生成8位随机字符串的一些方法 分类: python学习 2015-04-28 20:00 62人阅读 评论(0) 收藏
- 阅读笔记——基于字典学习的图像分类方法总结
- Python的静态方法和类成员方法 分类: python学习 2015-05-07 19:45 40人阅读 评论(0) 收藏
- 《C#入门经典》第六版 学习笔记之第十章 定义类成员(1) 10.3 接口的实现~10.5 部分类方法定义
- vim python自动补全方法 分类: ubuntu python基础学习 虚拟机 测试 2013-07-05 15:37 603人阅读 评论(0) 收藏
- Objective-C基础学习笔记(七)-分类-Category-类的本质-load和+initialize方法-SEL数据
- file()创建文件方法 分类: python python基础学习 2012-12-24 18:17 239人阅读 评论(0) 收藏
- c语言 中 # ##的使用方法 分类: 嵌入式开发学习 2014-05-23 17:16 141人阅读 评论(0) 收藏
- 文本分类方法学习
- os.walk()方法 分类: python Module python基础学习 2013-08-09 07:59 342人阅读 评论(0) 收藏