您的位置：首页 > 其它

增强学习（一）-基本概念的理解

2018-03-09 16:34 344 查看

Reinforcement learning

1.定义：

Reinforcement learning is learning what to do —-how to map situations to actions —- so as to maximize a numerical reward signal.

增强学习关注的是：智能体agent如何在环境中采取一系列行为，从而获得最大的累积回报。

机器学习的算法可以分为三类：

监督学习

非监督学习

增强学习

2.增强学习和非监督学习的区别：

增强学习是试错学习（Trail-and-error）,由于没有直接的指导思想，智能体要以不断地域环境交互，通过试错的方式来获取最佳策略。

延迟回报，增强学习的知道信息很少，而且往往在事后（最后一个状态）才给出的，这就导致了一个问题，就是在获得正回报或者负回报以后，如何将信息分配给前面的状态。

3.强化学习有几个元素：

输入：

States：状态环境，例如迷宫中的每一个小格子就是一个state

Actions：行为，在每个状态下，有什么行为是允许的

Rewards：回馈，进入每个状态时，能带来的正面的或者负面的价值

输出：

Policy：在每个状态下，会选择哪个行为

4.算法

参考文献：

http://www.cnblogs.com/jinxulin/p/3511298.html

https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/1-1-A-RL/

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 强化学习

相关文章推荐

新的分享

章节导航