增强学习(一)-基本概念的理解
2018-03-09 16:34
344 查看
Reinforcement learning
1.定义:
Reinforcement learning is learning what to do —-how to map situations to actions —- so as to maximize a numerical reward signal.
增强学习关注的是:智能体agent如何在环境中采取一系列行为,从而获得最大的累积回报。
机器学习的算法可以分为三类:
监督学习
非监督学习
增强学习
2.增强学习和非监督学习的区别:
增强学习是试错学习(Trail-and-error),由于没有直接的指导思想,智能体要以不断地域环境交互,通过试错的方式来获取最佳策略。
延迟回报,增强学习的知道信息很少,而且往往在事后(最后一个状态)才给出的,这就导致了一个问题,就是在获得正回报或者负回报以后,如何将信息分配给前面的状态。
3.强化学习有几个元素:
输入:
States:状态环境,例如迷宫中的每一个小格子就是一个state
Actions:行为,在每个状态下,有什么行为是允许的
Rewards:回馈,进入每个状态时,能带来的正面的或者负面的价值
输出:
Policy:在每个状态下,会选择哪个行为
4.算法
![](http://img.blog.csdn.net/20180309163520327?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMjY3OTU4Mw==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)
参考文献:
http://www.cnblogs.com/jinxulin/p/3511298.html
https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/1-1-A-RL/
1.定义:
Reinforcement learning is learning what to do —-how to map situations to actions —- so as to maximize a numerical reward signal.
增强学习关注的是:智能体agent如何在环境中采取一系列行为,从而获得最大的累积回报。
机器学习的算法可以分为三类:
监督学习
非监督学习
增强学习
2.增强学习和非监督学习的区别:
增强学习是试错学习(Trail-and-error),由于没有直接的指导思想,智能体要以不断地域环境交互,通过试错的方式来获取最佳策略。
延迟回报,增强学习的知道信息很少,而且往往在事后(最后一个状态)才给出的,这就导致了一个问题,就是在获得正回报或者负回报以后,如何将信息分配给前面的状态。
3.强化学习有几个元素:
输入:
States:状态环境,例如迷宫中的每一个小格子就是一个state
Actions:行为,在每个状态下,有什么行为是允许的
Rewards:回馈,进入每个状态时,能带来的正面的或者负面的价值
输出:
Policy:在每个状态下,会选择哪个行为
4.算法
参考文献:
http://www.cnblogs.com/jinxulin/p/3511298.html
https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/1-1-A-RL/
相关文章推荐
- Class类学习之Class概念理解,获取和基本操作
- ROS学习手记 - 4 理解ROS中的基本概念_ROS_Topics
- ROS学习手记 - 5 理解ROS中的基本概念_Services and Parameters
- tensorflow学习(2):tensorflow中基本概念的理解
- 深度学习之:CNN卷积神经网基本概念理解
- wcf学习--基本概念理解
- Topic Modeling 学习——基本概念的理解
- WCF学习之基本概念的理解
- ROS学习手记 - 3 理解ROS中的基本概念_ROS_Nodes
- 【Cocos2D学习】基本概念理解
- Spring MVC学习总结(一)---(一:基本概念和意义的理解)
- 深度学习基本概念的理解
- spark学习一 基本概念理解
- Spring4学习笔记一:环境搭建与插件安装、基本概念理解
- 增强学习(一) ----- 基本概念
- 增强学习之基本概念
- 黑马程序员——C语言基础学习(一)---C语言中的基本概念总结
- Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令
- JavaScript高级程序设计学习(二)之基本概念
- 从零开始学习OpenGL ES之一 – 基本概念