从Google人工智能DeepMind团队的AlphaGo的论文算法提取的学习方法:大脑逻辑结构图
2017-08-24 11:21
423 查看
从AlphaGo的论文算法 提取的人工智能学习方法
第一层 价值判断
重要的----百里挑一 ,去掉99%无用的。
第二层 快速响应(简单)和深度理解(复杂)
简单:常见的,固定的逻辑
复杂:卷积神经网络(分层拆分计算,求无限接近值)+蒙特卡洛树搜索(选重要节点向后推断,得到最优值)
第三层 强化学习
决策下一步 赏罚激励
第四层 专家网络
并入已有认知网络(归类)
第五层 自我提升
反向更新 自我学习
像不像我们的大脑?
你出门转一圈,并不会像摄像机一样记下所有东西,而是你会选择你认为重要的关注(价值判断)。
如果这条路你走了无数遍,你不会迷路,会快速找到你要逛的店(快速响应),这条路又熟悉了一遍(强化学习)。
但如果你走到了一条你从来没走过的街,遇到了不同的人,不同的房子,不同的植物等等,你可能很感兴趣。在看的同时,你会把这些特征试图理解(深度理解),贴上标签,存入你已有的认知体系(专家网络)。
你对周围越敏感,越在意,思考的越深(规则、算法、分层越多,拆分的越细,计算的时间越长),贴的标签越多,记住的东西越完整(深度理解)。
等下次再遇到时,你就会快速地(快速响应)知道,那人我曾经在哪遇到过。
如果这条新街,初次来就给你很多乐趣(赏罚激励),你下次肯定优先来这里逛。
你的价值判断会自动把这条街升级为最值得逛的街(反向更新,在五个层次里都会更新)。同时你还不断回忆这段快乐时光(自我学习)。
第一层 价值判断
重要的----百里挑一 ,去掉99%无用的。
第二层 快速响应(简单)和深度理解(复杂)
简单:常见的,固定的逻辑
复杂:卷积神经网络(分层拆分计算,求无限接近值)+蒙特卡洛树搜索(选重要节点向后推断,得到最优值)
第三层 强化学习
决策下一步 赏罚激励
第四层 专家网络
并入已有认知网络(归类)
第五层 自我提升
反向更新 自我学习
像不像我们的大脑?
你出门转一圈,并不会像摄像机一样记下所有东西,而是你会选择你认为重要的关注(价值判断)。
如果这条路你走了无数遍,你不会迷路,会快速找到你要逛的店(快速响应),这条路又熟悉了一遍(强化学习)。
但如果你走到了一条你从来没走过的街,遇到了不同的人,不同的房子,不同的植物等等,你可能很感兴趣。在看的同时,你会把这些特征试图理解(深度理解),贴上标签,存入你已有的认知体系(专家网络)。
你对周围越敏感,越在意,思考的越深(规则、算法、分层越多,拆分的越细,计算的时间越长),贴的标签越多,记住的东西越完整(深度理解)。
等下次再遇到时,你就会快速地(快速响应)知道,那人我曾经在哪遇到过。
如果这条新街,初次来就给你很多乐趣(赏罚激励),你下次肯定优先来这里逛。
你的价值判断会自动把这条街升级为最值得逛的街(反向更新,在五个层次里都会更新)。同时你还不断回忆这段快乐时光(自我学习)。
相关文章推荐
- node2vec: 网络结构特征提取、论文、算法python实现
- Java数据结构与算法之数据结构-逻辑结构-集合(六)------集合之ArrayList和LinkedList对比
- 一个后缀剥离算法(波特词干提取算法论文)
- 2018-3-6 (论文—网络评论中非结构信息应用于研究)笔记-----论文中的特征抽取的模型算法
- 人类思维的逻辑结构和算法实现
- 近期论文内容:ISAR图像目标提取算法-【2】重心法
- 算法的基本逻辑结构-概述
- 人类思维的逻辑结构和算法实现
- 近期论文内容:ISAR图像目标提取算法-【1】最大值法
- 算法笔记 (4)算法的逻辑结构
- Python cookbook(数据结构与算法)从字典中提取子集的方法示例
- 深度丨吴恩达团队最新论文:用CNN算法识别肺炎影像,准确率超过人类医生
- linux 内核常用数据结构及算法——container_of
- 数据结构与算法 2、单向/双向链表
- 算法和数据结构是程序的第一秘诀,缺之算法和数据结构是编程的最大原因
- Oracle的逻辑结构(表空间、段、区间、块)——Oracle数据块
- JavaScript中数据结构与算法(二):队列
- rsync 提取目录结构而不包括目录下的文件
- 漫步最优化三——优化算法的一般结构
- VB计算器项目算法结构分析