您的位置：首页 > 编程语言 > Go语言

报名 | AlphaGo Zero是如何实现无师自通的？

2017-10-26 00:00 316 查看

「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文，由学术大咖带大家解读论文并展开讨论，在碎片化时代坚持深度阅读。

Google DeepMind 团队在 Nature 上发表的最新论文，阐述了新版 AlphaGo 是如何从空白状态学起，不使用任何人类棋谱，通过自对弈强化学习，仅用
3 天训练时间就以 100:0 击败了上一版本的 AlphaGo，并用 21 天达到 AlphaGo Master 水平。

AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读，我们邀请到深入浅出看懂AlphaGo
Zero 一文的作者，圣何塞州立大学研究生刘遥行，带大家揭秘 AlphaGo 的前世今生。

论文介绍
Mastering the Game of Go without Human Knowledge
@PaperWeekly 推荐
#Deep Reinforcement Learning

DeepMind 最新成果，无师自通下围棋。

论文链接
http://www.paperweekly.site/papers/942
嘉宾介绍

刘遥行，圣何塞州立大学研究生，幕布（mubu.com）实习生，关注人工智能和现实生活的工业结合、人工智能和区块链技术的联合应用。

论文共读
AlphaGo Zero是如何实现无师自通的？

AlphaGo Zero

论文解读√在线讨论√

活动形式：语音直播

活动时间
10 月 29 日（周日）13:00-14:15
45 min 串讲 + 30 min 讨论
*请在活动开始前完成论文精读

长按识别二维码，马上报名

*报名成功后，关注系统弹出的公众号获取活动提醒

[b]往期回顾[/b]

“阳奉阴违”的半监督学习算法
- Virtual Adversarial Training

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入
PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 |
进行报名

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航