您的位置:首页 > 编程语言 > Go语言

报名 | AlphaGo Zero是如何实现无师自通的?

2017-10-26 00:00 316 查看
「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文,由学术大咖带大家解读论文并展开讨论,在碎片化时代坚持深度阅读。

Google DeepMind 团队在 Nature 上发表的最新论文,阐述了新版 AlphaGo 是如何从空白状态学起,不使用任何人类棋谱,通过自对弈强化学习,仅用
3 天训练时间就以 100:0 击败了上一版本的 AlphaGo,并用 21 天达到 AlphaGo Master 水平。

AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读,我们邀请到 深入浅出看懂AlphaGo
Zero 一文的作者,圣何塞州立大学研究生刘遥行,带大家揭秘 AlphaGo 的前世今生。

论文介绍
Mastering the Game of Go without Human Knowledge
@PaperWeekly 推荐
#Deep Reinforcement Learning

DeepMind 最新成果,无师自通下围棋。

论文链接
http://www.paperweekly.site/papers/942
嘉宾介绍

 

刘遥行,圣何塞州立大学研究生,幕布(mubu.com)实习生,关注人工智能和现实生活的工业结合、人工智能和区块链技术的联合应用。

     论文共读     
 AlphaGo Zero是如何实现无师自通的?


AlphaGo Zero

论文解读√在线讨论√

活动形式:语音直播
 
 活动时间 
10 月 29 日(周日)13:00-14:15
45 min 串讲 + 30 min 讨论
*请在活动开始前完成论文精读
 

长按识别二维码,马上报名

*报名成功后,关注系统弹出的公众号获取活动提醒





[b]往期回顾[/b]
 

“阳奉阴违”的半监督学习算法
- Virtual Adversarial Training

关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入
PaperWeekly 的交流群里。



▽ 点击 | 阅读原文 |
进行报名
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: