如何看待自学3天的阿法元100:0完爆阿法狗?
2017-10-23 14:20
162 查看
点击有惊喜
Deepmind在如约在Nature发布了一篇名为《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋)的论文,在这篇重磅论文中,详细介绍了谷歌
DeepMind 团队最新的研究成果。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。
去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1 打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗。
今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0 打败哥哥阿法狗。他的名字叫阿法元。
阿尔法元的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。
人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero),完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcement learning)和参悟,棋艺增长远超阿法狗,百战百胜,以 100-0 击溃阿法狗。
达到这样一个水准,阿法元只需要在 4 个 TPU 上,花三天时间,自己左右互搏 490 万棋局。而它的哥哥阿法狗,需要在 48 个 TPU 上,花几个月的时间,学习三千万棋局,才打败人类。
点击有惊喜
Deepmind在如约在Nature发布了一篇名为《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋)的论文,在这篇重磅论文中,详细介绍了谷歌
DeepMind 团队最新的研究成果。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。
去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1 打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗。
今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0 打败哥哥阿法狗。他的名字叫阿法元。
阿尔法元的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。
人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero),完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcement learning)和参悟,棋艺增长远超阿法狗,百战百胜,以 100-0 击溃阿法狗。
达到这样一个水准,阿法元只需要在 4 个 TPU 上,花三天时间,自己左右互搏 490 万棋局。而它的哥哥阿法狗,需要在 48 个 TPU 上,花几个月的时间,学习三千万棋局,才打败人类。
点击有惊喜
相关文章推荐
- 最强阿尔法狗诞生:自学3天,100:0碾压旧狗
- 如何看待 Google 最新的系统 Fuchsia?
- 武央:如何看待当前经济形势
- 如何判断100以内的素数?
- 离开学校如何自学成为一名网页设计师1
- 离开学校或如何自学成为网页设计师
- Unix编程笔记疑问篇----如何从指令运行的角度去看待系统调用???
- 我是如何从零开始自学Android到一万月薪的
- 如何看待操作系统的用户空间和内核空间?
- 如何自学JAVA迅速成为JAVA高手
- 找工作时,你如何看待薪资问题
- 如何看待操作系统的用户空间和内核空间?
- 新手自学Java——Java程序员如何培养自学能力
- 敏捷开发下该如何正确的看待人/天这件事?
- 如何看待黄金暴跌行情(cpc黄金分析)
- 如何看待当前我国的周边形势-----高文兵(中南大学党委书记)
- 如何看待许多年轻人“疯狂”的投入到 IT 培训当中
- 如何看待java的this???
- 设计师如何看待老板经常在快下班的时候给任务要求第二天出图?
- 如何看待算法