新AlphaGo这么强!36小时从0自学成大师,100:0把李世乭版秒成渣渣 | Nature论文
2017-10-19 00:00
232 查看
李林 千平 发自 凹非寺
量子位 出品 | 公众号 QbitAI
“它最终超越了我们所有预期”。
DeepMind团队又放惊天消息。
简单地说,AlphaGo又有了重大进步。DeepMind把这个新版本的围棋AI称为AlphaGo Zero。之所以这样命名,是因为这个AI完全从零开始,自我学习下围棋,完全脱离人类知识。
以前其他版本的AlphaGo,都经过人类知识的训练,它们被告知人类高手如何下棋。而最新发布的AlphaGo Zero使用了更多原理和算法,从0开始,使用随机招式,40天后成为围棋界的绝世高手。真真正正的自学成才。
新的AlphaGo Zero使用了一种全新的强化学习方式,从0基础的神经网络开始,与搜索算法结合,不断进化调整、迭代升级。AlphaGo Zero的不同之处在于:
除了黑白棋子,没有其他人类教给AlphaGo Zero怎么下棋。而之前的AlphaGo包含少量人工设计的特征。
AlphaGo Zero只用了一个神经网络,而不是两个。以前AlphaGo是由“策略网络”和“价值网络”来共同确定如何落子。
AlphaGo Zero依赖神经网络来评估落子位置,而不使用rollouts——这是其他围棋程序使用的快速、随机游戏,用来预测哪一方会获胜。
创新工场AI工程院副院长王咏刚用“大道至简”四个字评价新版的AlphaGo Zero。
相关文章推荐
- 原来这么拍(38)——大师这么拍
- 自学高手AlphaGo Zero横空出世
- 自学高手AlphaGo Zero横空出世
- 怎样三天训练出AI围棋大师?教你AlphaGo Zero的3个trick
- .【引用】国学大师翟鸿深语录100
- 最强阿尔法狗诞生:自学3天,100:0碾压旧狗
- Facebook工程师解疑:AlphaGo为啥这么厉害?
- AlphaGo Zero都开始自学了,你今天机器学习了吗
- 如何看待自学3天的阿法元100:0完爆阿法狗?
- 手机归属地查询----自学了这么久总算可以不copy他人代码写出一款APP了 虽然有点丑
- 奇点到来,超越人类 《Nature论文:人工智能从0-1自学打败阿法狗 》论文翻译
- 奇点到来,超越人类 《Nature论文:人工智能从0-1自学打败阿法狗 》论文翻译
- 自学MFC编程怎么这么难啊?
- python自学笔记
- 随机生成10个不重复的0-100的数字
- 面向对象大师Bertrand Meyer荣获ACM软件系统大奖
- delphi开发的程序真的可以这么小吗?
- SQLite这么娇小可爱,不多了解点都不行啊
- Java常见100单词
- Codeforces Round #356 (Div. 2)-C. Bear and Prime 100