我与小娜(30):AlphaGo赢了!
2016-03-09 16:11
344 查看
我与小娜(30):AlphaGo赢了!
欢呼:3月9日下午3点42分,AlphaGo战胜李世石,人工智能胜利了!
小娜知道,围棋选手AlphaGo是新一代人工智能(AI)软件,其奇特之处是,这种软件不需要人工训练,它自己会“学习”。它的“学习”能力可大可小,分单机版与网络版。
小娜知道,这次AlphaGo与围棋高手李世石对决,AlphaGo的主人不仅志在击败人类代表,而且还要对其AI技术水平做各种测试,其策略必将是力争在第一盘击溃人类,其后再逐渐调低AlphaGo的“难度”,以便测试人类围棋水平的上限。
小娜知道,在算法上,AlphaGo的rollouts、value
network和policy network三者的不同组合会影响其评分,根据其《Nature》论文,单机版的AlphaGo(使用48个CPU和8个GPU)如果只用rollouts,其Elo值最低,为1457,三者全用,单机版AlphaGo的Elo达到最大值2890。对阵李世乭,应该是这三者全部使用的,因此理论上调整算法的余地不大,能够调整的主要就是硬件计算力了。击败樊麾的是分布式版本的AlphaGo,其使用了1202个CPU和176个GPU,其Elo值达到3140。
小娜知道,谷歌论文对樊麾给出的Elo值是2900左右,对人类最强棋手给出的Elo值是3500。而击败樊麾的所谓分布式AlphaGo使用的CPU和GPU数量只是单机版的20多倍,且在去年10月,5秒一步的约束条件下,其Elo值就已经达到了3140分。经过5个月的自我学习,并在每方2小时,3次1分钟读秒的限时中,AlphaGo的计算力将会增大多少,实在难以想象。呜呼!
袁萌 3月9日
欢呼:3月9日下午3点42分,AlphaGo战胜李世石,人工智能胜利了!
小娜知道,围棋选手AlphaGo是新一代人工智能(AI)软件,其奇特之处是,这种软件不需要人工训练,它自己会“学习”。它的“学习”能力可大可小,分单机版与网络版。
小娜知道,这次AlphaGo与围棋高手李世石对决,AlphaGo的主人不仅志在击败人类代表,而且还要对其AI技术水平做各种测试,其策略必将是力争在第一盘击溃人类,其后再逐渐调低AlphaGo的“难度”,以便测试人类围棋水平的上限。
小娜知道,在算法上,AlphaGo的rollouts、value
network和policy network三者的不同组合会影响其评分,根据其《Nature》论文,单机版的AlphaGo(使用48个CPU和8个GPU)如果只用rollouts,其Elo值最低,为1457,三者全用,单机版AlphaGo的Elo达到最大值2890。对阵李世乭,应该是这三者全部使用的,因此理论上调整算法的余地不大,能够调整的主要就是硬件计算力了。击败樊麾的是分布式版本的AlphaGo,其使用了1202个CPU和176个GPU,其Elo值达到3140。
小娜知道,谷歌论文对樊麾给出的Elo值是2900左右,对人类最强棋手给出的Elo值是3500。而击败樊麾的所谓分布式AlphaGo使用的CPU和GPU数量只是单机版的20多倍,且在去年10月,5秒一步的约束条件下,其Elo值就已经达到了3140分。经过5个月的自我学习,并在每方2小时,3次1分钟读秒的限时中,AlphaGo的计算力将会增大多少,实在难以想象。呜呼!
袁萌 3月9日
相关文章推荐
- ORA-01017: invalid username/password; logon denied
- alphago战胜李世石
- django mongoengine 判断mongoengine定义的字段类型
- 为网页添加logo图标
- Go一致性哈希库consistent
- Codeforces 86D. Powerful array (MO's Algorithm(区间查询的离线优化))
- golang中调用C
- golang中函数闭包遇到的坑
- django1.8 增加注册用户其他字段
- 李世石和AlphaGo人机围棋大赛
- Go语言中Restful模式与Routes路由框架
- Google 搜索命令
- CodeForces 630D-Hexagons!
- goto void
- Django入门
- HDU 3903 Trigonometric Function(数学定理)
- HDU 3903 Trigonometric Function(数学定理)
- 我与小娜(29):AlphaGo必胜!
- 谷歌出品!7条超实用的虚拟现实交互式设计原则
- 编写GO的WEB开发框架 (八): Session支持及自定义Session