人工智能相扑选手令未来的机器人更加聪明敏捷
2017-11-01 00:00
330 查看
欢迎关注我们微信公众号,可以加入我们QQ人工智能行业交流群626784247.
01
在RoboSumo虚拟世界中战斗的机器人由机器学习软件控制,而非人类操控。与典型电子游戏中的电脑角色不同,他们并没有被预先编程去进行摔跤搏斗;相反,他们必须在反复摸索中“学习”这项运动,使机器人借助AI系统变得聪明敏捷。
图片来自“123rf.com.cn”
图形并不令人眼花缭乱,但相扑电子游戏可能有助于让人工智能软件更加智能化。
在RoboSumo虚拟世界中战斗的机器人由机器学习软件控制,而非人类操控。与典型电子游戏中的电脑角色不同,他们并没有被预先编程去进行摔跤搏斗;相反,他们必须在反复摸索中“学习”这项运动。该游戏由Elon Musk共同发起的非营利研究实验室OpenAI开发,希望借助人工智能系统让机器人变得更加智能聪明。
OpenAI的研究员Igor Mordatch表示,因为人工智能代理面临对手造成的复杂,变化的环境,所以这样的比赛会带来一种智力军备竞赛。这可能有助于学习软件学到对控制机器人和其他现实世界任务有价值的复杂技能。
在OpenAI的实验中,简单的人形机器人进入到竞技场,它们甚至不知道如何行走。这些机器人有通过反复试验进行学习的能力,有学习四处移动,打败对手的目标。经过大约十亿次的实验,机器人开发了一些策略,比如,蹲下来让自己更加稳固,诱使对手从拳击场掉落到地面上。研究人员开发了新的学习算法,让玩家能够在一场比赛中调整自己的策略,甚至预测对手何时可能会改变战术。
OpenAI的项目例证了,人工智能研究人员如何试图避免使用率最高的多种机器学习软件的局限性,该软件通过处理大量的标签示例数据获得新技能。这种方法推动了翻译,语音和面部识别等领域的进展。但是,对于让人工智能应用的更为广泛的复杂技能来说,例如通过控制家用机器人,这种方法却是不实际的。
研发更灵巧的人工智能的一个可能途径就是强化学习,软件利用反复试验来实现特定的目标。这就是DeepMind(谷歌收购的伦敦人工智能初创公司)如何让软件控制Atari游戏的方式。该技术现在被用于让软件开始处理更为复杂的问题,例如让机器人捡起物品。
OpenAI的研究人员之所以创建RoboSumo,原因是,他们认为与让强化学习软件单独处理更为复杂的问题相比,由竞争带来的额外复杂性可能会得到更快的进步。卡耐基梅隆大学研究生Maruan Al-Shedivat说:“当你与其他代理进行互动时,你必须适应。如果不这样做,你就会失败。”Maruan Al-Shedivat在OpenAI实习期间参与了RoboSumo的工作。
OpenAI的研究人员也用蜘蛛状的机器人以及其他的游戏(如简单的足球罚球)来测验了这一想法。OpenAI发布了两篇研究论文,有关与人工智能代理进行比赛的工作,以及RoboSumo,其他一些游戏和几位专业球员的代码,。
相扑摔跤可能不是智能机器可以为我们做的最重要的事情。但是,OpenAI的一些实验表明,在一个虚拟竞技场中学到的技能可以转移到其他情境中。当把机器人从相扑场地运送到具有强风的虚拟世界时,机器人还会支撑住保持直立。这表明它已经学会了用普通的方式来控制身体和平衡。
将虚拟世界的技能转化为真实的技能是一个完全不同的挑战。德克萨斯大学奥斯汀分校教授Peter Stone表示,在虚拟环境下工作的控制系统在物理机器人身体中通常都不起作用——这个尚未解决的问题被称为“现实差距”。
尽管尚未公布任何突破,但OpenAI的研究人员仍在研究这一问题。与此同时,Mordatch想给他的虚拟类人生物更多的动力做更多的事情,而不仅仅是进行比赛。他正在考虑一个完整的足球比赛,在比赛中,代理也都必须合作。
02
—
52AI
52AI,专注服务于普通人的AI 学习和发展,让大众受益于人工智能就是我们的愿望。我们坚信只有对大众收益的科技才是有意义的,也是我们追求的方向。
01
在RoboSumo虚拟世界中战斗的机器人由机器学习软件控制,而非人类操控。与典型电子游戏中的电脑角色不同,他们并没有被预先编程去进行摔跤搏斗;相反,他们必须在反复摸索中“学习”这项运动,使机器人借助AI系统变得聪明敏捷。
图片来自“123rf.com.cn”
图形并不令人眼花缭乱,但相扑电子游戏可能有助于让人工智能软件更加智能化。
在RoboSumo虚拟世界中战斗的机器人由机器学习软件控制,而非人类操控。与典型电子游戏中的电脑角色不同,他们并没有被预先编程去进行摔跤搏斗;相反,他们必须在反复摸索中“学习”这项运动。该游戏由Elon Musk共同发起的非营利研究实验室OpenAI开发,希望借助人工智能系统让机器人变得更加智能聪明。
OpenAI的研究员Igor Mordatch表示,因为人工智能代理面临对手造成的复杂,变化的环境,所以这样的比赛会带来一种智力军备竞赛。这可能有助于学习软件学到对控制机器人和其他现实世界任务有价值的复杂技能。
在OpenAI的实验中,简单的人形机器人进入到竞技场,它们甚至不知道如何行走。这些机器人有通过反复试验进行学习的能力,有学习四处移动,打败对手的目标。经过大约十亿次的实验,机器人开发了一些策略,比如,蹲下来让自己更加稳固,诱使对手从拳击场掉落到地面上。研究人员开发了新的学习算法,让玩家能够在一场比赛中调整自己的策略,甚至预测对手何时可能会改变战术。
OpenAI的项目例证了,人工智能研究人员如何试图避免使用率最高的多种机器学习软件的局限性,该软件通过处理大量的标签示例数据获得新技能。这种方法推动了翻译,语音和面部识别等领域的进展。但是,对于让人工智能应用的更为广泛的复杂技能来说,例如通过控制家用机器人,这种方法却是不实际的。
研发更灵巧的人工智能的一个可能途径就是强化学习,软件利用反复试验来实现特定的目标。这就是DeepMind(谷歌收购的伦敦人工智能初创公司)如何让软件控制Atari游戏的方式。该技术现在被用于让软件开始处理更为复杂的问题,例如让机器人捡起物品。
OpenAI的研究人员之所以创建RoboSumo,原因是,他们认为与让强化学习软件单独处理更为复杂的问题相比,由竞争带来的额外复杂性可能会得到更快的进步。卡耐基梅隆大学研究生Maruan Al-Shedivat说:“当你与其他代理进行互动时,你必须适应。如果不这样做,你就会失败。”Maruan Al-Shedivat在OpenAI实习期间参与了RoboSumo的工作。
OpenAI的研究人员也用蜘蛛状的机器人以及其他的游戏(如简单的足球罚球)来测验了这一想法。OpenAI发布了两篇研究论文,有关与人工智能代理进行比赛的工作,以及RoboSumo,其他一些游戏和几位专业球员的代码,。
相扑摔跤可能不是智能机器可以为我们做的最重要的事情。但是,OpenAI的一些实验表明,在一个虚拟竞技场中学到的技能可以转移到其他情境中。当把机器人从相扑场地运送到具有强风的虚拟世界时,机器人还会支撑住保持直立。这表明它已经学会了用普通的方式来控制身体和平衡。
将虚拟世界的技能转化为真实的技能是一个完全不同的挑战。德克萨斯大学奥斯汀分校教授Peter Stone表示,在虚拟环境下工作的控制系统在物理机器人身体中通常都不起作用——这个尚未解决的问题被称为“现实差距”。
尽管尚未公布任何突破,但OpenAI的研究人员仍在研究这一问题。与此同时,Mordatch想给他的虚拟类人生物更多的动力做更多的事情,而不仅仅是进行比赛。他正在考虑一个完整的足球比赛,在比赛中,代理也都必须合作。
02
—
52AI
52AI,专注服务于普通人的AI 学习和发展,让大众受益于人工智能就是我们的愿望。我们坚信只有对大众收益的科技才是有意义的,也是我们追求的方向。
相关文章推荐
- 有生之年,人工智能会给世界带来什么变化?这里是现代机器人之父Rodney Brooks关于未来的预言
- AI人工智能 机器人 无人驾驶 可穿戴设备 自动化识别技术是未来趋势 抓住
- 尼克《人工智能简史》谈人工智能的历史、现实与未来
- 小机器人跌跌撞撞走向未来:Android平板发展艰难
- 人工智能火爆了!阿里机器人都会批改作文了!苹果开源机器学习框架;360 开源深度学习平台 XLearning;
- 趋势 | 未来15年,人工智能将带给城市8大关键性改变
- 2017人工智能大会核心技术流出_机器人竟然已经能干这个了?
- 打开人工智能的“黑匣子”,让AI更加透明 | 观点
- 如果人工智能就在不远的未来,你该怎样布局当下?
- 【人工智能】波士顿咨询:人工智能,未来制胜之道
- 未来一大不容忽视的问题:人工智能安全性
- 下一个软件开发的浪潮将从搜索机器人和人工智能兴起
- 从零开始玩人工智能-机器人服务-01
- 未来30年的人工智能和物联网
- [YY篇]未来50年人工智能家庭应用篇猜想
- 智能机器人让你在家享受米其林星级大餐,未来它还要把人类从厨房解放出来
- 古代荀子也懂AI?达芬奇的手术机器人有多神奇? 听浙大吴飞扒一扒人工智能的“古今中外”!
- 【人工智能】未来5年AI应用报告:谷歌、DeepMind、英伟达科学家支招企业AI应用
- 这个用两条腿走路的机器人会有怎样的未来 | 漫读
- 机器人开发平台,以高科技来抢占未来市场