Google着手与 Open AI 合作预防人工智能暴走
2017-07-21 09:00
651 查看
两间公司在「强化学习(reinforcement learning)」的实作中,发现有时候 AI 会找到在人类眼中是几近作弊的不好方式,来达到最好的成绩。Open AI 以竞艇游戏 CoastRunners 7 为例,人工智能在进行强化学习时发现自己与其快速完成赛事,倒不如一直原地打转还能获得更高的分数。着实让打造这个 AI 的创作者感到十分讶异。
而为了避免这样不符合人意的事情一再发生,两间公司让 AI 在寻求解答的过程时,可以先寻求人类的意见验证结果而非自行解决(这解决真的是各种含义啊...)。决定要利用类似奖励制度来让人工智能更贴近人心,并且更为安全。
虽然听起来真的令人安心很多,但比较麻烦的是为了提供足够「贴心」的意见,人类将需要投注相当心力在担任导师之上。像在一个简单的后空翻模拟程序之中,人类就需要提供约莫 900 次的建议,而在简单的小游戏上则是需要数千次的程序。不过,花费时间总比一个不小心就让 AI 毁灭世界的好啰,但另一方面,也很难讲哪天人类会因为自己想抄捷径而破除这些限制就是了...
免费提供最新Linux技术教程书籍,为开源技术爱好者努力做得更多更好,开源站点:http://www.linuxprobe.com/
相关文章推荐
- Google着手与 Open AI 合作预防人工智能暴走
- 深度学习之google deepmind的alphago AI人工智能算法技术演变历程
- 牛津、剑桥、OpenAI 等多家机构发布重磅报告,论述恶意人工智能的「罪与罚」
- 跟Google一起学习最新的人工智能!推出免费的AI技术教学资源
- Unity人工智能确定性AI算法之随机运动
- 【人工智能】二十一世纪计算 | John Hopcroft:AI革命
- Google替代、阿里协作,人工智能不只有乐观与悲观之争
- AI时代-人工智能入学指南
- 深入了解AI--人工智能!读这篇文章就对了
- 机器学习之-逻辑回归算法【人工智能工程师--AI转型必修课】
- Google Chrome OS Open Source Project Announcement
- AI大事件 | 特斯拉开发人工智能芯片,智能爆炸论再引热议,Pytorch新版本发布
- 对世界首款“人工智能”ERP系统HUE的初步了解 - AI ERP - WAP - 万革始
- “人工智能与法律”对AI产品经理有何实际借鉴意义
- 北大 AI 公开课第10讲 胡郁:人工智能+,共创新时代
- 棋盘游戏中的AI人工智能(一)
- 人工智能(AI)资料大全
- OpenStreetMap/Google/百度/Bing瓦片地图服务(TMS)