给我一个开头就能写故事, OpenAI的新型多功能AI模型GPT-2
OpenAI研究人员演示了一种新的AI模型,称为GPT-2,能够生成连贯的文本段落而无需任何特定任务的培训。换句话说,给它一个故事的第一行,它就会写出生成剩下的部分。除了生成文章外,它还可以执行基本的阅读理解,摘要问答。
GPT-2是一种无监督的语言模型,包含15亿个参数,并在800万个网页的数据集上进行训练。 “GPT-2受过简单训练,能够预测40GB互联网特定器中的下一个字”。 OpenAI团队表示,"它优于在特定领域(如维基百科,新闻或书籍)上培训的其他语言模型,因为它不需要使用这些特定领域的培训数据集。"
对于与语言相关的任务,例如问答,阅读理解和总结,GPT-2可以直接从原始文本中学习这些任务,并且不需要任何训练数据。 OpenAI团队表示GPT-2模型是“类变色龙”,并且很容易适应输入文本的样式和内容。
但是,团队观察到模型中存在某些失败因素,例如重复文本,世界建模失败和不自然的主题切换。找到一个好的样本取决于模型对该样本的上下文的熟悉程度。例如,当提示模型具有“数据中高度代表性”的主题时,比如麦莉•赛勒斯(Miley Cyrus)、《指环王》(Lord of the rings)等,它能够在50%的时间内生成合理的样本。另一方面,在技术含量高或内容复杂的情况下,该模型表现不佳。
OpenAI团队已经明确指出,它设想在开发人工智能写作助理,高级对话代理,语言之间无监督翻译和增强语音识别系统时使用GPT-2。它还指出了GPT-2的潜在滥用,因为它可用于生成误导性新闻文章,并自动化在社交媒体上大规模生产虚假和网络钓鱼内容。
由于对这种滥用语言生成模型的担忧,OpenAI决定发布一个“小”版本的GPT-2及其采样代码和研究论文供研究人员进行试验。数据集,培训代码或GPT-2模型权重已被排除在该版本之外。
OpenAI团队表示,此发布策略将为他们和整个AI社区提供时间来更深入地讨论此类系统的含义。它还希望政府采取措施监测人工智能技术的社会影响,并跟踪这些系统的能力进展。 OpenAI团队表示:“如果继续努力,这些努力将为人工智能实验室和政府在更大范围内就出版决策和人工智能政策做出决定提供更好的证据基础。”
公众对此消息的反应是积极的,然而,并非所有人都对OpenAI的发布策略感到满意,并认为这一举动标志着“封闭人工智能”,并传播了“对人工智能的恐惧”。
有关更多信息,请查看官方OpenAI GPT-2博客文章。
研究论文PDF可以到Linux公社资源站下载:
------------------------------------------分割线------------------------------------------
免费下载地址在 http://linux.linuxidc.com/
用户名与密码都是www.linuxidc.com
具体下载目录在 /2019年资料/2月/16日/给我一个开头就能写出故事, OpenAI的新型多功能AI模型GPT-2/
下载方法见 https://www.geek-share.com/detail/2585422475.html
------------------------------------------分割线------------------------------------------
Linux公社的RSS地址:https://www.linuxidc.com/rssFeed.aspx
本文永久更新链接地址:https://www.linuxidc.com/Linux/2019-02/156942.htm
- 两头堵模型(用来去除有一个字符串开头或结尾含有n个空格(” abcdefgdddd ”),欲去掉前后空格,返回一个新字符串。),工程开发经常需要用到的
- 十倍模型计算时间仅增20%:OpenAI开源梯度替换插件
- 这是一个转型AI的励志故事,从非科班到拿下竞赛一等奖
- OpenAI放出逆天语言AI模型,AI一本正经胡说八道
- 实战 | 这是一个转型AI的励志故事,从非科班到拿下阿里云栖一等奖,他经历的坑足够你学习100天
- 腾讯在家门口造了一个AI游戏盒子,这次不用氪金就能玩得开心
- 这是一个转型AI的励志故事,从非科班到拿下竞赛一等奖
- 谷歌大脑科学家亲解 LSTM:一个关于“遗忘”与“记忆”的故事 本文作者:奕欣 2017-01-14 09:46 导语:AI科技评论保证这是相对通俗易懂的一篇入门介绍了,看不懂的话欢迎关注「AI 科技
- 这是一个转型AI的励志故事,从非科班到拿下竞赛一等奖
- 这是一个转型AI的励志故事,从非科班到拿下AI一等奖
- OpenAI 首个研究成果 生成式模型系列
- OpenAI推新程序包:GPU适应十倍大模型仅需增加20%训练时间
- 实战 | 这是一个转型AI的励志故事,从非科班到拿下阿里云栖一等奖,他经历的坑足够你学习100天
- 【C#进阶系列】01 CLR的执行模型——一个Hello World的故事
- AI说人“画” | 什么?咱俩说的是一个“模型”嘛!
- 这是一个转型AI的励志故事,从非科班到拿下竞赛一等奖
- 机器学习之(二)OpenAI 生成模型聚焦无监督学习
- 两头堵模型:有一个字符串开头或结尾有n个空格,欲去掉前后空格返回一个新的字符串
- 一个百度程序员的创业故事
- 造人论坛——意识的本质和一个人工脑模型