您的位置：首页 > 大数据 > 人工智能

给我一个开头就能写故事， OpenAI的新型多功能AI模型GPT-2

2019-02-16 00:00 627 查看

OpenAI研究人员演示了一种新的AI模型，称为GPT-2，能够生成连贯的文本段落而无需任何特定任务的培训。换句话说，给它一个故事的第一行，它就会写出生成剩下的部分。除了生成文章外，它还可以执行基本的阅读理解，摘要问答。

GPT-2是一种无监督的语言模型，包含15亿个参数，并在800万个网页的数据集上进行训练。 “GPT-2受过简单训练，能够预测40GB互联网特定器中的下一个字”。 OpenAI团队表示，"它优于在特定领域（如维基百科，新闻或书籍）上培训的其他语言模型，因为它不需要使用这些特定领域的培训数据集。"

对于与语言相关的任务，例如问答，阅读理解和总结，GPT-2可以直接从原始文本中学习这些任务，并且不需要任何训练数据。 OpenAI团队表示GPT-2模型是“类变色龙”，并且很容易适应输入文本的样式和内容。

但是，团队观察到模型中存在某些失败因素，例如重复文本，世界建模失败和不自然的主题切换。找到一个好的样本取决于模型对该样本的上下文的熟悉程度。例如，当提示模型具有“数据中高度代表性”的主题时，比如麦莉•赛勒斯(Miley Cyrus)、《指环王》(Lord of the rings)等，它能够在50％的时间内生成合理的样本。另一方面，在技术含量高或内容复杂的情况下，该模型表现不佳。

OpenAI团队已经明确指出，它设想在开发人工智能写作助理，高级对话代理，语言之间无监督翻译和增强语音识别系统时使用GPT-2。它还指出了GPT-2的潜在滥用，因为它可用于生成误导性新闻文章，并自动化在社交媒体上大规模生产虚假和网络钓鱼内容。

由于对这种滥用语言生成模型的担忧，OpenAI决定发布一个“小”版本的GPT-2及其采样代码和研究论文供研究人员进行试验。数据集，培训代码或GPT-2模型权重已被排除在该版本之外。

OpenAI团队表示，此发布策略将为他们和整个AI社区提供时间来更深入地讨论此类系统的含义。它还希望政府采取措施监测人工智能技术的社会影响，并跟踪这些系统的能力进展。 OpenAI团队表示:“如果继续努力，这些努力将为人工智能实验室和政府在更大范围内就出版决策和人工智能政策做出决定提供更好的证据基础。”

公众对此消息的反应是积极的，然而，并非所有人都对OpenAI的发布策略感到满意，并认为这一举动标志着“封闭人工智能”，并传播了“对人工智能的恐惧”。

有关更多信息，请查看官方OpenAI GPT-2博客文章。

研究论文PDF可以到Linux公社资源站下载：

------------------------------------------分割线------------------------------------------

免费下载地址在 http://linux.linuxidc.com/

用户名与密码都是www.linuxidc.com

具体下载目录在 /2019年资料/2月/16日/给我一个开头就能写出故事， OpenAI的新型多功能AI模型GPT-2/

下载方法见 https://www.geek-share.com/detail/2585422475.html

------------------------------------------分割线------------------------------------------

Linux公社的RSS地址：https://www.linuxidc.com/rssFeed.aspx

本文永久更新链接地址：https://www.linuxidc.com/Linux/2019-02/156942.htm

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： OpenAI GPT-2

相关文章推荐

新的分享

章节导航