您的位置:首页 > 其它

论文常用实验数据收集整理

2016-09-20 10:24 393 查看

论文常用数据

论文常用数据
搜狗实验室
关键词

相关任务

Text Analysis Conference
关键词

相关任务

DUC

LCSTS
简介

任务

Open DataSet for DL4NLP Noahs Ark Lab
简介

持续更新中

1. 搜狗实验室

关键词

自然语言处理

中文语料

相关任务

分类,事件检测跟踪,新词发现,命名实体识别,自动摘要,机器翻译,分词,相关性排序,链接分析,反垃圾,基于内容的图片检索

2. Text Analysis Conference

关键词

TAC, 自然语言处理

文本分析, 英文语料

相关任务

文本处理的相关任务,摘要

DUC

在TAC之前,文本分析会议是DUC组织,所以之前的数据集和相关比赛可以在这里找到。DUC 2004 Documents for Summarization, Tasks, and Measures(2003-2007)

LCSTS

简介

A Large Scale Chinese Short Text Summarization Dataset

哈尔滨工业大学的智能计算研究中心

开放的数据集,需要提交申请

中文,新浪

包含大量的(短文本,摘要)对, 1W+的人工标注数据(给summary和short text的相关度评级)

任务

文本摘要

3. Open DataSet for DL4NLP | Noah’s Ark Lab

简介

Short-Text Conversation

来自新浪微博的4 million post-response,其中一个post可能评价对应30个response。

Generative Question Answering

持续更新中…..

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息