您的位置:首页 > 产品设计 > UI/UE

#Paper Reading# SummaRuNNer: A RNN based Sequence Model for Extractive Summarization of Documents

2017-04-24 00:27 801 查看
论文题目:SummaRuNNer: A Recurrent Neural Network based Sequence Model for Extractive Summarization of Documents

论文地址:https://arxiv.org/abs/1611.04230

论文发表于:AAAI 2017

论文大体内容:

这篇文章提出了一个基于GRU-RNN的模型,来完成抽取式自动文本摘要任务。通过与其它state-of-the-art的结果相比,发现这种方法能够达到更好的效果。

1、本文关注点在于单文档,extraction式摘要;

2、本文主要的贡献点在于:

①提出SummaRuNNer模型,在extractive summarization上达到更好的效果;

②模型的公式说明性强;

③能够将abstractive summary引入到extractive model中,作为训练数据;

3、SummaRuNNer的具体做法是:





①第一个layer是word level layer,包括2类RNN结果,一个forward,一个backward,所以是双向的RNN;

②第二个layer是sentence level layer,使用word level layer的输出结果hidden state representation串联起来作为input;

③这个document的表示通过下面公式计算:



④预测的时候,遍历每个句子,使用二分类的方法判断这个句子需不需要加入摘要里面去,对应于一个logistic layer;





⑤loss function如下:



4、Abstractive的实现:

①SummarRuNNer的实现;

②往后面增加一个RNN Decoder,多了s(-1)做输入;



③使用了softmax layer来产生word;



④loss function如下(最大化summary中每个词出现的概率):



⑤Abstractive仅用于训练,即在Extractive的基础上,利用专家摘要的信息,来优化Extractive的模型,后面test的时候也是Extractive的方式;

实验

5、Dataset

①CNN/DailyMail语料: 196557 training documents, 12147 validation documents and 10396 test documents,平均而言,每个document有28个句子,每个summary中有3-4个句子;

②DUC2002语料:567个document;

③对于SummaRuNNer的loss function中真实数据的label y(i)的生成方式:使用贪心的思想,每次从所有句子中选出一个句子,使得该句子加入摘要中,能够使ROUGE值增加得最多,一直选择,直到ROUGE值不变或者减少的时候停止。这是选择的句子就作为Ground True;

6、评测方法

①ROUGE-1;

②ROUGE-2;

③ROUGE-L;

7、Baseline

①Lead-3 model:仅使用每个document的前3个句子作summary;

②LReg:a feature-rich logistic classifier used as a baseline by (Cheng and Lapata 2016);

③Integer Linear Programming;

④TGRAPH;

⑤URANK;

8、对比结果









样例:





以上均为个人见解,因本人水平有限,如发现有所错漏,敬请指出,谢谢!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐