[ACL2017]Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme
2017-07-30 13:13
603 查看
entities识别和relations的判别目前有两种做法:1. pipeline的做法,首先识别实体,其次判断实体之间的关系类型(包含other);2. joint的方法,抽取实体和判断关系同时进行,比较典型的两篇文章是2013年ACL《Joint Event Extraction via Structured Prediction with Global Features》和2015年ACL《End-to-End Relation Extraction using LSTMs on Sequence and Tree Structures》(严格来讲,2015年的这篇文章并不能算是joint方法),不同于以往的两种做法,本文给出了一个新颖的思路,将entities的识别和relation的判断两个小任务合成一个任务来考虑,创新点如下:
(1)将联合抽取entities和判断relations的两个小任务作为一种标注任务来做
(2)基于这种标注模式,实验结果优于以往的pipeline和joint方法
(3)用了一个biased loss function以适应这种标注模式,强化了相关entities之间的关联
针对联合抽取entities和relations的标注模式,本文给出了一套新的标签,鉴于有人以详细的解释了该套标签,本文不再过多赘述,仅引用:
引用地址:http://www.sohu.com/a/147437571_500659
另外在文章的3.2小节中提到,如果一句话中包含两个或多个三元组是相同关系类型的话那么组成triplet采用就近原则。那么有几个疑问:
(1)如果一个实体参与了多个关系类型不同triplet,这套标签就不能表达这个关系,举个例子,美国总统川普,同时也是川普公司掌门人,这句话中有两个关系,也就是说川普这个实体是两个triplet的实体,而且这两个triplet关系类型不同,无法给川普打标签,或者说只能识别一个关系
(2)国家主席,军委主席习近平发表重要讲话,对这种交叉标签情况不使用
第二部分,本文采用的网络架构:
因为标签之间是有依存关系的(E-CP-1只能出现在B-CP-1和I-CP-1之后,不能出现在其他标签的后面)所以在解码的用CRF的特长可以发挥出来,但是本文没有采用目前很流行的做法biLSTM+CRF, 而是采用了LSTM+Softmax的做法,不能确定这另种做法哪种更好,待验证。
第三部分:目标函数(创新点之一)
采用了2012年Hinton提出的RMSprop , 我理解的不透彻,待理解明白了再更新
(1)将联合抽取entities和判断relations的两个小任务作为一种标注任务来做
(2)基于这种标注模式,实验结果优于以往的pipeline和joint方法
(3)用了一个biased loss function以适应这种标注模式,强化了相关entities之间的关联
针对联合抽取entities和relations的标注模式,本文给出了一套新的标签,鉴于有人以详细的解释了该套标签,本文不再过多赘述,仅引用:
引用地址:http://www.sohu.com/a/147437571_500659
另外在文章的3.2小节中提到,如果一句话中包含两个或多个三元组是相同关系类型的话那么组成triplet采用就近原则。那么有几个疑问:
(1)如果一个实体参与了多个关系类型不同triplet,这套标签就不能表达这个关系,举个例子,美国总统川普,同时也是川普公司掌门人,这句话中有两个关系,也就是说川普这个实体是两个triplet的实体,而且这两个triplet关系类型不同,无法给川普打标签,或者说只能识别一个关系
(2)国家主席,军委主席习近平发表重要讲话,对这种交叉标签情况不使用
第二部分,本文采用的网络架构:
因为标签之间是有依存关系的(E-CP-1只能出现在B-CP-1和I-CP-1之后,不能出现在其他标签的后面)所以在解码的用CRF的特长可以发挥出来,但是本文没有采用目前很流行的做法biLSTM+CRF, 而是采用了LSTM+Softmax的做法,不能确定这另种做法哪种更好,待验证。
第三部分:目标函数(创新点之一)
采用了2012年Hinton提出的RMSprop , 我理解的不透彻,待理解明白了再更新
相关文章推荐
- 基于新标注模式的实体和关系联合抽取方法(Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme)
- [ACL2017]Going out on a limb:Joint Extraction of Entity Mentions and Relations without Depende...
- 论文阅读笔记-CoType: Joint Extraction of Typed Entities and Relations with Knowledge Bases
- CoType: Joint Extraction of Typed Entities and Relations with Knowledge Bases阅读笔记
- Extraction of Entities and Relations调研
- Paper Research on the scheme of spatial database building based on the integration of GIS and CAD finished
- ruby merge array of hashes based on the key and order it by number of key/value pair
- 论文阅读:Three-dimensional reconstruction of teeth and jaws based on segmentation of CT images using wat
- 2013_CVPR_BoF meets HOG Feature Extraction based on Histograms of Oriented p.d.f Gradients for Image
- The Design and Implementation of Two-dimensional Vector Graphics Interactive Tools Based on “Smart Handle”
- A Novel Multi-label Classification Based on PCA and ML-KNN
- 2013_CVPR_BoF meets HOG Feature Extraction based on Histograms of Oriented p.d.f Gradients for Imag
- 【前缀和】【枚举倍数】 Codeforces Round #432 (Div. 2, based on IndiaHacks Final Round 2017) D. Arpa and a list of numbers
- 论文读书笔记-THE PECULIARITIES OF THE TEXTDOCUMENTREPRESENTATION, USINGONTOLOGY AND TAGGING-BASED CLUSTERI
- HSOG: A Novel Local Image Descriptor Based on Histogram of the Second-Order Gradients
- A Novel Multi-label Classification Based on PCA and ML-KNN
- Entities and Entities's Relation Extraction of ACE 2005
- Design and Implementation of Automatic Generation of Test Cases Based on Model Driven Architecture
- array summation and merging based on uniqueness of element at certain position + ruby arrays
- A Novel Approach to Improvingthe Efficiency of Storing and Accessing Small Files on Hadoop: a Case S