持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第8天,点击查看活动详情
创新点
- 动机:2016年的论文(这篇文章)提出的关系联合抽取的机器学习模型通过共享参数继续关系的联合抽取,但它忽略了标签之间的长依赖关系,并且存在信息冗余和误差传播的问题
- 因此,2017年《Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme》这篇文章提出了一种新的标注方案用于标注关系和实体,从而将联合抽取问题转换为序列标注问题
- 通过提出的标注方案,解决了2016年文章中的模型存在的问题
- 它通过在机器学习模型中添加LSTM层,解决了标签之间的长依赖问题;通过共同学习的方法,解决了误差传播的问题;通过之间抽取关系三元组,解决了信息冗余的问题
模型结构
- 文中使用的模型结构如下图,主要是使用了BiLSTM和LSTM层
新标注方案
- 文中模型提出的标注方案如下图,通过
位置标签-关系标签-主客实体标签(主客实体标签为1和2,分别表示关系三元组中的主实体和客实体)来提取关系三元组 - 如图中的案例,生成标注序列后,给句子中的每个主实体(以
-1结尾标签标识的实体),按就近原则查找该主实体同中关系的客实体(以2结尾标签标识的实体)
存在的问题
- 文章无法解决三元组重叠的问题,即抽取出来的每一个主实体只能对应一种关系,对一个实体对应多种关系的情况无法解决