基于联合标注和全局推理的篇章级事件抽取

摘要:事件抽取可以帮助人们从海量的文本中快速、准确地获取感兴趣的事件知识。然而,目前事件抽取的研究主要集中在从单一句子中抽取事件,由于事件构成的复杂性和语言表述的多样性,多数情况下多句才能完整地描述一个事件。因此,从篇章中抽取出完整的结构化事件信息,显得更有价值和意义。该文首先利用基于注意力机制的序列标注模型联合抽取句子级事件的触发词和实体,与独立进行实体抽取和事件识别相比,联合标注的方法在F值上提升了1个百分点。然后利用多层感知机判断实体在事件中扮演的角色。最后,在句子级事件抽取的基础上,利用整数线性规划的方法进行全局推理,融合句子级事件信息,实现篇章级事件抽取,与基线模型相比,这种基于全局推理的篇章级事件抽取在F值上提升了3个百分点。

关键词:
  • 篇章级事件抽取  
  • 联合标注  
  • 全局推理  
作者:
仲伟峰; 杨航; 陈玉博; 刘康; 赵军
单位:
哈尔滨理工大学自动化学院; 黑龙江哈尔滨150080; 中国科学院自动化研究所模式识别国家重点实验室; 北京100190
刊名:
中文信息学报

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:中文信息学报

中文信息学报紧跟学术前沿,紧贴读者,国内刊号为:11-2325/N。坚持指导性与实用性相结合的原则,创办于1986年,杂志在全国同类期刊中发行数量名列前茅。