基于文本挖掘技术的铁路安监人员履职分析

摘要:为分析人员工作计划实际落实情况,提供人员考核依据,基于文本挖掘技术进行了铁路安监人员履职分析并设计了文本相似度计算方法。应用双向长短时记忆(BiLSTM)网络与条件随机场(CRF)相结合的BiLSTM-CRF算法实现人员履职计划与写实文本中命名实体的抽取,采用基于知网的概念相似度计算方法计算对应实体间相似度,从而实现人员履职计划内容与实际写实的匹配计算。通过对某铁路局安监人员工作计划与写实文本数据的实验分析,得出BiLSTM-CRF算法针对各命名实体均有90%以上的准确率,人员计划与写实匹配准确度为83%。实验证明利用BiLSTM-CRF算法与概念相似度结合的文本计算方法进行人员履职分析具有可行性,也可为铁路领域其他短文本相似性计算提供参考。

关键词:
  • 文本相似度  
  • 双向长短时记忆网络  
  • 条件随机场  
  • 命名实体识别  
  • 概念相似度  
作者:
李新琴; 马小宁; 王喆; 邹丹; 杨连报
单位:
中国铁道科学研究院研究生部; 北京100081; 中国铁道科学研究院集团有限公司铁路大数据研究与应用创新中心; 北京100081
刊名:
铁路计算机应用

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:铁路计算机应用

铁路计算机应用杂志紧跟学术前沿,紧贴读者,国内刊号为:11-3471/TP。坚持指导性与实用性相结合的原则,创办于1992年,杂志在全国同类期刊中发行数量名列前茅。