典型文献
多维字符特征表示的铁路设备事故信息抽取方法
文献摘要:
为解决铁路设备事故调查报告数据分析困难的问题,提出基于多维字符特征表示设备事故信息抽取方法,在数据预处理阶段,提出主题模式匹配方法,抽取命名实体所属的主题段落;在文本特征表示中,提出多维特征表示方法将文本转化为特征向量;采用长短时记忆网络(BiLSTM)与条件随机场(CRF)神经网络实现铁路设备事故命名实体识别模型训练;采用铁路设备事故调查报告进行试验验证.结果表明:通过主题模式匹配预处理,多维字符特征+BiLSTM+CRF模型的综合评价指标提升22.86%,多维字符特征表示方法相比word2vec特征表示方法,能够使BiLSTM+CRF模型的综合评价指标提升4.89%.
文献关键词:
多维字符特征;铁路设备事故;信息抽取;主题模式匹配;命名实体识别
中图分类号:
作者姓名:
张鹏翔
作者机构:
中国铁道科学研究院集团有限公司标准计量研究所,北京100081
文献出处:
引用格式:
[1]张鹏翔-.多维字符特征表示的铁路设备事故信息抽取方法)[J].中国安全科学学报,2022(06):109-114
A类:
多维字符特征,铁路设备事故,主题模式匹配,+BiLSTM+CRF
B类:
信息抽取,事故调查报告,数据预处理,匹配方法,段落,文本特征表示,多维特征,表示方法,特征向量,长短时记忆网络,条件随机场,命名实体识别,识别模型,模型训练,综合评价指标,指标提升,word2vec
AB值:
0.14359
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。