典型文献
融合语义及边界信息的中文电子病历命名实体识别
文献摘要:
中文电子病历数据专业性强,语法结构复杂,用于自然语言处理(NLP)的命名实体识别(NER)难度大.为了从电子病历数据中精确识别出医疗实体,提出了一种融合语义及边界信息的命名实体识别算法.首先,利用卷积神经网络(CNN)结构提取汉字图形信息,并与五笔特征拼接来丰富汉字的语义信息;然后,利用FLAT模型中的Lattice将医学词典作为字符潜在词组匹配文本信息;最后,将融入语义信息的Lattice模型用于中文电子病历命名实体识别.实验结果表明,该方法在Yidu-S4K数据集上的识别性能超过现有多种算法,且在Resume数据集上F1值可达到96.06%.
文献关键词:
中文电子病历;FLAT;医学字典;命名实体识别;自然语言处理
中图分类号:
作者姓名:
崔少国;陈俊桦;李晓虹
作者机构:
重庆师范大学计算机与信息科学学院 重庆 沙坪坝区 401331
文献出处:
引用格式:
[1]崔少国;陈俊桦;李晓虹-.融合语义及边界信息的中文电子病历命名实体识别)[J].电子科技大学学报,2022(04):565-571
A类:
Yidu,S4K,医学字典
B类:
合语,中文电子病历,历数,语法结构,自然语言处理,NLP,NER,精确识别,命名实体识别算法,结构提取,汉字,五笔,特征拼接,接来,语义信息,FLAT,Lattice,词典,字符,词组,文本信息,识别性,Resume
AB值:
0.255359
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。