典型文献
基于预训练模型的政务领域实体关系抽取
文献摘要:
[目的/意义]海量电子政务信息资源极大地方便了人们对信息的获取,同时也给人们有效获取信息和知识提出了挑战.关系抽取是信息抽取的核心任务,政务领域的关系抽取对后续面向政务领域的智能检索、智能问答及政府公文生成等智慧化服务与建设具有深远影响.但是政务领域的文本中存在着大量的长实体,使得传统的关系抽取模型在政务领域数据集中的表现不尽如人意.[方法/过程]本文提出一种适用于政务领域的中文关系抽取模型CPRE-BERT,首先使用预训练BERT模型作为编码器,能够在一定程度上解决多义性、边界模糊以及领域关系数据数量不足的问题.其次,采用分类池化的思想分别处理短实体和长实体,最大程度上保留实体信息.最后,在中文领域人物关系公共数据集和政务领域数据集上的对比实验结果验证了模型的有效性.[结果/结论]实验结果表明,本文提出的方法在政务领域数据集上关系抽取的准确率和F1指标较基线模型分别提高了2.3%和2.2%.
文献关键词:
关系抽取;深度学习;BERT模型;分类池化
中图分类号:
作者姓名:
葛世奇;孙新;寇桓锦;袁燕
作者机构:
北京理工大学计算机学院 北京 100081;北京市海量语言信息处理与云计算应用工程技术研究中心 北京 100081
文献出处:
引用格式:
[1]葛世奇;孙新;寇桓锦;袁燕-.基于预训练模型的政务领域实体关系抽取)[J].情报工程,2022(04):3-13
A类:
电子政务信息资源,CPRE,分类池化
B类:
预训练模型,政务领域,实体关系抽取,获取信息,信息抽取,核心任务,智能检索,智能问答,政府公文,文生,智慧化服务,长实,取模,尽如人意,中文关系抽取,BERT,编码器,多义性,边界模糊,关系数据,别处,理短,实体信息,人物关系,公共数据,上关,基线模型
AB值:
0.274082
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。