典型文献
一种融合义原的中文摘要生成方法
文献摘要:
文本摘要旨在对冗长的文本进行简短精确的总结,同时保留文本的原始语义.该文提出一种融合义原的中文摘要生成方法(Add Sememe-Pointer Model,ASPM),以词为单位在LCSTS数据集上进行实验.算法利用基于Seq2Seq的指针网络模型以解决由于词汇表规模导致的未登录词问题.考虑到中文一词多义现象较多,只通过指针网络模型难以很好地理解文本语义,导致生成的摘要可读性不高.方法引入了义原知识库,训练多义词的词向量表示,准确地捕捉一个词在上下文的具体含义,并对LCSTS中的一些多义词进行义原标注,以使算法能更好地获取数据集中词语的语义信息.实验结果表明,该文提出的融合义原的中文摘要生成方法可以得到更高的ROUGE分数,使生成的摘要更加具有可读性.
文献关键词:
文本摘要;义原;指针网络;文本语义;词向量
中图分类号:
作者姓名:
崔卓;李红莲;张乐;吕学强
作者机构:
北京信息科技大学 信息与通信工程学院,北京100101;北京信息科技大学 网络文化与数字传播北京市重点实验室,北京100101
文献出处:
引用格式:
[1]崔卓;李红莲;张乐;吕学强-.一种融合义原的中文摘要生成方法)[J].中文信息学报,2022(06):146-154
A类:
Sememe,Pointer
B类:
文摘,摘要生成,生成方法,文本摘要,要旨,冗长,简短,Add,Model,ASPM,LCSTS,法利,Seq2Seq,指针网络,词汇表,未登录词,一词多义,多义现象,理解文本,文本语义,可读性,义原知识,知识库,多义词,词向量,向量表示,上下文,行义,获取数据,中词,词语,语义信息,ROUGE
AB值:
0.399856
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。