典型文献
融合多粒度信息与外部知识的短文本匹配模型
文献摘要:
中文短文本通常使用单词序列而非字符序列进行语义匹配,以获得更好的语义匹配性能.然而,中文分词可能是错误或模糊的,容易引入噪声或者错误传播,从而损害模型的匹配性能.此外,多数中文词汇具有一词多义的特点,短文本由于缺少上下文环境,相比一词多义的长文本更难理解,这对于模型正确捕获语义信息是一个更大的挑战.提出一种短文本匹配模型,使用词格长短期记忆网络(Lattice LSTM)融合字符和字符序列的多粒度信息.引入外部知识HowNet解决多义词的问题,使用软注意力机制获取2个句子间的交互信息,并利用均值池化和最大池化算法进一步提取句子的特征信息,获取句子级语义编码表示.在数据集LCQMC和BQ上的实验结果表明,与ESIM、BIMPM和Lattice-CNN模型相比,该模型能有效提升中文短文本语义匹配的准确率.
文献关键词:
短文本语义匹配;词格长短期记忆网络;多粒度信息;外部知识;软注意力机制
中图分类号:
作者姓名:
梁登玉;刘大明
作者机构:
上海电力大学计算机科学与技术学院,上海200090
文献出处:
引用格式:
[1]梁登玉;刘大明-.融合多粒度信息与外部知识的短文本匹配模型)[J].计算机工程,2022(08):129-135,143
A类:
词格长短期记忆网络,BIMPM,短文本语义匹配
B类:
多粒度信息,外部知识,短文本匹配,文本匹配模型,单词,词序,字符,匹配性能,中文分词,误传,文词,一词多义,上下文,长文,语义信息,用词,Lattice,HowNet,多义词,软注意力机制,交互信息,最大池化,特征信息,句子级,语义编码,编码表示,LCQMC,BQ,ESIM
AB值:
0.255417
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。