首站-论文投稿智能助手
典型文献
基于领域特征提纯的多领域文本分类
文献摘要:
文本分类是自然语言处理领域中一项基本任务,但目前的文本分类任务往往是领域独立的,且需要丰富的标注数据.该文通过利用不同领域的数据蕴含的相似信息,在一定程度上缓解标签训练数据不足的问题.该文提出了一种多任务学习模型来解决跨领域文本分类任务,通过每个领域的私有编码器和所有领域的共享编码器来分别提取私有特征和共享特征,从而利用不同层面的领域知识来表示文本,并帮助文本分类.另外,该文还利用正交投影将共享特征和领域私有特征进一步异化,从而强化共享特征的纯度,同时使用门控机制将共享特征和私有特征进行重组融合.我们在两个常用的多领域文本分类数据集(Amazon和FDU-MTL)上对所提模型进行了验证.实验结果表明,该模型在Amazon和FDU-MTL数据集上的平均分类准确率分别达到了86.04%和89.2%,较之前多个基线模型有明显提升.
文献关键词:
文本分类;多领域;特征提纯;多任务学习
作者姓名:
马式琨;滕冲;李霏;姬东鸿
作者机构:
武汉大学 国家网络安全学院 空天信息安全与可信计算教育部重点实验室,湖北 武汉 430072
文献出处:
引用格式:
[1]马式琨;滕冲;李霏;姬东鸿-.基于领域特征提纯的多领域文本分类)[J].中文信息学报,2022(08):92-100
A类:
特征提纯,FDU
B类:
文本分类,自然语言处理,基本任务,分类任务,训练数据,多任务学习,跨领域,共享编码器,私有特征,共享特征,领域知识,正交投影,门控机制,分类数据,Amazon,MTL,平均分,分类准确率,较之,基线模型
AB值:
0.25693
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。