首站-论文投稿智能助手
典型文献
结合BERT和特征投影网络的新闻主题文本分类方法
文献摘要:
针对新闻主题文本用词缺乏规范、语义模糊、特征稀疏等问题,提出了结合BERT和特征投影网络(FPnet)的新闻主题文本分类方法.该方法包含两种实现方式:方式1将新闻主题文本在BERT模型的输出进行多层全连接层特征提取,并将最终提取到的文本特征结合特征投影方法进行提纯,从而强化分类效果;方式2在BERT模型内部的隐藏层中融合特征投影网络进行特征投影,从而通过隐藏层特征投影强化提纯分类特征.在今日头条、搜狐新闻、THUCNews-L、THUCNews-S数据集上进行实验,实验结果表明上述两种方式相较于基线BERT方法在准确率、宏平均F1值上均具有更好的表现,准确率最高分别为86.96%、86.17%、94.40%和93.73%,验证了所提方法的可行性和有效性.
文献关键词:
预训练语言模型;文本分类;新闻主题;BERT;特征投影网络
作者姓名:
张海丰;曾诚;潘列;郝儒松;温超东;何鹏
作者机构:
湖北大学计算机与信息工程学院,武汉430062;湖北省软件工程工程技术研究中心,武汉430062;智慧政务与人工智能应用湖北省工程研究中心,武汉430062
文献出处:
引用格式:
[1]张海丰;曾诚;潘列;郝儒松;温超东;何鹏-.结合BERT和特征投影网络的新闻主题文本分类方法)[J].计算机应用,2022(04):1116-1124
A类:
特征投影网络,FPnet
B类:
BERT,新闻主题,主题文本,文本分类方法,用词,特征稀疏,实现方式,出进,全连接层,取到,文本特征,特征结合,投影方法,提纯,分类效果,融合特征,分类特征,今日头条,搜狐,THUCNews,两种方式,最高分,预训练语言模型
AB值:
0.257854
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。