典型文献
PRBDN:基于预训练的微博评论情感分类模型
文献摘要:
文本情感分类是自然语言处理中的经典任务,在判断文本的情感极性、舆情监控、市场呼声、商品评论等领域有重要的应用价值.该文提出了一种基于预训练模型进行细粒度文本情感分类的新方法.基于文章级别的情感分类任务,需要模型同时具有较高的语义概括能力和抗噪能力.为此,该文利用BiLSTM网络对预训练模型中每层Transformer的权重进行调整,通过将各层表达的不同粒度的语义表征进行动态融合的方式,提高模型的语义空间表达能力.为了增强模型的泛化性能,该文在下游任务结合BiLSTM和BiGRU等结构对得到的语义向量进行特征过滤.利用该模型,作者在CCF 2020年举办的科技战疫·大数据公益挑战赛—疫情期间网民情绪识别赛道中位列第三,最终测试集的F1值为0.74537,该模型的参数量比第一名模型少67%,但二者分数差距仅为0.0001,说明该方法具备可行性与有效性.
文献关键词:
文本情感分类;预训练模型;动态权重;长短时记忆网络
中图分类号:
作者姓名:
雷鹏斌;秦斌;王志立;吴宇凡;梁思怡;陈宇
作者机构:
深圳大学 信息中心,广东 深圳 518061;深圳大学 电子与信息工程学院,广东 深圳 518061
文献出处:
引用格式:
[1]雷鹏斌;秦斌;王志立;吴宇凡;梁思怡;陈宇-.PRBDN:基于预训练的微博评论情感分类模型)[J].中文信息学报,2022(08):101-108
A类:
PRBDN
B类:
微博评论,分类模型,文本情感分类,自然语言处理,情感极性,舆情监控,呼声,商品评论,预训练模型,细粒度文本,分类任务,概括能力,BiLSTM,每层,Transformer,不同粒度,语义表征,动态融合,语义空间,空间表达,表达能力,增强模型,泛化性能,BiGRU,特征过滤,CCF,科技战,挑战赛,网民情绪,情绪识别,赛道,位列,测试集,参数量,第一名,名模,动态权重,长短时记忆网络
AB值:
0.42485
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。