基于词向量集成与数据增强的恶意评论分类模型|杨金灵 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于词向量集成与数据增强的恶意评论分类模型

文献摘要：

针对恶意评论的文本分类任务存在的词向量单一和样本数据集有限而导致模型稳健性降低的问题,提出一种结合词向量集成技术和数据增强技术的ENSVEC-DA恶意文本分类模型.首先从文本数据中抽取一部分评论将其依次翻译成西班牙语,德语和法语,再翻译回英文,由此达到数据增强的作用;其次对应文本评论中的单词,在两个在不同语料库上预训练好的词向量包中寻找所对应单词的数值向量,并将两者相加取平均值,进而完成集成词向量的工作;然后基于同一测试集在RNN网络中进行四组对比实验,并根据四组实验所得到的恶意评论分值(分值越大,恶意可能性越高)计算三种评估指标;最后经对比分析评估指标可得出结论:词向量集成技术和数据增强技术能够使ENSVEC-DA恶意文本分类模型在某种恶意评论预测性能上有所提升.

文献关键词：

恶意评论;文本分类;词向量集成;数据增强;RNN

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 自动推理、机器学习（TP181）

作者姓名：

杨金灵

作者机构：

大连外国语大学,辽宁大连 116044

文献出处：

科学技术创新

引用格式：

[1]杨金灵-.基于词向量集成与数据增强的恶意评论分类模型)[J].科学技术创新,2022(22):76-81

A类：

词向量集成,ENSVEC

B类：

恶意评论,分类模型,文本分类,分类任务,样本数据集,集成技术,数据增强技术,DA,意文,文本数据,翻译成,西班牙语,德语,法语,文本评论,单词,语料库,预训练,练好,相加,取平,成词,测试集,RNN,四组,实验所,分析评估,预测性能

AB值：

0.25001

相似文献

基于谱聚类胶囊网络的文本分类方法

张凌慷;仝明磊-上海电力大学电子与信息工程学院,上海 201306

基于SqueezeNet的卷烟小盒外观检测算法在低成本硬件上的实现

刘巍-红云红河烟草(集团)有限责任公司昆明卷烟厂,云南昆明 650202

融合GRU与注意力机制的胶囊文本分类方法

张凌慷-上海电力大学电子与信息工程学院,上海 201306

基于混合编码的社交媒体英语文本情绪检测

黎家宁-大连民族大学外国语学院,辽宁大连 116600

基于层次分析法的软课题采购供应商选择评价指标体系研究

许琴;于歌-中国能源建设集团广东省电力设计研究院有限公司,广州 510663

基于FA-SVR的气膜混凝土成本预测研究

项崇涛-中交第三公路工程局有限公司,武汉 430035

基于文本大数据分析的年报舞弊识别研究

陈璐-对外经济贸易大学统计学院,北京100020

老城更新中的网红空间特质与生成机制研究

梁曼丹;鲍英华;朱云萍;郭子奕-北京交通大学建筑与艺术学院,北京 100000

基于卷积神经网络的生物医学实体标准化研究

赵兰枝;史欣沅-河套学院数学与计算机系,内蒙古巴彦淖尔 015000;中国科学院大学,北京 101408

基于哨兵二号数据的同震滑坡解译研究

杜玲玲-成都理工大学地球科学学院,四川成都 610059

卷烟终端陈列识别方法研究

张侃弘;周欣然;栾晓宇;李敏刚-上海烟草集团有限责任公司信息中心,上海 200082;上海烟草集团有限责任公司营销中心,上海 200082

被动声纳目标稀疏表示分类识别方法

康春玉;李岩洲;夏志军;寇祝-海军大连舰艇学院,辽宁大连 116018

基于贝叶斯压缩感知与SVM算法的智能化勘察研究

张锐-华设设计集团股份有限公司,江苏南京 210014

基于数据集模型训练的网购评论情感倾向性技术分析

封二英;程冬玲;张宇敬-河北金融学院,河北保定 071000

基于SWOT分析的非结构化数据文本分类算法

易晓宇;易绵竹-信息工程大学洛阳校区,河南洛阳 471000

基于支持向量机的中文文本情感分析方法研究

刘祉燊;张倩;周菠;汪志霖;顾永昊-山东石油化工学院,山东东营 257000

OCR智能识别技术在工器具管理中的研究与应用

余汉伟;张志峰;李立光-安徽送变电工程有限公司,合肥 230601

基于机器学习的帕金森运动症状量化评估

林志榕-中国科学院福建物质结构研究所泉州装备制造研究所,福建泉州 362216

基于Word2vec的铁路工程地质语料库构建与词嵌入

戴均豪-中铁第一勘察设计院集团有限公司,西安 710043

基于BERT模型的领域知识图谱构建研究

郭伟鹏;沈松雨-广州城市信息研究所有限公司,广州 510665;公安部第三研究所,上海 200031

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。