典型文献
基于BERT和混合神经网络的诈骗电话文本识别
文献摘要:
如今,电话诈骗案件层出不穷,严重危害到了人们的财产安全和社会的和谐安定.针对社会中的一些诈骗电话问题,提出了一种基于词嵌入和混合神经网络的文本分类方法,实现对诈骗电话文本的分类.首先构造了诈骗电话文本数据集,内容涵盖了金融、教育、邮递、银行等多类诈骗事件.为了优化文本的输入词向量,词嵌入部分采用基于Transformer的BERT(Bidirectional Encoder Representation from Transformers)模型来表示诈骗文本,同时采用基于双向长短时记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)以及多尺度卷积神经网络(Convolutional Neural Network,CNN)的混合神经网络(BiLCNN)对文本的词嵌入表示进行特征提取,充分提取出文本的时序特征和局部相关特征,最后将特征融合在一起通过Softmax进行分类.通过实验比较了Word2vec、ELMo(Embedding from Language Model)和BERT三种词嵌入模型,表明BERT作为输入向量的优越性,同时在诈骗电话文本数据集上的实验结果表明,提出的模型 BERT+BiLCNN 相比Word2vec+CNN、ELMo+CNN和BERT+CNN模型,诈骗电话文本分类准确率分别提高了4.12%、2.84%和0.95%.
文献关键词:
电话诈骗;词嵌入;BERT;卷积神经网络;双向长短时记忆网络
中图分类号:
作者姓名:
许鸿奎;周俊杰;姜彤彤;卢江坤;张子枫;胡文烨
作者机构:
山东建筑大学 信息与电气工程学院,山东 济南 250101;山东省智能建筑技术重点实验室,山东 济南 250101
文献出处:
引用格式:
[1]许鸿奎;周俊杰;姜彤彤;卢江坤;张子枫;胡文烨-.基于BERT和混合神经网络的诈骗电话文本识别)[J].计算机技术与发展,2022(11):37-42
A类:
电话诈骗,BiLCNN,BERT+BiLCNN,Word2vec+CNN,ELMo+CNN,BERT+CNN
B类:
混合神经网络,文本识别,诈骗案件,严重危害,财产安全,安定,文本分类方法,文本数据,邮递,词向量,Bidirectional,Encoder,Representation,from,Transformers,双向长短时记忆网络,Long,Short,Term,Memory,BiLSTM,多尺度卷积神经网络,Convolutional,Neural,Network,词嵌入表示,分提,时序特征,局部相关,特征融合,合在一起,Softmax,Embedding,Language,Model,词嵌入模型,分类准确率
AB值:
0.284869
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。