典型文献
面向不平衡数据集的改进SMOTE算法
文献摘要:
合成少数类过采样技术(SMOTE)提升了分类器在不平衡数据集上的分类性能,但该算法在合成新样本时存在盲目性和边缘化的问题.为此,提出了一种改进算法BSMOTE,该算法对少数类样本进行聚类,在聚类产生的各个簇中任取三个样本构造三角形,在三角形的重心与顶点之间合成新样本,从而使新样本向重心靠拢并远离决策边界.在7个不平衡数据集上,采用6种不同的过采样算法平衡数据集,再利用随机森林进行分类,实验结果表明,基于BSMOTE算法的随机森林分类性能更佳,验证了该算法在解决不平衡数据分类问题中的优势.
文献关键词:
不平衡数据集;SMOTE算法;聚类;过采样;随机森林
中图分类号:
作者姓名:
董永峰;董彦琦;张亚娟
作者机构:
河北工业大学 人工智能与数据科学学院,天津 300401;河北省大数据计算重点实验室,天津 300401
文献出处:
引用格式:
[1]董永峰;董彦琦;张亚娟-.面向不平衡数据集的改进SMOTE算法)[J].河北工业大学学报,2022(06):40-46
A类:
B类:
不平衡数据集,合成少数类过采样技术,分类器,分类性能,盲目性,边缘化,改进算法,BSMOTE,三角形,顶点,靠拢,决策边界,采样算法,随机森林分类,决不,不平衡数据分类,分类问题
AB值:
0.254792
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。