典型文献
面向不平衡数据集分类的LDBSMOTE过采样方法
文献摘要:
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE).首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类.为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能.
文献关键词:
不平衡数据集;局部密度;SMOTE;集成学习
中图分类号:
作者姓名:
王泳欣;张大斌;车大庆;吕建秋
作者机构:
华南农业大学 数学与信息学院;广东省科技管理与规划研究院,广州 510642
文献出处:
引用格式:
[1]王泳欣;张大斌;车大庆;吕建秋-.面向不平衡数据集分类的LDBSMOTE过采样方法)[J].统计与决策,2022(18):58-63
A类:
LDBSMOTE
B类:
不平衡数据集,过采样,采样方法,法会,识别率,局部密度,样本分布,根样,潜在价值,合成样本,集成学习算法,公共数据,mean,少数类,分类性能
AB值:
0.247957
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。