典型文献
基于改进K-means++和DBSCAN的大数据聚类方法
文献摘要:
为改善大规模数据集的处理性能,提出了基于改进K-means++和基于密度的含噪声应用空间聚类(DBSCAN)算法的大数据聚类方法.首先,将K-means++与局部搜索策略相结合,在数据集上进行初始化分区,然后利用DBSCAN算法在每个分组内单独执行数据聚类.利用改进K-means++算法提高数据预处理质量,并通过分区并行聚类的操作显著降低DB-SCAN的计算负担,加快处理速度.最后,通过两阶段的剪枝策略对边缘聚类进行高效合并.实验结果表明,所提方法大幅降低了 DBSCAN的执行时间,且聚类数据的质量与原DBSCAN算法非常接近,在UCI库的Bitcoin数据集上比其他比较方法的聚类效率提高了 10倍以上,在处理时间和聚类数据质量之间实现了最优平衡.
文献关键词:
大数据;数据聚类;DBSCAN;K-means++;局部搜索
中图分类号:
作者姓名:
张玉琴;梁莉;张建亮;冯向东
作者机构:
成都理工大学工程技术学院 乐山614000;成都理工大学数理学院 成都610059
文献出处:
引用格式:
[1]张玉琴;梁莉;张建亮;冯向东-.基于改进K-means++和DBSCAN的大数据聚类方法)[J].国外电子测量技术,2022(09):40-46
A类:
B类:
means++,DBSCAN,大数据聚类,聚类方法,大规模数据集,处理性能,基于密度,噪声应用,应用空间,空间聚类,局部搜索策略,初始化,执行数,数据预处理,并行聚类,计算负担,处理速度,两阶段,剪枝,执行时间,聚类数,UCI,Bitcoin,比较方法,效率提高,处理时间,数据质量
AB值:
0.420847
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。