典型文献
基于最小生成树的密度聚类算法研究
文献摘要:
传统DBSCAN算法对密度分布不均匀的不平衡数据集的聚类效果并不理想,同时传统算法的聚类结果对邻域半径(Eps)以及核心点阈值(MinPts)敏感.针对以上问题,改进了传统算法,提出了一种基于最小生成树的密度聚类算法(MST-DBSCAN).由于对象之间的距离对聚类结果影响较大,为了更好地表示对象之间的距离特性,首先使用相互可达距离(mutual reachability distance)代替传统算法中的欧氏距离,表示数据集中对象与对象之间的距离,解决因密度分布不均匀导致效果不佳的问题;为了建立对象与对象之间的联系,同时保留对象之间的距离特性,引用Prim算法对数据集中的所有对象构建最小生成树;其次根据指定的簇的数目及最小簇对象数数目参数对得到的最小生成树进行剪枝;根据剪枝的结果,将剪枝后的各个部分进行聚类.在公开的UCI数据集上的实验结果表明,提出的MST-DBSCAN算法与现有DBSCAN、OPTICS、KANN-DBSCAN算法相比,在密度分布不均匀的数据集上聚类效果有所提升并且较原有传统算法有较高的聚类准确性.
文献关键词:
DBSCAN;相互可达距离;密度聚类;最小生成树;不平衡数据集
中图分类号:
作者姓名:
王诚;高兴东
作者机构:
南京邮电大学 通信与信息工程学院,江苏 南京 210003
文献出处:
引用格式:
[1]王诚;高兴东-.基于最小生成树的密度聚类算法研究)[J].计算机技术与发展,2022(02):45-50
A类:
相互可达距离
B类:
最小生成树,密度聚类算法,算法研究,DBSCAN,密度分布,分布不均匀,不平衡数据集,传统算法,邻域半径,Eps,核心点,MinPts,MST,结果影响,mutual,reachability,distance,欧氏距离,Prim,象数,数数,剪枝,UCI,OPTICS,KANN
AB值:
0.294368
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。