首站-论文投稿智能助手
典型文献
K近邻和加权相似性的密度峰值聚类算法
文献摘要:
密度峰值聚类算法的局部密度定义未考虑密度分布不均数据类簇间的样本密度差异影响,易导致误选类簇中心;其分配策略依据欧氏距离通过密度峰值进行链式分配,而流形数据通常有较多样本距离其密度峰值较远,导致大量本应属于同一个类簇的样本被错误分配给其他类簇,致使聚类精度不高.鉴于此,本文提出了一种K近邻和加权相似性的密度峰值聚类算法.该算法基于样本的K近邻信息重新定义了样本局部密度,此定义方式可以调节样本局部密度的大小,能够准确找到密度峰值;采用样本的共享最近邻及自然最近邻信息定义样本间的相似性,摒弃了欧氏距离对分配策略的影响,避免了样本分配策略产生的错误连带效应.流形及密度分布不均数据集上的对比实验表明,本文算法能准确找到疏密程度相差较大数据集的密度峰值,避免了流形数据的分配错误连带效应,得到了满意的聚类效果;同时在真实数据集上的聚类效果也十分优秀.
文献关键词:
密度峰值聚类;局部密度;K近邻;共享最近邻;自然最近邻
作者姓名:
赵嘉;陈磊;吴润秀;张波;韩龙哲
作者机构:
南昌工程学院信息工程学院,江西南昌330099;全球能源互联网研究院有限公司,江苏南京210003
文献出处:
引用格式:
[1]赵嘉;陈磊;吴润秀;张波;韩龙哲-.K近邻和加权相似性的密度峰值聚类算法)[J].控制理论与应用,2022(12):2349-2357
A类:
自然最近邻
B类:
权相,密度峰值聚类算法,局部密度,密度分布,均数,密度差,差异影响,类簇中心,分配策略,欧氏距离,过密,链式分配,流形,形数,数据通,较远,应属,同一个,配给,聚类精度,重新定义,本局,定义方式,共享最近邻,摒弃,连带,疏密,真实数据
AB值:
0.256814
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。