结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究|张亚迪;孙悦;刘锋;朱二周 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究

文献摘要：

聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用.通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来.作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点.然而,受收敛规则的影响,K-means算法仍然存在着对初始类簇中心的选取非常敏感、不能很好地处理非凸型分布和有离群值的数据集等问题.文中提出了一种基于密度参数和中心替换的改进K-means算法DC-Kmeans.该算法采用数据对象的密度参数来逐步确定初始类簇中心,使用中心替换方法更新偏离实际位置的初始中心,因而比传统聚的类算法更加精确.为了获得最佳聚类效果,文中同时提出了一个能够对聚类结果进行有效评价的新聚类有效性指标SCVI和一个能够快速获得目标数据集最佳类簇数的新算法OCNS.实验结果表明,所提聚类方法对各种类型的数据集都是有效的.

文献关键词：

聚类算法;聚类有效性指标;最佳类簇数;类簇中心;数据挖掘

中图分类号：

[1] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 自动推理、机器学习（TP181）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 一般性问题（TP30） / 理论、方法（TP301） / 算法理论（TP301.6）

作者姓名：

张亚迪;孙悦;刘锋;朱二周

作者机构：

安徽大学计算机科学与技术学院合肥230601

文献出处：

计算机科学

引用格式：

[1]张亚迪;孙悦;刘锋;朱二周-.结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究)[J].计算机科学,2022(01):121-132

A类：

SCVI,最佳类簇数,OCNS

B类：

密度参数,聚类有效性指标,数据挖掘技术,模式识别,层次结构,发掘出来,划分聚类算法,类簇中心,非凸,离群值,基于密度,DC,Kmeans,数据对象,获得最佳,有效评价,新算法,聚类方法,各种类型

AB值：

0.280004

相似文献

基于低秩约束的熵加权多视角模糊聚类算法

张嘉旭;王骏;张春香;林得富;周塔;王士同-江南大学数字媒体学院无锡214122;上海大学通信与信息工程学院上海200444;江苏科技大学电子信息学院镇江212100

灵活自适应的无监督降维

强倩瑶;张斌-西安交通大学软件学院西安 710049

一种针对聚类问题的量子主成分分析算法

刘文杰;王博思;陈君琇-数字取证教育部工程研究中心(南京信息工程大学),南京 210044;南京信息工程大学计算机与软件学院,南京 210044

基于候选中心融合的多观测点I-nice聚类算法

陈鸿杰;何玉林;黄哲学;尹剑飞-深圳大学计算机与软件学院大数据技术与应用研究所深圳518060;深圳大学大数据系统计算技术国家工程实验室深圳518060

结合人工蜂群优化的粗糙K-means聚类算法

叶廷宇;叶军;王晖;王磊-南昌工程学院信息工程学院,南昌 330000;江西省水信息协同感知与智能处理重点实验室(南昌工程学院),南昌 330000

障碍空间中Voronoi图优化的反向近邻数聚类算法

何云斌;刘婉旭;万静-哈尔滨理工大学计算机科学与技术学院,哈尔滨 150080

基于自适应近邻参数的密度峰聚类算法

周欢欢;郑伯川;张征;张琦-西华师范大学数学与信息学院,四川南充637009;西华师范大学计算机学院,四川南充637009

基于边界点检测的变密度聚类算法

陈延伟;赵兴旺-山西大学计算机与信息技术学院,太原030006;计算智能与中文信息处理教育部重点实验室(山西大学),太原030006

基于占空比的聚类算法评价指标研究

张欣环;刘宏杰;吴金洪;施俊庆;毛程远;孟国连-浙江师范大学道路与交通工程研究中心,浙江金华 321004;西安交通大学电子信息工程学院,西安 710049

改进损失函数的地基云状目标检测算法

王胜春;陈阳-湖南师范大学信息科学与工程学院,长沙 410081

应用BWP指标的差分隐私保护k-means算法

张亚玲;屈玲玉-西安理工大学计算机科学与工程学院,西安 710048

结合地标点与自编码的快速多视图聚类网络

马睿;周治平-江南大学物联网技术应用教育部工程研究中心,江苏无锡 214122

基于混合身份搜索黏菌优化的模糊C-均值聚类算法

贾鹤鸣;张棕淇;姜子超;冯榆淇-三明学院信息工程学院,福建三明365004;东北林业大学机电工程学院,黑龙江哈尔滨150040

基于GRU自编码器的船舶航线提取

任成杰;陈怀新;谢卫-电子科技大学资源与环境学院,四川成都611731;中国电子科技集团公司第十研究所,四川成都610036

基于数据生成算法的睡眠分期方法

刘静博;王蓓;顾吉峰-华东理工大学信息科学与工程学院化工过程先进控制和优化技术教育部重点实验室,上海 200237

基于质心自适应选取的密度万有引力聚类算法

陈金鹏;李睿熙;杨然;安俊秀-成都信息工程大学并行计算实验室,四川成都 610225;成都锦城学院计算机与软件学院,四川成都 611731

面向异质基因数据的智能层次聚类算法研究

季姜帅;裴颂文-上海理工大学光电信息与计算机工程学院,上海200093;复旦大学上海市数据科学重点实验室,上海200433

基于近邻传播聚类的职业能力评价模型

段桂芹;邹臣嵩-广东松山职业技术学院计算机与信息工程学院,广东韶关 512126;广东松山职业技术学院电气工程学院,广东韶关 512126

基于混沌剑鱼算法的K_means算法

唐辉;刘晓波;韩祥民;邱知;徐邦贤-贵州大学电气工程学院,贵阳520025

基于改进SMOTE的制造过程不平衡数据分类策略

黎旭;陈家兑;吴永明;宗文泽-贵州大学现代制造技术教育部重点实验室,贵阳 550025;贵州大学机械工程学院,贵阳 550025;贵州大学公共大数据国家重点实验室,贵阳 550025

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。