首站-论文投稿智能助手
典型文献
基于从共现矩阵提取关联的类别型数据聚类
文献摘要:
类别型数据聚类被广泛应用于现实世界的不同领域中,如医学科学、计算机科学等.通常的类别型数据聚类,是在基于相异度量上进行研究,针对不同特点的数据集,聚类结果会受到数据集自身特点和噪音信息的影响.此外,基于表示学习的类别型数据聚类,实现复杂,聚类结果受到表示结果的影响较大.本文以共现矩阵为基础,提出一种可以直接考虑类别型数据原始信息关联关系的聚类方法——基于从共现矩阵提取关联的类别型数据聚类方法(CDCBCM).共现矩阵可被看作是一种对原始数据空间中信息关联情况的汇总.本文通过计算不同对象在各个属性子空间下的共现频率值来构建共现矩阵,并从共现矩阵中去除一些噪音信息,再使用归一化切割来得到聚类结果.本文方法在16个不同领域的公开数据集中进行测试,与8种现有方法进行比较,并采用F1-score指标进行检测.实验结果表明,本文方法在7个数据集上效果最好,平均排名最高,能更好地完成对类别型数据的聚类任务.
文献关键词:
类别型数据;类别型数据聚类;机器学习;共现矩阵;归一化切割
作者姓名:
关云鹏;刘玉龙
作者机构:
华北计算技术研究所系统八部,北京 100083
文献出处:
引用格式:
[1]关云鹏;刘玉龙-.基于从共现矩阵提取关联的类别型数据聚类)[J].计算机与现代化,2022(11):1-8
A类:
类别型数据,类别型数据聚类,CDCBCM,归一化切割
B类:
共现矩阵,现实世界,医学科,学科学,计算机科学,相异度,自身特点,噪音,音信,表示学习,信息关联,关联关系,聚类方法,原始数据,数据空间,中信,同对,属性子空间,割来,来得,公开数据集,score
AB值:
0.191769
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。