典型文献
密度偏差抽样在近邻传播聚类中的应用
文献摘要:
AP聚类算法无需人为设定类别和指定类中心,能高效解决数据聚类问题,但无法满足大规模数据的应用需求,因此对数据进行聚类前先约简数据尤为重要.分布均匀的数据利用简单随机抽样可获得质量较高的样本,当数据偏斜较大时,简单随机抽样所获得的样本往往会丢失原始数据集的类.针对此问题,首先借助基于网格的密度偏差抽样算法对数据进行约简,其次在样本数据集上执行AP聚类,最后通过数值实验结果表明,对样本数据执行聚类在损失小部分精度代价上,提高聚类算法的效率.
文献关键词:
约简;网格;密度偏差抽样;精度
中图分类号:
作者姓名:
潘春燕;张仁崇;杨忠保
作者机构:
黔南民族师范学院数学与统计学院,贵州都匀558000;贵州商学院计算机与信息工程学院,贵州贵阳550014
文献出处:
引用格式:
[1]潘春燕;张仁崇;杨忠保-.密度偏差抽样在近邻传播聚类中的应用)[J].商丘师范学院学报,2022(12):4-8
A类:
密度偏差抽样
B类:
近邻传播聚类,AP,聚类算法,类中心,数据聚类,聚类问题,大规模数据,应用需求,约简,数据利用,随机抽样,数据偏斜,原始数据,先借,行约,样本数据集,数值实验,小部
AB值:
0.348872
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。