典型文献
采用N-list结构的混合并行频繁项集挖掘算法
文献摘要:
针对大数据环境下并行MRPrePost频繁项集挖掘算法中存在计算节点负载不均衡,N-list合并效率低以及冗余搜索等问题,提出了基于N-list结构的混合并行频繁项集挖掘算法HP-FIMBN.首先,设计负载量估计函数(LE)来计算出频繁1项集F-list中每一项的负载量,同时提出基于贪心策略的分组方法(GM-GS)将F-list中的每一项根据其负载量进行均匀分组,既解决了数据划分中计算节点负载不均衡的问题,又降低了集群中各节点上子PPC-Tree树的规模;其次,提出预先放弃策略(EAS),该策略不仅能有效避免合并过程中的无效计算,而且不需要遍历初始N-list结构就能得到最终的N-list,极大地提高了N-list结构的合并效率;最后,采用集合枚举树作为搜索空间,并提出超集等价剪枝策略(SES)来避免挖掘过程中的冗余搜索,生成最终的挖掘结果.实验结果表明,该算法在大数据环境下进行频繁项集挖掘具有较好的效果.
文献关键词:
频繁项集挖掘;N-list结构;贪心策略;集合枚举树;超集等价剪枝策略(SES)
中图分类号:
作者姓名:
刘卫明;张弛;毛伊敏
作者机构:
江西理工大学 信息工程学院,江西 赣州 341000
文献出处:
引用格式:
[1]刘卫明;张弛;毛伊敏-.采用N-list结构的混合并行频繁项集挖掘算法)[J].计算机科学与探索,2022(01):120-136
A类:
MRPrePost,FIMBN,集合枚举树
B类:
list,行频,频繁项集挖掘,挖掘算法,大数据环境下,计算节点,合并效率,HP,负载量,估计函数,LE,每一项,贪心策略,组方,GM,GS,数据划分,中计,PPC,Tree,EAS,并过,遍历,极大地提高,搜索空间,出超,等价,剪枝,SES
AB值:
0.288527
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。