首站-论文投稿智能助手
典型文献
面向时序的相似重复数据清洗算法优化
文献摘要:
针对海量时序数据集提出了一种相似重复数据检测算法.该算法以传统近邻排序算法SNM为基础,增加了对窗口大小的动态调整策略,新增了窗口跳跃滑动策略.新策略大大减少了相似重复数据清洗过程中的比对次数.该算法的提出,对时序数据集中的相似重复记录清洗效果带来了极大的提升,尤其是对于相似重复记录较稀疏的数据集,在理论和实验结果中均表明该算法在提高相似重复数据的检测性能上有显著效果.
文献关键词:
时序数据;SNM改进算法;相似重复数据;动态滑动窗口;数据清洗
作者姓名:
沈沛;毛海涛;胡文林;芮波
作者机构:
中国人民解放军92728部队,上海 200436;杭州幂链科技有限公司
文献出处:
引用格式:
[1]沈沛;毛海涛;胡文林;芮波-.面向时序的相似重复数据清洗算法优化)[J].计算机时代,2022(09):68-72,77
A类:
相似重复数据,重复记录清洗
B类:
数据清洗算法,算法优化,时序数据,数据检测,检测算法,近邻,排序算法,SNM,调整策略,跳跃,大大减少,洗过,清洗效果,检测性能,显著效果,改进算法,动态滑动窗口
AB值:
0.218626
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。