典型文献
嵌入典型时间序列特征的随机Shapelet森林算法
文献摘要:
近年来,时间序列分类问题的研究受到了广泛关注.先进的时间序列分类方法通常建立在良好的特征表示的基础之上.Shapelet是时间序列中具备鉴别性的子序列,可有效表达时间序列的局部形状特征.然而,高昂的计算成本大大限制了基于Shapelet的时间序列分类方法的实用性.除此之外,传统的Shapelet仅能描述欧氏距离度量下子序列的形状特征,因此极易受到噪声干扰并难以挖掘子序列中蕴含的其他类型的鉴别性信息.为应对上述问题,提出了一种新的时间序列分类算法——嵌入典型时间序列特征的随机Shapelet森林.该算法基于以下3个关键策略:1)随机选取Shapelet并限制Shapelet的作用范围以提高效率;2)在Shapelet中嵌入多个典型时间序列特征以提高算法对不同分类问题的适应性,并弥补随机选取Shapelet带来的精度损失;3)在新的特征表示的基础上构建随机森林分类器以确保算法的泛化能力.112个UCR时间序列数据集上的实验结果表明,本文算法的准确性超越了基于Shapelet精确搜索和Shapelet转换技术的STC算法,以及多个其他类型的先进时间序列分类算法.此外,广泛的实验对比验证了本文算法在效率上的显著优势.
文献关键词:
时间序列;分类;Shapelet;典型时间序列特征;随机森林
中图分类号:
作者姓名:
高振卓;王志海;刘海洋
作者机构:
北京交通大学计算机与信息技术学院 北京100044;交通数据分析与挖掘北京市重点实验室 北京100044
文献出处:
引用格式:
[1]高振卓;王志海;刘海洋-.嵌入典型时间序列特征的随机Shapelet森林算法)[J].计算机科学,2022(07):40-49
A类:
典型时间序列特征
B类:
Shapelet,时间序列分类,分类问题,分类方法,特征表示,子序列,有效表达,形状特征,高昂,计算成本,除此之外,欧氏距离,距离度量,下子,噪声干扰,分类算法,关键策略,提高效率,精度损失,随机森林分类器,泛化能力,UCR,时间序列数据,转换技术,STC,实验对比,对比验证,显著优势
AB值:
0.223567
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。