Page 104 - 《振动工程学报》2026年第5期
P. 104

1308                               振     动     工     程     学     报                     第 39 卷

              列到子序列的距离函数,将时间序列                  T  和子序列    S        PMR  基于分段线性表示(piecewise linear represen-
              作为输入,返回最佳匹配位置上               T  到  S  之间的距离,      tation,PLR),PLR  是指用直线序列逼近时间序列,如
              如图  1  所示。                                        图  2  所示。


                                                                     Y
                                        T
                                                                     y iR
                     最佳匹配位置
                                       S
                        0 10 20 30 40 50 60 70 80     t / s          y
                                                                      iL
                            图 1 T  到  S  之间的距离                                   t i−1         t i     t

                          Fig. 1 The distance from T to S
                                                                                图 2 PLR  时间序列
                  将一个时间序列数据集           D  划分为   A  和  B  两个类                  Fig. 2 PLR of time series

              别,其占比分别为        p(A) 和  p(B),则  D  的熵为:               一个   PLR  序列表示为:
                  I (D) = −p(A)log (p(A))− p(B)log (p(B))  (3)                {            (       )}
                               2              2                           S = (y 1L ,y 1R ,t 1 ),··· , y QL ,y QR ,t Q  (7)
                  将到  shapelets 特征序列的距离作为分裂规则             sp,   式中,   y iL 和y iR (i = 1,2,··· ,Q)分别表示第  i 段直线的起
              把  D  分成两个子集     D 1 和  D 2 ,用每个子集的加权平均           始值和结束值,其中          Q  为段数;  t i 为第  i 段结束时间。
              熵来表示分裂后整个数据集中剩余的信息,则分裂                                把  PLR  序列按照单调趋势分为         3  种模式:上升、不
              后  D  的信息增益为:                                     变、下降,模式值分别表示为           P=1, 0, −1。时间序列    PMR
                 Gain(sp) = I (D)− f (D 1 )I (D 1 )+ f (D 2 )I (D 2 )  (4)  是  (模式值,时间戳) 对的顺序集,为  S = {(p 1 ,t 1 ),··· ,
                                                                                                  ′
              式中,   f (D 1 )和  f (D 2 )分别表示子集  D 1 和  D 2 在原始数   (p N ,t N )},其中,  p i ∈ P t i (i ∈ 1,2,··· ,N)为模式结束时
                                                                                   ,
              据集   D  中的样本比例。分裂点是一个由子序列                  S  和   间,N  为模式的总数。
              距 离 阈 值  d th 组 成 的 一 个 二 元 组 ( S,  d th ) , 按 照  S  和  序列模式距离代表两个相同长度的时间序列之
              D  中 每 条 时 间 序 列 间 的 距 离 是 否 大 于    d th 将  D  分 为  间的相似性。设       S 1 和  S 2 为两个长度相同的     PMR  序
              D 1 和  D 2 ,最优分裂点处的距离阈值        d OSP(D, S ) 对于任何  列, 其 中  s 1i 和  s 2i 分 别 为  S 1 和  S 2 的 第  i 个 模 式 ,  p 1i 和
              其他距离阈值       d 都满足下式:
                            ′
                            th                                  p 2i 分别为  S 1 和  S 2 第  i 个模式对应的模式值,若两个
                             (        )      (   )
                         Gain S,d OSP(D, S ) ⩾ Gain S,d  ′  (5)  序列模式数量相同,且每个模式的模式结束时间都
                                                th
                  最终,shapelets 特征序列定义为:在时间序列数                   相同,则称为等模式数序列,可得到序列模式距离为:
              据集   D  中, shapelet(D)与其对应的最优分裂点,相比                                  1  N ∑
                                                                        D sp (S 1 ,S 2 ) =  t ih |p 1i − p 2i |,
              于其他子序列        S  有最大的信息增益,则         shapelet(D)                      t N
                                                                                     i=1
              是  D  的  shapelets 特征序列:                                  1  N ∑
                                                                             t ih = 1,D sp (S 1 ,S 2 ) ∈ [0,2]  (8)
                        Gain(shapelet(D),d OSP(D,shapelet(D)) )  (6)    t N
                                                                           i=1
                  通 过 计 算 信 息 增 益 和 最 优 分 裂 点 等 标 准 来对          式中,   t N 表示时间序列的长度;        t ih 表示第  i 个模式的
              shapelets 的分类效果进行评价和排序,最后得到表达                     持续时间,模式持续时间越长,其在序列模式距离中
              效果最好的前       K  个  shapelets 特征序列。                的权重就越大。         D sp 趋于零时,序列趋势更为相似;

                                                                D sp 趋于  2  时,序列趋势更为不同。
              1.2    模式距离
                                                                    当两序列并非为等模式序列时,需对序列进行

                  本文应用一种时间序列的模式模型表示(pattern                     等模式数(EPN)过程,即将两序列分割成模式数相
              model representation,PMR),能够有效描述时间序列              同的两个新数列,使其拥有相同的模式结束时间。
              的趋势,可以通过计算模式距离来衡量趋势的相似                                模式距离根据模式数变化具备多分辨率特性,
              性。基于点距离的度量方法要求对所有点之间的距                            能反映时间序列在不同分析频率下的相似性,同时
              离进行计算,而模式距离存在模式持续时间系数,且                           模式距离不需要对测量尺度进行标准化处理,计算
              仅有模式切换点的值因噪声改变才可能改变模式,                            消耗较低。

              影响很小,它是以变化趋势为基础的时间序列匹配
                                                                1.3    图注意力网络
              方法,能够反映时间序列的动态特性,解决了以点距
              离为依据的时间序列静态度量存在的误匹配问题,                                注意力机制可以帮助模型关注输入数据中重要
              能够比欧氏距离更为有效地度量序列变化趋势的相                            的部分,从而更好地理解和处理数据。图注意力网
              似程度   [24-25] 。                                   络(graph attention network, GAT)将注意力机制引入图
   99   100   101   102   103   104   105   106   107   108   109