Page 104 - 《振动工程学报》2026年第5期
P. 104
1308 振 动 工 程 学 报 第 39 卷
列到子序列的距离函数,将时间序列 T 和子序列 S PMR 基于分段线性表示(piecewise linear represen-
作为输入,返回最佳匹配位置上 T 到 S 之间的距离, tation,PLR),PLR 是指用直线序列逼近时间序列,如
如图 1 所示。 图 2 所示。
Y
T
y iR
最佳匹配位置
S
0 10 20 30 40 50 60 70 80 t / s y
iL
图 1 T 到 S 之间的距离 t i−1 t i t
Fig. 1 The distance from T to S
图 2 PLR 时间序列
将一个时间序列数据集 D 划分为 A 和 B 两个类 Fig. 2 PLR of time series
别,其占比分别为 p(A) 和 p(B),则 D 的熵为: 一个 PLR 序列表示为:
I (D) = −p(A)log (p(A))− p(B)log (p(B)) (3) { ( )}
2 2 S = (y 1L ,y 1R ,t 1 ),··· , y QL ,y QR ,t Q (7)
将到 shapelets 特征序列的距离作为分裂规则 sp, 式中, y iL 和y iR (i = 1,2,··· ,Q)分别表示第 i 段直线的起
把 D 分成两个子集 D 1 和 D 2 ,用每个子集的加权平均 始值和结束值,其中 Q 为段数; t i 为第 i 段结束时间。
熵来表示分裂后整个数据集中剩余的信息,则分裂 把 PLR 序列按照单调趋势分为 3 种模式:上升、不
后 D 的信息增益为: 变、下降,模式值分别表示为 P=1, 0, −1。时间序列 PMR
Gain(sp) = I (D)− f (D 1 )I (D 1 )+ f (D 2 )I (D 2 ) (4) 是 (模式值,时间戳) 对的顺序集,为 S = {(p 1 ,t 1 ),··· ,
′
式中, f (D 1 )和 f (D 2 )分别表示子集 D 1 和 D 2 在原始数 (p N ,t N )},其中, p i ∈ P t i (i ∈ 1,2,··· ,N)为模式结束时
,
据集 D 中的样本比例。分裂点是一个由子序列 S 和 间,N 为模式的总数。
距 离 阈 值 d th 组 成 的 一 个 二 元 组 ( S, d th ) , 按 照 S 和 序列模式距离代表两个相同长度的时间序列之
D 中 每 条 时 间 序 列 间 的 距 离 是 否 大 于 d th 将 D 分 为 间的相似性。设 S 1 和 S 2 为两个长度相同的 PMR 序
D 1 和 D 2 ,最优分裂点处的距离阈值 d OSP(D, S ) 对于任何 列, 其 中 s 1i 和 s 2i 分 别 为 S 1 和 S 2 的 第 i 个 模 式 , p 1i 和
其他距离阈值 d 都满足下式:
′
th p 2i 分别为 S 1 和 S 2 第 i 个模式对应的模式值,若两个
( ) ( )
Gain S,d OSP(D, S ) ⩾ Gain S,d ′ (5) 序列模式数量相同,且每个模式的模式结束时间都
th
最终,shapelets 特征序列定义为:在时间序列数 相同,则称为等模式数序列,可得到序列模式距离为:
据集 D 中, shapelet(D)与其对应的最优分裂点,相比 1 N ∑
D sp (S 1 ,S 2 ) = t ih |p 1i − p 2i |,
于其他子序列 S 有最大的信息增益,则 shapelet(D) t N
i=1
是 D 的 shapelets 特征序列: 1 N ∑
t ih = 1,D sp (S 1 ,S 2 ) ∈ [0,2] (8)
Gain(shapelet(D),d OSP(D,shapelet(D)) ) (6) t N
i=1
通 过 计 算 信 息 增 益 和 最 优 分 裂 点 等 标 准 来对 式中, t N 表示时间序列的长度; t ih 表示第 i 个模式的
shapelets 的分类效果进行评价和排序,最后得到表达 持续时间,模式持续时间越长,其在序列模式距离中
效果最好的前 K 个 shapelets 特征序列。 的权重就越大。 D sp 趋于零时,序列趋势更为相似;
D sp 趋于 2 时,序列趋势更为不同。
1.2 模式距离
当两序列并非为等模式序列时,需对序列进行
本文应用一种时间序列的模式模型表示(pattern 等模式数(EPN)过程,即将两序列分割成模式数相
model representation,PMR),能够有效描述时间序列 同的两个新数列,使其拥有相同的模式结束时间。
的趋势,可以通过计算模式距离来衡量趋势的相似 模式距离根据模式数变化具备多分辨率特性,
性。基于点距离的度量方法要求对所有点之间的距 能反映时间序列在不同分析频率下的相似性,同时
离进行计算,而模式距离存在模式持续时间系数,且 模式距离不需要对测量尺度进行标准化处理,计算
仅有模式切换点的值因噪声改变才可能改变模式, 消耗较低。
影响很小,它是以变化趋势为基础的时间序列匹配
1.3 图注意力网络
方法,能够反映时间序列的动态特性,解决了以点距
离为依据的时间序列静态度量存在的误匹配问题, 注意力机制可以帮助模型关注输入数据中重要
能够比欧氏距离更为有效地度量序列变化趋势的相 的部分,从而更好地理解和处理数据。图注意力网
似程度 [24-25] 。 络(graph attention network, GAT)将注意力机制引入图

