Page 104 - 《振动工程学报》2026年第5期

P. 104

1308 振动工程学报第 39 卷

列到子序列的距离函数，将时间序列 T 和子序列 S PMR 基于分段线性表示（piecewise linear represen-
作为输入，返回最佳匹配位置上 T 到 S 之间的距离， tation，PLR），PLR 是指用直线序列逼近时间序列，如
如图 1 所示。图 2 所示。

Y
T
y iR
最佳匹配位置
S
0 10 20 30 40 50 60 70 80 t / s y
iL
图 1 T 到 S 之间的距离 t i−1 t i t

Fig. 1 The distance from T to S
图 2 PLR 时间序列
将一个时间序列数据集 D 划分为 A 和 B 两个类 Fig. 2 PLR of time series

别，其占比分别为 p(A) 和 p(B)，则 D 的熵为：一个 PLR 序列表示为：
I (D) = −p(A)log (p(A))− p(B)log (p(B)) （3） { ( )}
2 2 S = (y 1L ,y 1R ,t 1 ),··· , y QL ,y QR ,t Q （7）
将到 shapelets 特征序列的距离作为分裂规则 sp，式中， y iL 和y iR (i = 1,2,··· ,Q)分别表示第 i 段直线的起
把 D 分成两个子集 D 1 和 D 2 ，用每个子集的加权平均始值和结束值，其中 Q 为段数； t i 为第 i 段结束时间。
熵来表示分裂后整个数据集中剩余的信息，则分裂把 PLR 序列按照单调趋势分为 3 种模式：上升、不
后 D 的信息增益为：变、下降，模式值分别表示为 P=1, 0, −1。时间序列 PMR
Gain(sp) = I (D)− f (D 1 )I (D 1 )+ f (D 2 )I (D 2 ) （4）是 (模式值，时间戳) 对的顺序集，为 S = {(p 1 ,t 1 ),··· ,
′
式中， f (D 1 )和 f (D 2 )分别表示子集 D 1 和 D 2 在原始数 (p N ,t N )}，其中， p i ∈ P t i (i ∈ 1,2,··· ,N)为模式结束时
，
据集 D 中的样本比例。分裂点是一个由子序列 S 和间，N 为模式的总数。
距离阈值 d th 组成的一个二元组（ S， d th ），按照 S 和序列模式距离代表两个相同长度的时间序列之
D 中每条时间序列间的距离是否大于 d th 将 D 分为间的相似性。设 S 1 和 S 2 为两个长度相同的 PMR 序
D 1 和 D 2 ，最优分裂点处的距离阈值 d OSP(D, S ) 对于任何列，其中 s 1i 和 s 2i 分别为 S 1 和 S 2 的第 i 个模式， p 1i 和
其他距离阈值 d 都满足下式：
′
th p 2i 分别为 S 1 和 S 2 第 i 个模式对应的模式值，若两个
( ) ( )
Gain S,d OSP(D, S ) ⩾ Gain S,d ′ （5）序列模式数量相同，且每个模式的模式结束时间都
th
最终，shapelets 特征序列定义为：在时间序列数相同，则称为等模式数序列，可得到序列模式距离为：
据集 D 中， shapelet(D)与其对应的最优分裂点，相比 1 N ∑
D sp (S 1 ,S 2 ) = t ih |p 1i − p 2i |，
于其他子序列 S 有最大的信息增益，则 shapelet(D) t N
i=1
是 D 的 shapelets 特征序列： 1 N ∑
t ih = 1，D sp (S 1 ,S 2 ) ∈ [0,2] （8）
Gain(shapelet(D),d OSP(D,shapelet(D)) ) （6） t N
i=1
通过计算信息增益和最优分裂点等标准来对式中， t N 表示时间序列的长度； t ih 表示第 i 个模式的
shapelets 的分类效果进行评价和排序，最后得到表达持续时间，模式持续时间越长，其在序列模式距离中
效果最好的前 K 个 shapelets 特征序列。的权重就越大。 D sp 趋于零时，序列趋势更为相似；

D sp 趋于 2 时，序列趋势更为不同。
1.2 模式距离
当两序列并非为等模式序列时，需对序列进行

本文应用一种时间序列的模式模型表示（pattern 等模式数（EPN）过程，即将两序列分割成模式数相
model representation，PMR），能够有效描述时间序列同的两个新数列，使其拥有相同的模式结束时间。
的趋势，可以通过计算模式距离来衡量趋势的相似模式距离根据模式数变化具备多分辨率特性，
性。基于点距离的度量方法要求对所有点之间的距能反映时间序列在不同分析频率下的相似性，同时
离进行计算，而模式距离存在模式持续时间系数，且模式距离不需要对测量尺度进行标准化处理，计算
仅有模式切换点的值因噪声改变才可能改变模式，消耗较低。

影响很小，它是以变化趋势为基础的时间序列匹配
1.3 图注意力网络
方法，能够反映时间序列的动态特性，解决了以点距
离为依据的时间序列静态度量存在的误匹配问题，注意力机制可以帮助模型关注输入数据中重要
能够比欧氏距离更为有效地度量序列变化趋势的相的部分，从而更好地理解和处理数据。图注意力网
似程度 [24-25] 。络（graph attention network, GAT）将注意力机制引入图

99 100 101 102 103 104 105 106 107 108 109