Page 107 - 《振动工程学报》2026年第5期

P. 107

第 5 期郭海宇，等：一种结合 shapelets 和模式距离的图注意力网络旋转机械故障诊断 1311

sigmoid
算法1：提取shapelets子序列
1
1. 定义函数 shapelets(data, window_size, step_size, q) p idx
X  ×
2. 初始化列表 shapelets 和 q_shapelets X  y  +1
p y top k X
对于 i = 0 到 len(data) − window_size + 1，步长为
3.
step_size A 
4. 提取窗口数据 window = data[i：i + window_size] A +1
计算特征值 value = count_value(window, data, 图 6 TopKPooling 池化层
5.
step_size, window_size)
Fig. 6 TopKPooling pooling layer
6. 将 (value, window) 添加到 shapelets 列表中
7. 对 shapelets 列表按照特征值进行排序 TopKPooling 池化层的计算公式如下：
ℓ
8. 对于 i = 0 到 q−1 y = X p/∥p∥，idx = top k (y),
ℓ
将排序后的第 i 个形状特征添加到 q_shapelets ˜ y = sigmoid(y(idx))，A ℓ+1 = A (idx,idx),
9.
列表中 X = X (idx,:)，X ℓ+1 = X ⊙(˜y1 ) （20）
˜
ℓ
T
ℓ
C
10. 返回 q_shapelets 列表式中， X 和 A 分别为第 ℓ层的特征矩阵和邻接矩阵，
ℓ
ℓ

X 的维度为 B×C（B 和 C 分别表示节点数和特征维
ℓ
将每个节点取得的 10 个 shapelets 序列用 KNN 算法
度）； p为可训练的投影向量；k 为新图选择的节点数；
根据模式距离选取 5 个与其最近的序列，将其用边
y 为各个节点的得分； top k (y)为对节点的得分进行排
相连构建 KNN 图，以更好地反映样本间复杂的相关
ℓ
序操作，保留前 k 个得分高的点的索引； A (idx,idx)
性，并将图中每个节点与其相连节点的模式距离作
ℓ
和 X (idx,:)为进行行或列提取，形成下一层的邻接矩
为各边的距离权重，寻找相邻节点的过程为：
˜ y(idx) 为从
阵 A ℓ+1 和池化后的特征矩阵 X； y 中提取
1 N ∑
D sp (S 1 ,S 2 ) = t ih |p 1i − p 2i |，索引为 idx 的值，进行 sigmoid 激活可得到 ˜ y，再与
t N
i=1
˜
( ) X点乘得到下一层的特征矩阵 X ℓ+1 ； ⊙表示矩阵的逐
N k (x i ) = KNN D sp (S 1 ,S 2 ) （19）
元素乘法； 1 表示全 1 列向量的转置。
T
式中， D sp (S 1 ,S 2 )为两节点间的模式距离； N k (x i )表示 C
对池化后的特征一方面进行全局平均池化操
节点 x i 邻居节点。通过对节点与其相邻节点 N k (x i )
作，得到 X 1 ，另一方面再次进行图卷积操作，使用
x i
建立连边，构建 KNN 图模型。

BN 进行批量归一化，并使用 ReLU 函数进行激活，
2.3 图注意力网络模型再次进行 TopKPooling 池化操作，得到 X 2 ，将 X 1 和 X 2
相加，得到特征 X；将特征 X通过全连接层和 dropout
图注意力网络可以通过学习节点之间的注意力
层进行特征转换和正则化，其中随机失活层概率为
权重，对节点的特征进行表示学习，从而提取出图中
0.5，可以在训练过程中随机地将神经元的输出设置
节点的关键特征，选择性地关注重要部分。本文设
为 0，以减少神经元之间的依赖性，防止过拟合，从而
计的图注意力网络模型由 2 个注意力卷积层、2 个
提高模型的泛化性能；最后，通过另一个全连接层得
批量归一化层、 2 个 TopKPooling（ Top K Pooling）池
到最终输出特征，实现对故障的识别分类。

化层、2 个全局平均池化层、2 个随机失活层组成。
首先将构建的图模型通过注意力卷积层对输入
3 试验验证
的特征图进行加权求和，从而突出其重要的特征并
削弱不相关的信息，提高模型的性能和表达能力，卷
3.1 数据集介绍
积核的大小为 128；接着对于结果进行批量归一化操
作，对输入数据进行标准化处理，将每个特征维度的为了验证本文模型的有效性，试验数据集采用
均值和方差归一化到 0~1 之间，以减少数据的方差，美国凯斯西储大学（ Case Western Reserve University，
从而使得训练过程中的梯度更加稳定，有助于加速 CWRU）滚动轴承数据集、东南大学（ Southeast
训练过程并提高模型的稳定性和泛化性能，其维度 University， SEU）滚动轴承数据集和江南大学
为 128；之后通过 ReLU 函数对结果进行激活。（Jiangnan University，JNU）轴承数据集。
接着通过 TopKPooling 池化层，其流程图如图 6 凯斯西储大学滚动轴承数据集以 12 kHz 的采样
所示，将输入数据按照一定的指标进行排序，选择前频率对驱动端轴承 SKF6205 进行采样，数据分为
K 个得分高的节点作为代表进行重组，构成一个新 B-滚动体故障、IR-内圈故障、OR-外圈故障、N-正常
的图，对输入数据进行特征选择和降维，同时保留重共 4 种状态类型，每种状态类型有 3 种损伤程度，分
要的信息，降低计算负荷，提高模型的泛化性和鲁棒性。别为轻微故障（0.1778 mm）、中度故障（0.3556 mm）、

102 103 104 105 106 107 108 109 110 111 112