Page 107 - 《振动工程学报》2026年第5期
P. 107
第 5 期 郭海宇,等:一种结合 shapelets 和模式距离的图注意力网络旋转机械故障诊断 1311
sigmoid
算法1:提取shapelets子序列
1
1. 定义函数 shapelets(data, window_size, step_size, q) p idx
X ×
2. 初始化列表 shapelets 和 q_shapelets X y +1
p y top k X
对于 i = 0 到 len(data) − window_size + 1,步长为
3.
step_size A
4. 提取窗口数据 window = data[i:i + window_size] A +1
计算特征值 value = count_value(window, data, 图 6 TopKPooling 池化层
5.
step_size, window_size)
Fig. 6 TopKPooling pooling layer
6. 将 (value, window) 添加到 shapelets 列表中
7. 对 shapelets 列表按照特征值进行排序 TopKPooling 池化层的计算公式如下:
ℓ
8. 对于 i = 0 到 q−1 y = X p/∥p∥,idx = top k (y),
ℓ
将排序后的第 i 个形状特征添加到 q_shapelets ˜ y = sigmoid(y(idx)),A ℓ+1 = A (idx,idx),
9.
列表中 X = X (idx,:),X ℓ+1 = X ⊙(˜y1 ) (20)
˜
ℓ
T
ℓ
C
10. 返回 q_shapelets 列表 式中, X 和 A 分别为第 ℓ层的特征矩阵和邻接矩阵,
ℓ
ℓ
X 的维度为 B×C(B 和 C 分别表示节点数和特征维
ℓ
将每个节点取得的 10 个 shapelets 序列用 KNN 算法
度); p为可训练的投影向量;k 为新图选择的节点数;
根据模式距离选取 5 个与其最近的序列,将其用边
y 为各个节点的得分; top k (y)为对节点的得分进行排
相连构建 KNN 图,以更好地反映样本间复杂的相关
ℓ
序操作,保留前 k 个得分高的点的索引; A (idx,idx)
性,并将图中每个节点与其相连节点的模式距离作
ℓ
和 X (idx,:)为进行行或列提取,形成下一层的邻接矩
为各边的距离权重,寻找相邻节点的过程为:
˜ y(idx) 为从
阵 A ℓ+1 和池化后的特征矩阵 X; y 中提取
1 N ∑
D sp (S 1 ,S 2 ) = t ih |p 1i − p 2i |, 索 引为 idx 的 值 , 进 行 sigmoid 激 活 可 得 到 ˜ y, 再 与
t N
i=1
˜
( ) X点乘得到下一层的特征矩阵 X ℓ+1 ; ⊙表示矩阵的逐
N k (x i ) = KNN D sp (S 1 ,S 2 ) (19)
元素乘法; 1 表示全 1 列向量的转置。
T
式中, D sp (S 1 ,S 2 )为两节点间的模式距离; N k (x i )表示 C
对池化后的特征一方面进行全局平均池化操
节点 x i 邻居节点。通过对节点 与其相邻节点 N k (x i )
作, 得 到 X 1 , 另 一 方 面 再 次 进 行 图 卷 积 操 作 , 使 用
x i
建立连边,构建 KNN 图模型。
BN 进 行 批 量 归 一 化 , 并 使 用 ReLU 函 数 进 行 激 活 ,
2.3 图注意力网络模型 再次进行 TopKPooling 池化操作,得到 X 2 ,将 X 1 和 X 2
相加,得到特征 X;将特征 X通过全连接层和 dropout
图注意力网络可以通过学习节点之间的注意力
层进行特征转换和正则化,其中随机失活层概率为
权重,对节点的特征进行表示学习,从而提取出图中
0.5,可以在训练过程中随机地将神经元的输出设置
节点的关键特征,选择性地关注重要部分。本文设
为 0,以减少神经元之间的依赖性,防止过拟合,从而
计的图注意力网络模型由 2 个注意力卷积层、2 个
提高模型的泛化性能;最后,通过另一个全连接层得
批 量 归 一 化 层、 2 个 TopKPooling( Top K Pooling) 池
到最终输出特征,实现对故障的识别分类。
化层、2 个全局平均池化层、2 个随机失活层组成。
首先将构建的图模型通过注意力卷积层对输入
3 试 验 验 证
的特征图进行加权求和,从而突出其重要的特征并
削弱不相关的信息,提高模型的性能和表达能力,卷
3.1 数据集介绍
积核的大小为 128;接着对于结果进行批量归一化操
作,对输入数据进行标准化处理,将每个特征维度的 为了验证本文模型的有效性,试验数据集采用
均值和方差归一化到 0~1 之间,以减少数据的方差, 美 国 凯 斯 西 储 大 学( Case Western Reserve University,
从而使得训练过程中的梯度更加稳定,有助于加速 CWRU) 滚 动 轴 承 数 据 集 、 东 南 大 学 ( Southeast
训练过程并提高模型的稳定性和泛化性能,其维度 University, SEU) 滚 动 轴 承 数 据 集 和 江 南 大 学
为 128;之后通过 ReLU 函数对结果进行激活。 (Jiangnan University,JNU)轴承数据集。
接着通过 TopKPooling 池化层,其流程图如图 6 凯斯西储大学滚动轴承数据集以 12 kHz 的采样
所示,将输入数据按照一定的指标进行排序,选择前 频 率 对 驱 动 端 轴承 SKF6205 进 行 采 样 , 数 据 分 为
K 个得分高的节点作为代表进行重组,构成一个新 B-滚动体故障、IR-内圈故障、OR-外圈故障、N-正常
的图,对输入数据进行特征选择和降维,同时保留重 共 4 种状态类型,每种状态类型有 3 种损伤程度,分
要的信息,降低计算负荷,提高模型的泛化性和鲁棒性。 别为轻微故障(0.1778 mm)、中度故障(0.3556 mm)、

