Page 105 - 《振动工程学报》2026年第5期
P. 105
第 5 期 郭海宇,等:一种结合 shapelets 和模式距离的图注意力网络旋转机械故障诊断 1309
神经网络的邻居节点聚合过程中,如图 3 所示,通过 ∑
′ ( ) (14)
h = σ α ij Wh j
i
图注意力层学习获得各个邻居节点特征的权重,从
u j ∈N(u i )
而在聚合邻居节点时对邻居节点特征进行加权求和。 式中, h 为节点 新的特征向量; σ为激活函数,常使
′
i u i
用 ReLU 函数。
GAT 可以使用多头注意力机制来让模型同时关
Wh i 注输入的不同部分,如图 4 所示,R 个独立的注意力
机制分别计算注意力权重并输出特征,然后将每个
注意力机制获得的特征通过拼接操作 h 或者平均操
′
i1
α ij
′
Softmax 作 h 得到其输出特征表示,分别如下式所示:
i2
R ∑
′ r ( r ) (15)
Wh j
h = ∥ σ a E h j
i1
ij
a r=1 u j ∈N(u i )
R
1
∑ ∑
( )
′ r ′ (16)
h = σ a E h j
i2
ij
图 3 GAT 注意力机制 R
r=1 u j ∈N (u i )
Fig. 3 GAT attention mechanism r
式中,R 为注意力头的数量; ||表示拼接操作; a 为第
ij
GAT 中的图注意力层的输入 h 和输出 h'是一系 r 个注意机制计算的归一化注意系数, E 为其相应的
r
列节点的特征向量,可分别表示为: 输入线性变换的权矩阵。
h = {h 1 , h 2 ,··· , h M }, h i ∈ R F (9)
{ } F ′ h 2
′
′
′
h = h , h ,··· , h ′ , h ∈ R (10)
′
1 2 M i
a 11
式中,M 为节点数;F 和 F'分别为图注意层的输入和
a
输出节点的特征数。 h 3 12
拼接/平均
假设中心节点为 u i ,其邻居节点为 u j 。首先对每 a 13 h 1 ′
h 1
′
个节点都应用一个共同的权重矩阵( W ∈ R F ×F )作线
性变换,之后对节点执行一个共享的注意力机制: h 4 a 14
a 15
R ×R → R,注意力系数为:
F
′
F
′
h 5
(
)
e i j = a Wh i ,Wh j ,e ik = a(Wh i ,Wh k ) (11)
( ) 图 4 多头注意力机制
( ) exp e i j
α i j = softmax e i j = (12)
j ∑ Fig. 4 Multi-head attention mechanism
exp(e ik )
u k ∈N(u i )
式中,u k 为节点 u i 的任一邻居节点; h i 、 h j 和 h k 分别
2 网 络 模 型 结 构
为节点 u i 、u j 和 u k 的特征向量; N (u i )表示节点 u i 邻居
节点的集合; e ij 和 e ik 分别为节点 u i 与节点 u j 和节点
2.1 SP-GAT 网络模型结构
u k 之间的注意力系数; α ij 为经过归一化后的注意力
系数,表示节点 u j 的特征对节点 u i 特征的重要程度。 本节详细介绍故障诊断网络模型结构,包括提
注意力机制 a是一个单层前馈神经网络,由权重 取 shapelets 特征序列、构建 KNN 图模型、通过图注
向量 a ∈ R 2F ′ 参数化,并利用 LeakyReLU 激活函数进 意力层和 TopKPooling 池化层提取特征信息等方法
行非线性化,充分展开后,注意力机制计算出的系数 实现故障诊断。所提 SP-GAT 网络模型结构的总体
(如图 3 所示)可以表示为: 流程如图 5 所示。
( ( ( )))
T
exp L a Wh i ,Wh j
α ij = (13) 2.2 KNN 图模型的构建
∑ ( ( ))
T
exp L a (Wh i ,Wh k )
u k ∈N(u i ) 振动信号存在连续性和周期性的特点,信号之
式中,上标“T”表示转置; L(·)表示 LeakyReLU 激活 间有着复杂的相关性,可以采用建立以分段信号为
函数。 节点的 KNN 图模型的方法来揭示信号之间的这种
接下来,通过归一化的注意力系数计算出与之 相 关 性, 深 入 发 掘 信 号 间 的 特 征 关 联 信 息 。 构 建
对应的特征的线性组合,作为每个节点的最终输出 KNN 图模型的关键是将各个信号样本之间通过边
特征: 相连,利用连边体现信号之间复杂的结构和关系。

