Page 105 - 《振动工程学报》2026年第5期
P. 105

第 5 期             郭海宇,等:一种结合      shapelets 和模式距离的图注意力网络旋转机械故障诊断                           1309

              神经网络的邻居节点聚合过程中,如图                  3  所示,通过                            ∑         
                                                                               ′        (   )      (14)
                                                                              h = σ     α ij Wh j  
                                                                               i
              图注意力层学习获得各个邻居节点特征的权重,从                                                          
                                                                                    u j ∈N(u i )
              而在聚合邻居节点时对邻居节点特征进行加权求和。                           式中,   h 为节点 新的特征向量;          σ为激活函数,常使
                                                                       ′
                                                                       i      u i
                                                                用  ReLU  函数。

                                                                    GAT  可以使用多头注意力机制来让模型同时关
                   Wh i                                         注输入的不同部分,如图            4  所示,R  个独立的注意力
                                                                机制分别计算注意力权重并输出特征,然后将每个
                                                                注意力机制获得的特征通过拼接操作                  h 或者平均操
                                                                                                   ′
                                                                                                   i1
                                                   α ij
                                                                    ′
                                          Softmax               作 h 得到其输出特征表示,分别如下式所示:
                                                                    i2
                                                                                                
                                                                                  R   ∑         
                                                                                     
                                                                              ′           r  (  r  )   (15)
                   Wh j                                                                         
                                                                             h = ∥ σ    a E h j   
                                                                              i1
                                                                                           ij
                               a                                                 r=1  u j ∈N(u i )
                                                                                                  
                                                                                     R
                                                                                  1               
                                                                                  ∑ ∑
                                                                                              (   )
                                                                            ′             r   ′      (16)
                                                                           h = σ          a E h j  
                                                                            i2
                                                                                            ij
                            图 3 GAT 注意力机制                                         R               
                                                                                    r=1 u j ∈N (u i )
                         Fig. 3 GAT attention mechanism                                                  r
                                                                式中,R   为注意力头的数量;         ||表示拼接操作;      a 为第
                                                                                                         ij
                  GAT  中的图注意力层的输入           h  和输出  h'是一系       r 个注意机制计算的归一化注意系数,                E 为其相应的
                                                                                                   r
              列节点的特征向量,可分别表示为:                                  输入线性变换的权矩阵。
                          h = {h 1 , h 2 ,··· , h M }, h i ∈ R F  (9)
                              {          }      F ′                         h 2
                                ′
                                            ′
                                  ′
                          h = h , h ,··· , h ′  , h ∈ R  (10)
                           ′
                                1  2    M   i
                                                                                        a 11
              式中,M   为节点数;F      和  F'分别为图注意层的输入和
                                                                              a
              输出节点的特征数。                                                 h 3    12
                                                                                          拼接/平均
                  假设中心节点为        u i ,其邻居节点为    u j 。首先对每                   a 13                     h 1 ′
                                                                                       h 1
                                                     ′
              个节点都应用一个共同的权重矩阵(                 W ∈ R F ×F )作线
              性变换,之后对节点执行一个共享的注意力机制:                                      h 4  a 14
                                                                                      a 15
              R ×R → R,注意力系数为:
                    F
                     ′
               F
                ′
                                                                                   h 5
                         (
                                 )
                    e i j = a Wh i ,Wh j ,e ik = a(Wh i ,Wh k )  (11)
                                          ( )                                  图 4 多头注意力机制
                                ( )    exp e i j
                     α i j = softmax e i j =           (12)
                              j       ∑                                  Fig. 4 Multi-head attention mechanism
                                          exp(e ik )
                                     u k ∈N(u i )
              式中,u k 为节点    u i 的任一邻居节点;      h i 、  h j 和  h k 分别
                                                                2    网  络  模  型  结  构
              为节点    u i 、u j 和  u k 的特征向量; N (u i )表示节点  u i 邻居

              节点的集合;      e ij 和 e ik 分别为节点  u i 与节点  u j 和节点
                                                                2.1    SP-GAT  网络模型结构
              u k 之间的注意力系数;       α ij 为经过归一化后的注意力
              系数,表示节点       u j 的特征对节点     u i 特征的重要程度。             本节详细介绍故障诊断网络模型结构,包括提
                  注意力机制      a是一个单层前馈神经网络,由权重                   取  shapelets 特征序列、构建     KNN  图模型、通过图注
              向量  a ∈ R 2F ′ 参数化,并利用   LeakyReLU  激活函数进         意力层和     TopKPooling  池化层提取特征信息等方法
              行非线性化,充分展开后,注意力机制计算出的系数                           实现故障诊断。所提           SP-GAT  网络模型结构的总体
              (如图   3  所示)可以表示为:                                流程如图     5  所示。

                              ( (  (       )))
                                  T
                           exp L a Wh i ,Wh j
                     α ij =                            (13)     2.2    KNN  图模型的构建
                          ∑      ( (          ))
                                    T
                              exp L a (Wh i ,Wh k )
                         u k ∈N(u i )                               振动信号存在连续性和周期性的特点,信号之
              式中,上标“T”表示转置;           L(·)表示  LeakyReLU  激活     间有着复杂的相关性,可以采用建立以分段信号为
              函数。                                               节点的    KNN  图模型的方法来揭示信号之间的这种
                  接下来,通过归一化的注意力系数计算出与之                          相 关 性, 深 入 发 掘 信 号 间 的 特 征 关 联 信 息 。 构 建
              对应的特征的线性组合,作为每个节点的最终输出                            KNN  图模型的关键是将各个信号样本之间通过边
              特征:                                               相连,利用连边体现信号之间复杂的结构和关系。
   100   101   102   103   104   105   106   107   108   109   110