Page 213 - 《振动工程学报》2025年第9期
P. 213

第 9 期               李 鑫,等:基于鲁棒代价敏感支持矩阵机的风电齿轮箱故障诊断方法                                        2143

              X i 行与行(或列与列)之间的结构信息。                             为第   i 个正类和负类样本;           和    分别为第     i 个正
                                                                                        ϖ i +  ϖ i −
                                                                类和负类样本的权重系数。

              2    RCSSMM     模  型
                                                                2.2    模型求解

              2.1    模型构建                                           由于核范数      ∥W∥ ∗ 的存在,RCSSMM    模型的目标
                                                                函数是一个连续非光滑凸优化问题,因而本文采用
                  由式(1)可知,SMM       为每一个矩阵样本分配了
                                                                交替方向乘子(alternating direction method of multipliers,
              相同的权重系数,忽略了数据的先验分布特征,导致
                                                                ADMM)算法     [21]  获得其全局最优解。
              其对噪声和野值点极其敏感。为此,本文采用集成
                                                                    首先,通过引入辅助变量           S,式(4)可改写为:
              矩阵度量(assembled matrix distance,AMD)  [19]  评估样
                                                                       1  (  T  )         n + ∑      n − ∑
              本间的分布特征:                                             min tr W W +γ∥S∥ ∗ +C +  ϖ i+ ζ i +C −  ϖ i− ζ i
                                                                    W,b 2
                                                   1                                      i + =1     i − =1
                                                 
                                              0.5p  p                         [ (     )  ]
                                d 1
                            d 2 ∑ ∑(                                              T
                                            ) 2  
                   (    )              [  ]                    s.t. S−W = 0,y i tr W X i +b ⩽ 1−ζ i ,ζ i ⩾ 0  (5)
                  ψ X i , X j =                  (2)
                                 [X i ] kl − X j kl   
                                                                  式(5)的   Lagrange 函数可表示为:
                            l=1  k=1
              式中,d 1 和  d 2 分别为二维矩阵样本        X i 和  X j 的特征维           1  (  T  )       ρ 
 
 
  A 
 
 
 2
                                                                    L = tr W W +γ∥S∥ ∗ +  
S−W +   
 +
              度;p  为幂因子,在文献         [19] 的研究基础上,结合经                    2                2  
     ρ  
 F
              验知识,本文      p  取为  0.25。                                    n + ∑  {  [ (  T  )  ]}
                                                                       C +  ϖ i +  1−y i tr W X i +b  + +
                  相较于传统的欧式度量、余弦度量等,AMD                    可               i + =1
              以直接度量两矩阵数据间的距离,而无需向量化操                                      n − ∑  {  [ (    )   ]}
                                                                                         T
                                                                                1−y i tr W X i +b         (6)
                                                                       C −  ϖ i −
              作。噪声或野值点通常分布分散,且位于正常数据                                      i − =1                −
              的分布边界外。基于上述先验知识,定义样本                      X i 的   式中,A   为  Lagrange 乘子;ρ 为迭代步长,      ρ > 0。
              权重系数    ϖ i 为:                                        根据   ADMM   算 法 , 式 ( 6) 可 解 耦 成 关 于    S、
                    
                         ψ −ψ min                              (W,b)和   的三个子优化问题。优化迭代过程如下:
                          i                                            A
                                 ,ψ min ⩽ ψ < ψ ave
                     1−
                                         i
                                                                                ( (     )   )
                        ψ max −ψ min                  (3)            S k+1           k  k  k
                                  q                                      := minL S, W ,b , A
                ϖ i = 
                                                                     
                                                                     
                                                                                   (           )
                            i
                         ψ −ψ min                                     k+1  k+1       k+1       k       (7)
                     
                     1−                                            W   ,b  := minL S  ,(W,b), A
                                   +t,ψ ave ⩽ ψ ⩽ ψ max
                                                                                (        )
                                            i
                                                                     
                          ψ max −ψ min                                  k+1   k     k+1  k+1
                         (   )                                          A  := A +ρ S   −W
              式 中,  ψ = ψ X i X 为  X i 到 样 本 中 心  X的  AMD;  ψ min 、
                     i
                                                                式中,k 表示迭代次数;“:=”表示赋值运算符。
              ψ max 和  ψ ave 分别表示  ψ 的最小值、最大值和平均值;                  接下来,将详细推导        S、 (W,b)和  的迭代求解过程。
                                 i
              t 为 非 零 常 数 , 用 于 防 止 权 重 系 数 过 小 , 本 文 取 为                                     A
                                                                    (1)更新   S:将 (W,b)和  A  视为常数,则式(6)关于
              0.001。随着   ψ 的增大,    X i 的权重系数   ϖ i 先呈线性下
                          i
                                                                S  的优化问题可以表示为:
                                 ,
              降,当超过平均值        ψ ave ϖ i 呈指数下降。通过式(3)可
                                                                                        
        
 2
              为噪声或野值点赋予较小的权重系数,以抑制其在                                        L = γ∥S∥ ∗ +  ρ 
 
S−W +  A 
  (8)

                                                                                      2  
     ρ  
 F
              建模过程中的影响,提高模型的鲁棒性。
                                                                    根据文献     [16],式(8)的最优解为:
                  此外,SMM    在处理不平衡数据时,假设多数类
                                                                                            A
              和少数类的错分代价相同,使分类超平面易向多数                                             S = D γ\ρ (W −  ρ  )     (9)
              类一侧偏移,极大地降低了模型的分类性能。为此,                           式中,   D γ\ρ (·)表示奇异值收缩算子。
              引 入 代 价 敏 感 损 失 函 数, 为 正 类 样 本 ( 类 别 标 签              (2)更新  (W,b):同理,将    S  和  A  视为常数,则式(6)
              为+1)和负类样本(类别标签为−1)分配不同的惩罚
                                                                关于  (W,b)的优化问题可以表示为:
              因子  C + 和 C − ,使得建模过程中多数类样本获得较小的
                                                                      1  (  T  )    n + ∑      n − ∑
                                                                                                    ζ
                                                                                         ζ
              误分代价,而少数类样本获得较大的误分代价,以迫                              min tr W W +C +    ϖ i + i +C −  ϖ i − i +
                                                                   W,b 2
                                                                                   i + =1     i − =1
              使分类超平面向少数类一侧调整,从而提高对不平衡
                                                                        
       A 
 
 2
                                                                       ρ
              数据的分类性能。同时,为了减少参数设置过程中的                                   
S−W +
                                                                       2  
     ρ  
 F
              专家依赖性,采用哈里斯鹰优化算法                [20]  自适应地确定              [ (    )  ]
                                                                            T
                                                                   s.t. y i tr W X i +b ⩽ 1−ζ i ,ζ i ⩾ 0  (10)
              C + 和 C − 的最优取值,具体优化过程见本文            2.3  节。
                                                                    式(10)的   Lagrange 函数为:
                  通过引入     ϖ i C + 和 C − ,所提  RCSSMM  模型的目          1  (    )     n + ∑      n − ∑    n ∑
                             、
                                                                          T
                                                                                                  ζ
                                                                                       ζ
              标函数可表示为:                                           L =  2  tr W W +C +  ϖ i + i +C −  ϖ i − i −  β i ζ i +
                                                                                 i + =1     i − =1   i=1
                    1  (  T  )          n + ∑       n − ∑         
         
 2  n ∑
                                                                                                 ]
                                                                                                       }

                                                                                             )
                                                                                    { [ (
                                                                                          T
                 min tr W W +γ∥W∥ ∗ +C +   ϖ i+ ζ i +C −  ϖ i− ζ i  ρ 
 
  A 
    α i y i tr W X i +b −1+ζ i (11)
                 W,b 2                                            
S−W +    
 +
                                        i + =1     i − =1        2  
     ρ
                                                                             F  i=1
                     [ (     )  ]
                          T
                 s.t. y i tr W X i +b ⩽ 1−ζ i ,ζ i ⩾ 0  (4)     式中,   α i 和 为  Lagrange 乘子。
                                                                         β i
              式中,n + 和  n − 分别为正类和负类样本个数;i + 和         i − 分别       分别求式(11)关于       ζ i 和  b  的偏导数,并令其为    0:
   208   209   210   211   212   213   214   215   216   217   218