Page 213 - 《振动工程学报》2025年第9期
P. 213
第 9 期 李 鑫,等:基于鲁棒代价敏感支持矩阵机的风电齿轮箱故障诊断方法 2143
X i 行与行(或列与列)之间的结构信息。 为第 i 个正类和负类样本; 和 分别为第 i 个正
ϖ i + ϖ i −
类和负类样本的权重系数。
2 RCSSMM 模 型
2.2 模型求解
2.1 模型构建 由于核范数 ∥W∥ ∗ 的存在,RCSSMM 模型的目标
函数是一个连续非光滑凸优化问题,因而本文采用
由式(1)可知,SMM 为每一个矩阵样本分配了
交替方向乘子(alternating direction method of multipliers,
相同的权重系数,忽略了数据的先验分布特征,导致
ADMM)算法 [21] 获得其全局最优解。
其对噪声和野值点极其敏感。为此,本文采用集成
首先,通过引入辅助变量 S,式(4)可改写为:
矩阵度量(assembled matrix distance,AMD) [19] 评估样
1 ( T ) n + ∑ n − ∑
本间的分布特征: min tr W W +γ∥S∥ ∗ +C + ϖ i+ ζ i +C − ϖ i− ζ i
W,b 2
1 i + =1 i − =1
0.5p p [ ( ) ]
d 1
d 2 ∑ ∑( T
) 2
( ) [ ] s.t. S−W = 0,y i tr W X i +b ⩽ 1−ζ i ,ζ i ⩾ 0 (5)
ψ X i , X j = (2)
[X i ] kl − X j kl
式(5)的 Lagrange 函数可表示为:
l=1 k=1
式中,d 1 和 d 2 分别为二维矩阵样本 X i 和 X j 的特征维 1 ( T ) ρ
A
2
L = tr W W +γ∥S∥ ∗ +
S−W +
+
度;p 为幂因子,在文献 [19] 的研究基础上,结合经 2 2
ρ
F
验知识,本文 p 取为 0.25。 n + ∑ { [ ( T ) ]}
C + ϖ i + 1−y i tr W X i +b + +
相较于传统的欧式度量、余弦度量等,AMD 可 i + =1
以直接度量两矩阵数据间的距离,而无需向量化操 n − ∑ { [ ( ) ]}
T
1−y i tr W X i +b (6)
C − ϖ i −
作。噪声或野值点通常分布分散,且位于正常数据 i − =1 −
的分布边界外。基于上述先验知识,定义样本 X i 的 式中,A 为 Lagrange 乘子;ρ 为迭代步长, ρ > 0。
权重系数 ϖ i 为: 根据 ADMM 算 法 , 式 ( 6) 可 解 耦 成 关 于 S、
ψ −ψ min (W,b)和 的三个子优化问题。优化迭代过程如下:
i A
,ψ min ⩽ ψ < ψ ave
1−
i
( ( ) )
ψ max −ψ min (3) S k+1 k k k
q := minL S, W ,b , A
ϖ i =
( )
i
ψ −ψ min k+1 k+1 k+1 k (7)
1− W ,b := minL S ,(W,b), A
+t,ψ ave ⩽ ψ ⩽ ψ max
( )
i
ψ max −ψ min k+1 k k+1 k+1
( ) A := A +ρ S −W
式 中, ψ = ψ X i X 为 X i 到 样 本 中 心 X的 AMD; ψ min 、
i
式中,k 表示迭代次数;“:=”表示赋值运算符。
ψ max 和 ψ ave 分别表示 ψ 的最小值、最大值和平均值; 接下来,将详细推导 S、 (W,b)和 的迭代求解过程。
i
t 为 非 零 常 数 , 用 于 防 止 权 重 系 数 过 小 , 本 文 取 为 A
(1)更新 S:将 (W,b)和 A 视为常数,则式(6)关于
0.001。随着 ψ 的增大, X i 的权重系数 ϖ i 先呈线性下
i
S 的优化问题可以表示为:
,
降,当超过平均值 ψ ave ϖ i 呈指数下降。通过式(3)可
2
为噪声或野值点赋予较小的权重系数,以抑制其在 L = γ∥S∥ ∗ + ρ
S−W + A
(8)
2
ρ
F
建模过程中的影响,提高模型的鲁棒性。
根据文献 [16],式(8)的最优解为:
此外,SMM 在处理不平衡数据时,假设多数类
A
和少数类的错分代价相同,使分类超平面易向多数 S = D γ\ρ (W − ρ ) (9)
类一侧偏移,极大地降低了模型的分类性能。为此, 式中, D γ\ρ (·)表示奇异值收缩算子。
引 入 代 价 敏 感 损 失 函 数, 为 正 类 样 本 ( 类 别 标 签 (2)更新 (W,b):同理,将 S 和 A 视为常数,则式(6)
为+1)和负类样本(类别标签为−1)分配不同的惩罚
关于 (W,b)的优化问题可以表示为:
因子 C + 和 C − ,使得建模过程中多数类样本获得较小的
1 ( T ) n + ∑ n − ∑
ζ
ζ
误分代价,而少数类样本获得较大的误分代价,以迫 min tr W W +C + ϖ i + i +C − ϖ i − i +
W,b 2
i + =1 i − =1
使分类超平面向少数类一侧调整,从而提高对不平衡
A
2
ρ
数据的分类性能。同时,为了减少参数设置过程中的
S−W +
2
ρ
F
专家依赖性,采用哈里斯鹰优化算法 [20] 自适应地确定 [ ( ) ]
T
s.t. y i tr W X i +b ⩽ 1−ζ i ,ζ i ⩾ 0 (10)
C + 和 C − 的最优取值,具体优化过程见本文 2.3 节。
式(10)的 Lagrange 函数为:
通过引入 ϖ i C + 和 C − ,所提 RCSSMM 模型的目 1 ( ) n + ∑ n − ∑ n ∑
、
T
ζ
ζ
标函数可表示为: L = 2 tr W W +C + ϖ i + i +C − ϖ i − i − β i ζ i +
i + =1 i − =1 i=1
1 ( T ) n + ∑ n − ∑
2 n ∑
]
}
)
{ [ (
T
min tr W W +γ∥W∥ ∗ +C + ϖ i+ ζ i +C − ϖ i− ζ i ρ
A
α i y i tr W X i +b −1+ζ i (11)
W,b 2
S−W +
+
i + =1 i − =1 2
ρ
F i=1
[ ( ) ]
T
s.t. y i tr W X i +b ⩽ 1−ζ i ,ζ i ⩾ 0 (4) 式中, α i 和 为 Lagrange 乘子。
β i
式中,n + 和 n − 分别为正类和负类样本个数;i + 和 i − 分别 分别求式(11)关于 ζ i 和 b 的偏导数,并令其为 0: