Page 137 - 《振动工程学报》2025年第8期

P. 137

第 8 期刘杰，等：不均衡样本下轴承故障的 LSGAN-Swin Transformer 诊断方法 1777

解决梯度消失的问题，MAO 等［19］提出使用最小二生成数据的质量，从而保证在数据不均衡条件下
乘损失函数替代交叉熵损失函数的 LSGAN 模型， LSGAN 能够有效扩充数据样本，提高样本不均衡
使得 GAN 的训练过程更加稳定的同时具有更快的条件下轴承故障诊断的准确率。
收敛速度，得到更高质量的生成数据。
1. 2 Swin Transformer 网络模型
LSGAN 的目标函数表示为：
ì 1 2 Swin Transformer 模型利用滑动窗口、层级设
ï ï min V LSGAN( ) =
ï D D 2 E x ∼ P data( )( D ( ) x - b ) + 计的优势，使 Transformer 从语言适应应用至视觉
x
ï
ï
ï
ï ï
1
í E z ∼ P z( ) z ( D( G ( ) z ) - ) a 2 （2）方面成为可能［20‑21］。在本文的故障诊断研究中，
ï ï 2
ï Swin Transformer 诊断模型的总体框架如图 1 所
ï
ï 1 2
G
ï min V LSGAN( ) = 2 E z ∼ P G( ) z ( D( G ( ) z ) - ) c 示，主要由修补分区层、层叠模块、归一化层、全局
ï ï
î
G
式中，V LSGAN( D) 和V LSGAN(G) 分别为 LSGAN 判别池化层以及全连接层组成。
器和生成器的目标函数；P G （z）表示真实数据分布；通过连续小波变换将振动信号转变为 RGB 三
a 为生成数据标签；b 为真实样本标签；c 为判别生通道的时频图，将大小为［H， W， C］的时频图输入
成数据为真的期望。为了使生成数据与真实数据模型中大小为 4×4 相邻像素的补丁分区模块中进行
样本的分布无限接近，设定 b=c，a=0，代入 LS‑ 分块，通过展平操作，图像大小变为［H/4， W/4，
GAN 的目标函数中可得： 16C］，依次经历 4 个层叠模块 Stage 对输入时频图的
ì 1 2 分辨率进行压缩，网络模型使用窗口多头自注意结
D
ï
ï ï min V LSGAN( ) = 2 E x ∼ P data( )( D ( ) x - 1 ) + 构 W‑MSA（window multi‑head self‑attention）和移
x
ï
D
ï
ï
ï ï
1
í E z ∼ P z( ) z ( D( G ( ) z ) ) 2 （3）位窗口多头自注意结构 SW‑MSA（shifted window
ï ï 2
ï multi‑head self‑attention）两种旋转转换块结构。模
ï
ï 1 2
G
ï min V LSGAN( ) = 2 E z ∼ P G( ) z ( D( G ( ) z ) - ) 1 型层叠模块 Stage1 中具有 1 个线性嵌入，层叠模块
ï ï
î
G
在 LSGAN 中，在生成器 G 中加入 dropout 层防 Stage2 至层叠模块 Stage4 中各含有 1 个补丁合并
止参数过多影响网络判别效果，避免小样本训练过层。其中 Stage1 至 Stage4 中分别包含 2、2、6、2 个
程中发生过拟合现象，判别器 D 通过最小二乘损失 Swin Transformer Blocks。
函数，使生成数据样本通过不断迭代训练逐渐尽可移动窗口多注意力机制包含 MSA（multi‑head
能地接近真实样本数据的空间分布，二者均会提高 self‑attention）结构、W‑MSA 结构和 SW‑MSA 结

注： H 和 W 分别表示时频图的高度和宽度；C 表示时频图维度；LN 为归一化层；MLP 为多层感知器；Stage1 至 Stage4 为层叠模块；Swin
l
l
Transformer blocks 为 LN、W-MSA、SW-MSA、MLP 和移位窗口多头自注意结构组成的模块；z 为 MLP 模块的输出特性； z ̂ 为 W-MSA 模
块的输出特性。
图 1 LSGAN-Swin Transformer 诊断模型总体框架
Fig. 1 General framework of the LSGAN-Swin Transformer diagnosis model

132 133 134 135 136 137 138 139 140 141 142