Page 139 - 《振动工程学报》2025年第8期

P. 139

第 8 期刘杰，等：不均衡样本下轴承故障的 LSGAN-Swin Transformer 诊断方法 1779

内圈故障（IR）、外圈故障（OR）以及滚动体故障阶矩和二阶矩估计的指数衰减率。Swin‑T 模型编
（RE）。选取轴承在 0~3 hp（0~2205 W）负载条件程环境为 i7‑8565U CPU，NVIDIA GTX1050Ti，py‑
下工作时的振动数据，如表 2 所示，在同种故障条件 thon3.7，Pytorch1.8，模型训练时设置最大迭代次数
下，根据故障程度分别使用 0.18 代表 0.1778 mm 故为 30，学习率为 1×10 ，权值衰减为 1×10 ，
−5
−3
障深度；0.36 代表 0.3556 mm 故障深度；0.54 代表 rain_batch_size 与 eval_batch_size 均设置为 8。
0.5334 mm 故障深度。表 2 中 OR0.36 代表轴承外为了验证 Swin Transformer 模型不同学习率
圈 0.3556 mm 故障深度，其他同理。在轴承故障诊断任务中的影响，分别尝试设置初始
表 2 滚动轴承故障类型学习率为 1×10 、1×10 、1×10 ，训练过程中不
−4
−2
−3
Tab. 2 Fault types of rolling bearing 同学习率设置随迭代次数的变化如图 6 所示。
标签负载/W 故障种类故障深度/mm
0 正常（N） 0
1 内圈（IR0.18） 0.18
2 内圈（IR0.36） 0.36
3 内圈（IR0.54） 0.54
4 外圈（OR0.18） 0.18
0~2205
5 外圈（OR0.36） 0.36
6 外圈（OR0.54） 0.54
7 滚动体（RE0.18） 0.18
8 滚动体（RE0.36） 0.36 图 6 不同学习率对应损失值
9 滚动体（RE0.54） 0.54 Fig. 6 Loss values corresponding to different learning rates

为了保证单个样本降低数据冗余的同时包含训练开始，初始学习率为 1×10 的损失值迅
−2
相对较多的故障信息，每类故障状态均通过截取速下降，然而，随着迭代次数的增加，训练折线的
1024 个采样点作为一个样本，以 30% 的重叠率重波动幅度依然较大，且损失值难以收敛至理想位
复采样 400 次，具体操作如图 5 所示，对采集的数据置。初始学习率为 1×10 的曲线，最终收敛效果
−4
样本进行连续小波变换转换为 64×64×3 的时频优于 1×10 的曲线，但波动更为剧烈，且收敛速度
−2
图，每种轴承振动信号类型采集到 400 张图片。相对较慢。1×10 对应的损失函数曲线在前期收
−3
敛速度相对较好，而且没有出现后期上升的现象，
说明本研究的模型没有发生过拟合。通过验证，初
始学习率设置为 1×10 是较为合理的。
−3
批尺寸大小在轴承故障诊断任务中控制每次
输入网络进行训练的时频图，由图 7 可知，随着批

尺寸的增大，模型的故障诊断精度先升高后降低，
图 5 重叠采样示意图因此本文选择批尺寸的大小为 32。
Fig. 5 Schematic diagram of overlapping sampling

2. 2 试验参数设置

试验分为 LSGAN 不均衡样本扩充和 Swin‑T
模型故障诊断两个部分。试验中的 GANs 均采用
RMSProp 方式训练，设置最大迭代次数为 500，且均
使用相同的网络参数设定，以避免因参数差异造成
的结果误差，根据文献［25］，不同图像生成场景下需
设置不同的学习率，根据试验结果，在轴承故障诊断
任务中，学习率为 2×10 时，生成器与判别器具有
−4
更好的图像生成效果，LSGAN 中采用的 Adam 优化图 7 批尺寸大小对模型性能的影响
器的 β 1 设置为 0.5， β 2 设置为 0.999， β 1 和 β 2 分别为一 Fig. 7 Effect of batch size on model performance

134 135 136 137 138 139 140 141 142 143 144