Page 139 - 《振动工程学报》2025年第8期
P. 139
第 8 期 刘 杰,等: 不均衡样本下轴承故障的 LSGAN-Swin Transformer 诊断方法 1779
内 圈 故 障(IR)、外 圈 故 障(OR)以 及 滚 动 体 故 障 阶矩和二阶矩估计的指数衰减率。Swin‑T 模型编
(RE)。选取轴承在 0~3 hp(0~2205 W)负载条件 程环境为 i7‑8565U CPU,NVIDIA GTX1050Ti,py‑
下工作时的振动数据,如表 2 所示,在同种故障条件 thon3.7,Pytorch1.8,模型训练时设置最大迭代次数
下,根据故障程度分别使用 0.18 代表 0.1778 mm 故 为 30,学 习 率 为 1×10 ,权 值 衰 减 为 1×10 ,
−5
−3
障 深 度 ;0.36 代 表 0.3556 mm 故 障 深 度 ;0.54 代 表 rain_batch_size 与 eval_batch_size 均设置为 8。
0.5334 mm 故 障 深 度 。 表 2 中 OR0.36 代 表 轴 承 外 为 了 验 证 Swin Transformer 模 型 不 同 学 习 率
圈 0.3556 mm 故障深度,其他同理。 在轴承故障诊断任务中的影响,分别尝试设置初始
表 2 滚动轴承故障类型 学习率为 1×10 、1×10 、1×10 ,训练过程中不
−4
−2
−3
Tab. 2 Fault types of rolling bearing 同学习率设置随迭代次数的变化如图 6 所示。
标签 负载/W 故障种类 故障深度/mm
0 正常(N) 0
1 内圈(IR0.18) 0.18
2 内圈(IR0.36) 0.36
3 内圈(IR0.54) 0.54
4 外圈(OR0.18) 0.18
0~2205
5 外圈(OR0.36) 0.36
6 外圈(OR0.54) 0.54
7 滚动体(RE0.18) 0.18
8 滚动体(RE0.36) 0.36 图 6 不同学习率对应损失值
9 滚动体(RE0.54) 0.54 Fig. 6 Loss values corresponding to different learning rates
为了保证单个样本降低数据冗余的同时包含 训练 开 始 ,初 始 学 习 率 为 1×10 的 损 失 值 迅
−2
相 对 较 多 的 故 障 信 息 ,每 类 故 障 状 态 均 通 过 截 取 速 下 降 ,然 而 ,随 着 迭 代 次 数 的 增 加 ,训 练 折 线 的
1024 个采样点作为一个样本 ,以 30% 的重叠率重 波 动 幅 度 依 然 较 大 ,且 损 失 值 难 以 收 敛 至 理 想 位
复采样 400 次,具体操作如图 5 所示,对采集的数据 置。初始学习率为 1×10 的曲线,最终收敛效果
−4
样 本 进 行 连 续 小 波 变 换 转 换 为 64×64×3 的 时 频 优于 1×10 的曲线,但波动更为剧烈,且收敛速度
−2
图,每种轴承振动信号类型采集到 400 张图片。 相对较慢。1×10 对应的损失函数曲线在前期收
−3
敛速度相对较好,而且没有出现后期上升的现象,
说明本研究的模型没有发生过拟合。通过验证,初
始学习率设置为 1×10 是较为合理的。
−3
批尺寸大小在轴承故障诊断任务中控制每次
输入网络进行训练的时频图,由图 7 可知,随着批
尺寸的增大,模型的故障诊断精度先升高后降低,
图 5 重叠采样示意图 因此本文选择批尺寸的大小为 32。
Fig. 5 Schematic diagram of overlapping sampling
2. 2 试验参数设置
试 验 分 为 LSGAN 不 均 衡 样 本 扩 充 和 Swin‑T
模型故障诊断两个部分。试验中的 GANs 均采用
RMSProp 方式训练,设置最大迭代次数为 500,且均
使用相同的网络参数设定,以避免因参数差异造成
的结果误差,根据文献[25],不同图像生成场景下需
设置不同的学习率,根据试验结果,在轴承故障诊断
任务中,学习率为 2×10 时,生成器与判别器具有
−4
更好的图像生成效果,LSGAN 中采用的 Adam 优化 图 7 批尺寸大小对模型性能的影响
器的 β 1 设置为 0.5, β 2 设置为 0.999, β 1 和 β 2 分别为一 Fig. 7 Effect of batch size on model performance

