Page 139 - 《振动工程学报》2025年第8期
P. 139

第 8 期              刘  杰,等: 不均衡样本下轴承故障的 LSGAN-Swin Transformer 诊断方法                        1779

              内 圈 故 障(IR)、外 圈 故 障(OR)以 及 滚 动 体 故 障              阶矩和二阶矩估计的指数衰减率。Swin‑T 模型编
             (RE)。选取轴承在 0~3 hp(0~2205 W)负载条件                    程环境为 i7‑8565U CPU,NVIDIA GTX1050Ti,py‑
              下工作时的振动数据,如表 2 所示,在同种故障条件                         thon3.7,Pytorch1.8,模型训练时设置最大迭代次数
              下,根据故障程度分别使用 0.18 代表 0.1778 mm 故                  为 30,学 习 率 为 1×10 ,权 值 衰 减 为 1×10 ,
                                                                                                            −5
                                                                                       −3
              障 深 度 ;0.36 代 表 0.3556 mm 故 障 深 度 ;0.54 代 表       rain_batch_size 与 eval_batch_size 均设置为 8。
              0.5334 mm 故 障 深 度 。 表 2 中 OR0.36 代 表 轴 承 外             为 了 验 证 Swin Transformer 模 型 不 同 学 习 率
              圈 0.3556 mm 故障深度,其他同理。                            在轴承故障诊断任务中的影响,分别尝试设置初始
                            表 2  滚动轴承故障类型                       学习率为 1×10 、1×10 、1×10 ,训练过程中不
                                                                               −4
                                                                                               −2
                                                                                       −3
                       Tab. 2  Fault types of rolling bearing   同学习率设置随迭代次数的变化如图 6 所示。
               标签     负载/W        故障种类          故障深度/mm
                0                  正常(N)             0
                1                内圈(IR0.18)         0.18
                2                内圈(IR0.36)         0.36
                3                内圈(IR0.54)         0.54
                4               外圈(OR0.18)          0.18
                      0~2205
                5               外圈(OR0.36)          0.36
                6               外圈(OR0.54)          0.54
                7               滚动体(RE0.18)         0.18
                8               滚动体(RE0.36)         0.36                    图 6  不同学习率对应损失值
                9               滚动体(RE0.54)         0.54         Fig. 6  Loss values corresponding to different learning rates

                  为了保证单个样本降低数据冗余的同时包含                                训练 开 始 ,初 始 学 习 率 为 1×10 的 损 失 值 迅
                                                                                                  −2
              相 对 较 多 的 故 障 信 息 ,每 类 故 障 状 态 均 通 过 截 取          速 下 降 ,然 而 ,随 着 迭 代 次 数 的 增 加 ,训 练 折 线 的
              1024 个采样点作为一个样本 ,以 30% 的重叠率重                      波 动 幅 度 依 然 较 大 ,且 损 失 值 难 以 收 敛 至 理 想 位
              复采样 400 次,具体操作如图 5 所示,对采集的数据                      置。初始学习率为 1×10 的曲线,最终收敛效果
                                                                                        −4
              样 本 进 行 连 续 小 波 变 换 转 换 为 64×64×3 的 时 频           优于 1×10 的曲线,但波动更为剧烈,且收敛速度
                                                                          −2
              图,每种轴承振动信号类型采集到 400 张图片。                          相对较慢。1×10 对应的损失函数曲线在前期收
                                                                                 −3
                                                                敛速度相对较好,而且没有出现后期上升的现象,
                                                                说明本研究的模型没有发生过拟合。通过验证,初
                                                                始学习率设置为 1×10 是较为合理的。
                                                                                     −3
                                                                     批尺寸大小在轴承故障诊断任务中控制每次
                                                                输入网络进行训练的时频图,由图 7 可知,随着批

                                                                尺寸的增大,模型的故障诊断精度先升高后降低,
                            图 5  重叠采样示意图                        因此本文选择批尺寸的大小为 32。
                  Fig. 5  Schematic diagram of overlapping sampling

              2. 2 试验参数设置

                  试 验 分 为 LSGAN 不 均 衡 样 本 扩 充 和 Swin‑T
              模型故障诊断两个部分。试验中的 GANs 均采用
              RMSProp 方式训练,设置最大迭代次数为 500,且均
              使用相同的网络参数设定,以避免因参数差异造成
              的结果误差,根据文献[25],不同图像生成场景下需
              设置不同的学习率,根据试验结果,在轴承故障诊断
              任务中,学习率为 2×10 时,生成器与判别器具有
                                    −4
              更好的图像生成效果,LSGAN 中采用的 Adam 优化                               图 7  批尺寸大小对模型性能的影响
              器的 β 1 设置为 0.5, β 2 设置为 0.999, β 1 和 β 2 分别为一          Fig. 7  Effect of batch size on model performance
   134   135   136   137   138   139   140   141   142   143   144