Page 137 - 《振动工程学报》2025年第8期
P. 137

第 8 期              刘  杰,等: 不均衡样本下轴承故障的 LSGAN-Swin Transformer 诊断方法                        1777

              解决梯度消失的问题,MAO 等             [19] 提出使用最小二          生 成 数 据 的 质 量 ,从 而 保 证 在 数 据 不 均 衡 条 件 下
              乘损失函数替代交叉熵损失函数的 LSGAN 模型,                         LSGAN 能够有效扩充数据样本,提高样本不均衡
              使得 GAN 的训练过程更加稳定的同时具有更快的                          条件下轴承故障诊断的准确率。
              收敛速度,得到更高质量的生成数据。
                                                                1. 2 Swin Transformer 网络模型
                  LSGAN 的目标函数表示为:
                 ì                1                   2              Swin Transformer 模 型 利 用 滑 动 窗 口 、层 级 设
                 ï ï min V LSGAN( ) =
                 ï  D        D    2  E x ∼ P data( )( D ( ) x - b ) +  计 的 优 势 ,使 Transformer 从 语 言 适 应 应 用 至 视 觉
                                          x
                 ï
                 ï
                 ï
                 ï ï
                         1
                 í                E z ∼ P z( ) z ( D( G ( ) z  ) -  ) a  2  (2)  方 面 成 为 可 能 [20‑21] 。 在 本 文 的 故 障 诊 断 研 究 中 ,
                 ï ï     2
                 ï                                              Swin Transformer 诊 断 模 型 的 总 体 框 架 如 图 1 所
                 ï
                 ï                1                     2
                             G
                 ï min V LSGAN( ) =  2  E z ∼ P G( ) z ( D( G ( ) z  ) -  ) c  示,主要由修补分区层、层叠模块、归一化层、全局
                 ï ï
                 î
                    G
              式 中 ,V LSGAN( D) 和V LSGAN(G) 分 别 为 LSGAN 判 别      池化层以及全连接层组成。
              器和生成器的目标函数;P G (z)表示真实数据分布;                            通过连续小波变换将振动信号转变为 RGB 三
              a 为生成数据标签;b 为真实样本标签;c 为判别生                        通道的时频图,将大小为[H, W, C]的时频图输入
              成数据为真的期望。为了使生 成 数 据 与 真 实 数 据                     模型中大小为 4×4 相邻像素的补丁分区模块中进行
              样 本 的 分 布 无 限 接 近 ,设 定 b=c,a=0,代 入 LS‑            分 块 ,通 过 展 平 操 作 ,图 像 大 小 变 为[H/4, W/4,
              GAN 的目标函数中可得:                                     16C],依次经历 4 个层叠模块 Stage 对输入时频图的
                 ì                1                   2         分辨率进行压缩,网络模型使用窗口多头自注意结
                             D
                 ï
                 ï ï min V LSGAN( ) =  2  E x ∼ P data( )( D ( ) x - 1 ) +  构 W‑MSA(window  multi‑head  self‑attention)和 移
                                          x
                 ï
                    D
                 ï
                 ï
                 ï ï
                          1
                 í                 E z ∼ P z( ) z ( D( G ( ) z  ) )  2  (3)  位 窗 口 多 头 自 注 意 结 构 SW‑MSA(shifted window
                 ï ï      2
                 ï                                              multi‑head self‑attention)两种旋转转换块结构。模
                 ï
                 ï                1                     2
                             G
                 ï min V LSGAN( ) =  2  E z ∼ P G( ) z ( D( G ( ) z  ) -  ) 1  型层叠模块 Stage1 中具有 1 个线性嵌入,层叠模块
                 ï ï
                 î
                    G
                  在 LSGAN 中,在生成器 G 中加入 dropout 层防               Stage2 至 层 叠 模 块 Stage4 中 各 含 有 1 个 补 丁 合 并
              止参数过多影响网络判别效果,避免小样本训练过                            层 。 其 中 Stage1 至 Stage4 中 分 别 包 含 2、2、6、2 个
              程中发生过拟合现象,判别器 D 通过最小二乘损失                          Swin Transformer Blocks。
              函数,使生成数据样本通过不断迭代训练逐渐尽可                                 移动窗口多注意力机制包含 MSA(multi‑head
              能地接近真实样本数据的空间分布,二者均会提高                            self‑attention)结 构 、W‑MSA 结 构 和 SW‑MSA 结






















              注:  H 和 W 分别表示时频图的高度和宽度;C 表示时频图维度;LN 为归一化层;MLP 为多层感知器;Stage1 至 Stage4 为层叠模块;Swin
                                                                                  l
                                                                                                     l
                 Transformer blocks 为 LN、W-MSA、SW-MSA、MLP 和移位窗口多头自注意结构组成的模块;z 为 MLP 模块的输出特性; z ̂ 为 W-MSA 模
                 块的输出特性。
                                          图 1  LSGAN-Swin Transformer 诊断模型总体框架
                                 Fig. 1  General framework of the LSGAN-Swin Transformer diagnosis model
   132   133   134   135   136   137   138   139   140   141   142