Page 153 - 《振动工程学报》2026年第3期
P. 153

第 3 期             王亚萍,等: 多源域下 MAAN 与 MK-MMD 的滚动轴承跨工况复合故障诊断                                 753

                                                                                        s
                                                                                                    t
                                                                       2
                                                                      d k ( p,q )≜ E p [ ϕ( x ) ]- E q [ ϕ( x ) ]  2  (7)
              2 多核最大均值差异                                                                                H k
                                                                式中,E 表示源域样本 x 经特征映射投影到再生核
                                                                希尔伯特空间后的均值;H k 为再生核希尔伯特空间。
              2. 1 最大均值差异
                                                                当且仅当 d k ( p,q )= 0 时,分布 p 和 q 相等。与特征
                                                                           2
                                                                                                    s
                                                                                          s
                                                                                             t
                  最大均值差异(MMD) 早期用于处理样本偏                         映 射 ϕ(⋅) 关 联 的 特 征 核 k ( x ,x )= ϕ( x )⋅ ϕ( x ),在
                                      [14]
                                                                                                          t
              置问题,随着研究的不断发展和深入,MMD 越来越                          这里定义为 m 个不同核的加权和,计算公式为:
              多地应用到迁移学习之中,较好地解决了源域和目                                            m      m
                                                                     K er ≜ { k = ∑  β u k u: ∑ β u = 1,β u ≥ 0,∀u } (8)
              标域样本数据的差异问题。                                                     u = 1   u = 1
                                                          s
                  本 文 主 要 关 注 无 监 督 域 自 适 应 任 务 ,用 D =          式中,m 表示多核注意力中核的数量; β u 表示权重,
                 s  s  M                                  t
              {( x i,y i ) } i = 1 表示来自源域 s 的标注数据集,用 D =        对其施加约束以保证导出的多核 K er 是特征的。多
                  N
              { x j } j = 1 表示来自目标域 t 的未标注数据集,其中, M             核最大均值差异利用不同的核来增强最大均值差
                t
              和 N 分别表示源域和目标域的样本数。MMD 是一                         异 ,从 而 为 MMD 优 化 核 选 择 提 供 了 一 种 原 则 性
              种分布差异的无参估计方法,基于两个分布的期望                            方法。
              在核空间的差异,从而估计两个分布的距离,得到的
              无偏估计为:                                            3 多源域多头注意力自适应网络故障
                                   1  M    1  N         2      诊断模型
                                          s
                         s
                            t
                MMD ( D ,D )=     ∑ ϕ( x i ) -  ∑  ϕ( x j t    )
                     2
                                 M           N         
                                                j = 1
                                    i = 1
                                                         H
                                                        (5)     3. 1 卷积神经网络
              式中, ϕ(⋅) 为将输入数据映射到高维特征空间的函
                                                                     卷积神经网络是一种深度学习模型或类似于人
                       t
                                                         t
                                                      s
                     s
              数; k ( x ,x )表示 ϕ(⋅)对应的核函数,满足 k ( x ,x )=
                                                                工神经网络的多层感知器,常用来分析视觉图像。
                    s
                          t
              < ϕ( x ),ϕ( x )>。                                 典型的 CNN 一般由卷积层、池化层、全连接层堆叠
                               t
                             s
                  核 函 数 k ( x ,x ) 通 常 采 用 L 个 基 准 核 函 数 的      而成,基本结构如图 2 所示。
                  s
                     t
              k l ( x ,x )的凸组合:
                                     L
                             s  t           s  t
                          k ( x ,x )= ∑ β l k l ( x ,x )  (6)
                                    l = 1
              式中, β l 为调整多个基础核函数的参数。
                  基于标准 MMD 度量的域自适应方法假设域间
              有相同的类先验分布,这在实际的故障诊断场景中
              往往无法实现,类比重差异将会导致基于 MMD 的
                                                                               图 2  CNN 结构示意图
              域自适应方法的性能下降。
                                                                       Fig. 2  Schematic diagram of CNN structure
              2. 2 多核最大均值差异
                                                                    (1)卷积层:卷积层是卷积神经网络的核心,卷
                  多核最大均值差异(MK⁃MMD) 是基于原有                        积核对输入信号进行卷积,将结果作为下一层的输
                                               [15]
              的 MMD 发展而来的。MMD 通过使用相同的映射                         入,多个卷积核构成一个卷积层。
              ϕ(⋅)将源域和目标域映射到一个共同的再生核希尔                              (2)激活层:ReLU 激活函数更容易解决梯度消
              伯特空间(reproducing kernel Hilbert space, RKHS)      失问题并有着较高的计算效率,加速了模型的收敛
              中,并对映射后两部分数据的均值差异进行计算,以                           速度,同时避免了饱和性问题。但当 ReLU 函数输
              表示这两部分数据的分布差异。在 MMD 中,核函                          入小于 0 时,函数输出值为 0,神经元不会被激活。
              数是单一且固定的,无法准确求解多源域下的均值                                (3)池化层:在卷积神经网络中,如果卷积层输
              差异。MK⁃MMD 的提出解决了在 MMD 中如何选                        出的特征量过大,就容易导致过拟合现象。池化层
              择最优的核函数的问题,MK⁃MMD 使用多个核来                          能够对卷积层输出的特征进行下采样,降低特征矩
              构建一个总体核。                                          阵的冗余度,缓解网络的过拟合现象。
                  与 MMD 类似,对于两种概率分布 p 和 q,多核                        (4)全连接层:全连接层,也称为密集连接层,其
                             2
              最大均值差异 d k ( p,q ) 定义为 p 和 q 之间的 RKHS             工作原理是使前一层中的每一个神经元与后一层中
              距离,计算公式为:                                         的每一个神经元之间建立连接。
   148   149   150   151   152   153   154   155   156   157   158