Page 103 - 《振动工程学报》2025年第11期
P. 103

第 11 期                  张宇腾,等:面向不同标签与域配置的统一跨域故障诊断方法                                        2561

                  具体而言,在标准分类任务中,通常采用                    One-    的温度参数。
              hot 编码表示真实标签。标签平滑方法引入一个平                              通过标签平滑和温度缩放,基于标签平滑的概
              滑因子   α,将原始的硬标签向量转换为软概率分布,                        率校准机制可使预测分布趋于平缓,使易混淆类别
              其形式如下所示:                                          的预测概率更贴近真实不确定性水平。上述机制在
                               {            s
                                 1−α, k = y                     跨域场景中尤为重要,由于域间分布差异更易引发
                          y  s,LS  =        i          (2)
                           i.k   α/(K −1),其他
                                                                预测偏差,该机制能使模型在学习过程中更鲁棒地
              式中,   α为平滑因子;      k = 1,2,··· ,K,其中  K  为源域故     应对此类潜在预测混淆情形,进而提升模型的跨域
              障类总数。
                                                                适应能力。

                  经转换得到的软标签向量将部分概率分配给非
              真实类别,既维持了标签监督的主导作用,又为模型                           2.3    最小预测类别混淆模块
              预留了表达预测不确定性的空间,从而在跨域场景
                                                                    现有跨域诊断方法多依赖特定的标签或者域配
              下可以更真实地反映类别间的混淆关系。基于此,
                                                                置假设,因此需针对不同配置场景进行专门设计或
              定义标签平滑后的分类损失为:
                                                                修改。例如,在不同标签配置下,必须精心设计重加
                              1  n s ∑         s,LS
                                           s
                         L LS  =   l ce (G c (G f (x )),y i  )  (3)  权策略以排除源域或目标域特有的故障类别                [16] 。在
                          CE
                                           i
                              n s
                                i=1                             不同域配置下,有效迁移策略的开发也面临显著挑
              式 中,  l ce 为 标 准 交 叉 熵 损 失 ;  x 表 示 第  i个 源 样 本 ;
                                          s
                                          i                     战。本研究旨在构建一种无需针对特定场景调整模
              y s,LS 为对应的平滑软标签。                                 型即可处理多种配置场景的统一跨域诊断方法,以
               i
                  基于标签平滑的概率校准机制鼓励模型考虑其
                                                                提高跨域诊断方法的通用性。本质而言,无论标签
              他类别的概率,减轻模型过于自信的预测倾向。此
                                                                或者域配置如何变化,跨域故障诊断的核心挑战都
              外,所提基于标签平滑的概率校准机制通过温度缩
                                                                是减小分类器在目标域中的预测偏差。为此,本研
              放进一步平滑预测输出,其形式可表示为:
                                                                究将   PCC  设计为一种通用归纳偏差,并构建校准策
                                    exp(z k /τ)
                              ˆ p k =                  (4)      略以准确度量类间混淆倾向,从而在统一框架下适
                                   K ∑
                                     exp(z k ′/τ)
                                  k ′ =1                        配多种配置场景下的跨域故障诊断问题。所提预测
              式中,   ˆ p k 与第  k类的概率相关;  τ为控制输出分布锐度              类别混淆模块如图         4  所示。

                                                          基于原型相似性的判别

                               特征提取器
                                                                                              ˆ
                                                                                              p ·k'
                                                                 μ 1 , μ 2 ,···, μ K  预测向量
                                                   原型分类器  Softmax              预测鲁棒性         C kk' LS
                          卷积1&批归一化&ReLU  最大池化  卷积2&批归一化&ReLU  最大池化  ...  全连接&ReLU  Normalization  特征空间正则化  类别相关矩阵  不确定性重  加权

                                                                概率正则化
                                                       温度缩放
                                                                                             ˆ
                                                                                              LS
                                                       交叉熵                    抑制过度自信         C kk'
                                                   平滑标签
                                                                                    预测类别混淆
                                                         基于标签平滑的概率校准

                                                   图 4 最小预测类别混淆模块
                                          Fig. 4 The minimum predictive class confusion module

                                             { } B
                  记目标域一个批次样本为             X t = x t j  j=1 ,原型分类  式中,  ˆ p ·k 表示批中所有样本中对应于第        k类的预测概
                                                                                              ′
                                       [   ]                    率向量;   ˆ p ·k ′ 表示批中样本对应于第 类的预测概率向量。
                                                                                             k
              器 输 出 的 概 率 矩 阵 为     ˆ Y t = ˆp t j,k  ∈ R B×K  , 其 中  ˆ p =
                                                         t
                                                         j,k
                                                                    式  (5) 通过计算两组类概率向量的内积量化两
              G c,k (G f (x ))表示第  j个目标样本属于第    k个故障类别
                     t
                      j
                                                                组类概率之间的相关性。            C 取值越高,表明模型越
                                                                                         LS
              的预测概率。为了衡量输出概率中的类别混淆强                                                      kk ′
                                                                容易混淆第      k类和第 类。在进行目标域样本分类
                                                                                   k
                                                                                    ′
              度,有必要初步估计类与类之间的混淆倾向,计算公
                                                                时,模型可能会产生高置信度的误分类,这使得类相
              式如下:
                                                                关矩阵难以捕捉类别之间真实的混淆关系。本文提
                                C LS   T               (5)
                                  kk ′ = ˆ p ˆ p ·k ′           出的基于原型相似性的故障判别方法和基于标签平
                                       ·k
   98   99   100   101   102   103   104   105   106   107   108