Page 102 - 《振动工程学报》2025年第11期
P. 102

2560                               振     动     工     程     学     报                     第 38 卷


                                               特征提取器                   分类器              标签平滑
                       源 域
                         源 域                                           原型分类器  Softmax       温度缩放         分类损失
                                                                                            交叉熵
                                        卷积1&批归一化&ReLU  最大池化  卷积2&批归一化&ReLU  最大池化  ...  自适应平均池化  全连接&ReLU  Normalization  输出概率
                           ...
                                                                                       平滑标签

                      目 标 域                           卷积4&批归一化&ReLU                             C kk '
                                                                                                 ˆ LS
                        目 标 域                                                       不确定性                 PCC损失

                                                                                     重加权
                           ...
                                                                                       预测类别混淆

                                                图 2 统一跨域故障诊断方法原理图
                                   Fig. 2 Schematic diagram of unified cross-domain fault diagnostic method
              的统一偏置,为不同标签与域配置场景下的有效跨                            分类器的无偏权重集合,可视为对应类别在特征空
              域迁移诊断提供核心支撑。                                      间中的中心表示。采用神经网络线性层参数能够直

                                                                接定义原型,无需额外引入新的参数去单独存储或
              2.1    基于原型相似性的故障判别模块
                                                                更新原型。在有监督训练阶段,故障原型的更新与
                  所提方法旨在最小化分类器在目标域的预测偏                          常规分类层权重训练过程一致,优化目标是最小化
              差,且自适应地适配多种跨域诊断场景。然而,传统                           交叉熵损失。原型学习过程如图                 3  所示,模型鼓励
              的分类过程遵循纯判别范式,依赖于样本特征与类                            各类别原型      µ i 在特征空间中与源域中相应类别的样
              别标签间的直接映射进行分类预测                 [15] 。在域间分布       本 x i 的映射 紧密对齐,从而促使类内样本形成紧凑
                                                                           f i
              差异条件下,该范式对类内分布偏移的鲁棒性较差,                           聚类,提升分类的鲁棒性。
              进而影响     PCC  的准确估计。为解决这一问题,本文
              设计基于原型相似性的故障判别方法,用于构建更                                       x i        特征         μ i  f i
              符 合 实 际 的 预 测 概 率 分 布, 以 真 实 反 映 类 混 淆 倾                               提取器
              向。所提方法集成样本与故障原型之间的相似性信
              息以及标签信息,学习具有判别性的类别特征,从而                                           图 3 原型学习过程
                                                                           Fig. 3 Prototype learning process
              显著提升故障分类性能。
                  具体而言,该判别框架由两个主要组件构成:特
                                                                2.2    基于标签平滑的概率校准机制
              征提取器    G f 与原型分类器     G c 。特征提取器采用典型
              的卷积结构,在最后输出层后嵌入归一化层以规范                                尽管基于原型相似性的故障判别方法提升了预
                                                    /
              化特征向量,其归一化特征可以表示为              f = G f (x) 
G f (x)
。  测类别混淆偏差的可靠性,但由监督训练引入的过


              原 型 分 类 器  G c 则 定 义 为  W G c  = [µ 1 ,µ 2 ,··· ,µ K ], 其 中  度自信偏差仍可能会削弱真实类混淆倾向。
              µ k 为无偏权重向量,表示第         k个故障类别的原型。对                   具体而言,传统的        One-hot 标签编码方式通过硬
              于 归 一 化 后 的 特 征 向 量    f , 分 类 器 通 过 内 积 操 作      约束迫使模型将全部预测概率赋予真实类别,同时
              W f 计算该特征与所有类别原型之间的相似度分                           将其他类别的概率压制为             0。上述硬标签监督限制
                T
                G c
              数。最终,通过       Softmax  函数得到类别概率分布,其               了模型对预测不确定性的表达能力,降低了                     PCC  的
              过程可表示为:                                           精确性。在跨域故障诊断场景中,仅采用有标记源
                                    exp(z k )                   域数据训练的分类模型,对目标域样本往往会产生
                               ˆ p k =                 (1)
                                                                过度自信的预测结果,难以有效体现对未知样本或
                                    K ∑
                                      exp(z k ′)
                                                                分布外样本的不确定性判断。更重要的是,在该训
                                   k ′ =1
              式中,   ˆ p k 表示样本属于第    k 类的概率;    K为源故障类          练范式下,构建类混淆矩阵所需的非零类别概率值
              总 数; z 表 示 原 型 分 类 器 的 输 出 ,   z = G c (G f (x)) z k 和  被过度压制,导致对类间真实混淆关系的低估。
                                                       ,
              z k ′ 分别表示 z向量中对应第      k类和第 类的元素。                    为此,本文设计了一种基于标签平滑的概率校
                                             k
                                              ′
                  原型分类器中,故障原型           [µ 1 ,µ 2 ,··· ,µ K ]通过神经  准机制。该机制通过将真实标签的硬目标转化为软
              网络的线性层直接定义,每个原型向量的维度与特                            目标,可有效抑制模型对训练数据的过拟合倾向,并
              征提取器输出的隐藏特征维度一致。原型本质上是                            缓解预测过程中的过度自信问题。
   97   98   99   100   101   102   103   104   105   106   107