Page 102 - 《振动工程学报》2025年第11期

P. 102

2560 振动工程学报第 38 卷

特征提取器分类器标签平滑
源域
源域原型分类器 Softmax 温度缩放分类损失
交叉熵
卷积1&批归一化&ReLU 最大池化卷积2&批归一化&ReLU 最大池化 ... 自适应平均池化全连接&ReLU Normalization 输出概率
...
平滑标签

目标域卷积4&批归一化&ReLU C kk '
ˆ LS
目标域不确定性 PCC损失

重加权
...
预测类别混淆

图 2 统一跨域故障诊断方法原理图
Fig. 2 Schematic diagram of unified cross-domain fault diagnostic method
的统一偏置，为不同标签与域配置场景下的有效跨分类器的无偏权重集合，可视为对应类别在特征空
域迁移诊断提供核心支撑。间中的中心表示。采用神经网络线性层参数能够直

接定义原型，无需额外引入新的参数去单独存储或
2.1 基于原型相似性的故障判别模块
更新原型。在有监督训练阶段，故障原型的更新与
所提方法旨在最小化分类器在目标域的预测偏常规分类层权重训练过程一致，优化目标是最小化
差，且自适应地适配多种跨域诊断场景。然而，传统交叉熵损失。原型学习过程如图 3 所示，模型鼓励
的分类过程遵循纯判别范式，依赖于样本特征与类各类别原型 µ i 在特征空间中与源域中相应类别的样
别标签间的直接映射进行分类预测 [15] 。在域间分布本 x i 的映射紧密对齐，从而促使类内样本形成紧凑
f i
差异条件下，该范式对类内分布偏移的鲁棒性较差，聚类，提升分类的鲁棒性。
进而影响 PCC 的准确估计。为解决这一问题，本文
设计基于原型相似性的故障判别方法，用于构建更 x i 特征 μ i f i
符合实际的预测概率分布，以真实反映类混淆倾提取器
向。所提方法集成样本与故障原型之间的相似性信
息以及标签信息，学习具有判别性的类别特征，从而图 3 原型学习过程
Fig. 3 Prototype learning process
显著提升故障分类性能。
具体而言，该判别框架由两个主要组件构成：特
2.2 基于标签平滑的概率校准机制
征提取器 G f 与原型分类器 G c 。特征提取器采用典型
的卷积结构，在最后输出层后嵌入归一化层以规范尽管基于原型相似性的故障判别方法提升了预
/
化特征向量，其归一化特征可以表示为 f = G f (x)
G f (x)
。测类别混淆偏差的可靠性，但由监督训练引入的过

原型分类器 G c 则定义为 W G c = [µ 1 ,µ 2 ,··· ,µ K ]，其中度自信偏差仍可能会削弱真实类混淆倾向。
µ k 为无偏权重向量，表示第 k个故障类别的原型。对具体而言，传统的 One-hot 标签编码方式通过硬
于归一化后的特征向量 f ，分类器通过内积操作约束迫使模型将全部预测概率赋予真实类别，同时
W f 计算该特征与所有类别原型之间的相似度分将其他类别的概率压制为 0。上述硬标签监督限制
T
G c
数。最终，通过 Softmax 函数得到类别概率分布，其了模型对预测不确定性的表达能力，降低了 PCC 的
过程可表示为：精确性。在跨域故障诊断场景中，仅采用有标记源
exp(z k ) 域数据训练的分类模型，对目标域样本往往会产生
ˆ p k = （1）
过度自信的预测结果，难以有效体现对未知样本或
K ∑
exp(z k ′)
分布外样本的不确定性判断。更重要的是，在该训
k ′ =1
式中， ˆ p k 表示样本属于第 k 类的概率； K为源故障类练范式下，构建类混淆矩阵所需的非零类别概率值
总数； z 表示原型分类器的输出， z = G c (G f (x)) z k 和被过度压制，导致对类间真实混淆关系的低估。
，
z k ′ 分别表示 z向量中对应第 k类和第类的元素。为此，本文设计了一种基于标签平滑的概率校
k
′
原型分类器中，故障原型 [µ 1 ,µ 2 ,··· ,µ K ]通过神经准机制。该机制通过将真实标签的硬目标转化为软
网络的线性层直接定义，每个原型向量的维度与特目标，可有效抑制模型对训练数据的过拟合倾向，并
征提取器输出的隐藏特征维度一致。原型本质上是缓解预测过程中的过度自信问题。

97 98 99 100 101 102 103 104 105 106 107