Page 102 - 《振动工程学报》2025年第11期
P. 102
2560 振 动 工 程 学 报 第 38 卷
特征提取器 分类器 标签平滑
源 域
源 域 原型分类器 Softmax 温度缩放 分类损失
交叉熵
卷积1&批归一化&ReLU 最大池化 卷积2&批归一化&ReLU 最大池化 ... 自适应平均池化 全连接&ReLU Normalization 输出概率
...
平滑标签
目 标 域 卷积4&批归一化&ReLU C kk '
ˆ LS
目 标 域 不确定性 PCC损失
重加权
...
预测类别混淆
图 2 统一跨域故障诊断方法原理图
Fig. 2 Schematic diagram of unified cross-domain fault diagnostic method
的统一偏置,为不同标签与域配置场景下的有效跨 分类器的无偏权重集合,可视为对应类别在特征空
域迁移诊断提供核心支撑。 间中的中心表示。采用神经网络线性层参数能够直
接定义原型,无需额外引入新的参数去单独存储或
2.1 基于原型相似性的故障判别模块
更新原型。在有监督训练阶段,故障原型的更新与
所提方法旨在最小化分类器在目标域的预测偏 常规分类层权重训练过程一致,优化目标是最小化
差,且自适应地适配多种跨域诊断场景。然而,传统 交叉熵损失。原型学习过程如图 3 所示,模型鼓励
的分类过程遵循纯判别范式,依赖于样本特征与类 各类别原型 µ i 在特征空间中与源域中相应类别的样
别标签间的直接映射进行分类预测 [15] 。在域间分布 本 x i 的映射 紧密对齐,从而促使类内样本形成紧凑
f i
差异条件下,该范式对类内分布偏移的鲁棒性较差, 聚类,提升分类的鲁棒性。
进而影响 PCC 的准确估计。为解决这一问题,本文
设计基于原型相似性的故障判别方法,用于构建更 x i 特征 μ i f i
符 合 实 际 的 预 测 概 率 分 布, 以 真 实 反 映 类 混 淆 倾 提取器
向。所提方法集成样本与故障原型之间的相似性信
息以及标签信息,学习具有判别性的类别特征,从而 图 3 原型学习过程
Fig. 3 Prototype learning process
显著提升故障分类性能。
具体而言,该判别框架由两个主要组件构成:特
2.2 基于标签平滑的概率校准机制
征提取器 G f 与原型分类器 G c 。特征提取器采用典型
的卷积结构,在最后输出层后嵌入归一化层以规范 尽管基于原型相似性的故障判别方法提升了预
/
化特征向量,其归一化特征可以表示为 f = G f (x)
G f (x)
。 测类别混淆偏差的可靠性,但由监督训练引入的过
原 型 分 类 器 G c 则 定 义 为 W G c = [µ 1 ,µ 2 ,··· ,µ K ], 其 中 度自信偏差仍可能会削弱真实类混淆倾向。
µ k 为无偏权重向量,表示第 k个故障类别的原型。对 具体而言,传统的 One-hot 标签编码方式通过硬
于 归 一 化 后 的 特 征 向 量 f , 分 类 器 通 过 内 积 操 作 约束迫使模型将全部预测概率赋予真实类别,同时
W f 计算该特征与所有类别原型之间的相似度分 将其他类别的概率压制为 0。上述硬标签监督限制
T
G c
数。最终,通过 Softmax 函数得到类别概率分布,其 了模型对预测不确定性的表达能力,降低了 PCC 的
过程可表示为: 精确性。在跨域故障诊断场景中,仅采用有标记源
exp(z k ) 域数据训练的分类模型,对目标域样本往往会产生
ˆ p k = (1)
过度自信的预测结果,难以有效体现对未知样本或
K ∑
exp(z k ′)
分布外样本的不确定性判断。更重要的是,在该训
k ′ =1
式中, ˆ p k 表示样本属于第 k 类的概率; K为源故障类 练范式下,构建类混淆矩阵所需的非零类别概率值
总 数; z 表 示 原 型 分 类 器 的 输 出 , z = G c (G f (x)) z k 和 被过度压制,导致对类间真实混淆关系的低估。
,
z k ′ 分别表示 z向量中对应第 k类和第 类的元素。 为此,本文设计了一种基于标签平滑的概率校
k
′
原型分类器中,故障原型 [µ 1 ,µ 2 ,··· ,µ K ]通过神经 准机制。该机制通过将真实标签的硬目标转化为软
网络的线性层直接定义,每个原型向量的维度与特 目标,可有效抑制模型对训练数据的过拟合倾向,并
征提取器输出的隐藏特征维度一致。原型本质上是 缓解预测过程中的过度自信问题。

