Page 103 - 《振动工程学报》2025年第11期
P. 103
第 11 期 张宇腾,等:面向不同标签与域配置的统一跨域故障诊断方法 2561
具体而言,在标准分类任务中,通常采用 One- 的温度参数。
hot 编码表示真实标签。标签平滑方法引入一个平 通过标签平滑和温度缩放,基于标签平滑的概
滑因子 α,将原始的硬标签向量转换为软概率分布, 率校准机制可使预测分布趋于平缓,使易混淆类别
其形式如下所示: 的预测概率更贴近真实不确定性水平。上述机制在
{ s
1−α, k = y 跨域场景中尤为重要,由于域间分布差异更易引发
y s,LS = i (2)
i.k α/(K −1),其他
预测偏差,该机制能使模型在学习过程中更鲁棒地
式中, α为平滑因子; k = 1,2,··· ,K,其中 K 为源域故 应对此类潜在预测混淆情形,进而提升模型的跨域
障类总数。
适应能力。
经转换得到的软标签向量将部分概率分配给非
真实类别,既维持了标签监督的主导作用,又为模型 2.3 最小预测类别混淆模块
预留了表达预测不确定性的空间,从而在跨域场景
现有跨域诊断方法多依赖特定的标签或者域配
下可以更真实地反映类别间的混淆关系。基于此,
置假设,因此需针对不同配置场景进行专门设计或
定义标签平滑后的分类损失为:
修改。例如,在不同标签配置下,必须精心设计重加
1 n s ∑ s,LS
s
L LS = l ce (G c (G f (x )),y i ) (3) 权策略以排除源域或目标域特有的故障类别 [16] 。在
CE
i
n s
i=1 不同域配置下,有效迁移策略的开发也面临显著挑
式 中, l ce 为 标 准 交 叉 熵 损 失 ; x 表 示 第 i个 源 样 本 ;
s
i 战。本研究旨在构建一种无需针对特定场景调整模
y s,LS 为对应的平滑软标签。 型即可处理多种配置场景的统一跨域诊断方法,以
i
基于标签平滑的概率校准机制鼓励模型考虑其
提高跨域诊断方法的通用性。本质而言,无论标签
他类别的概率,减轻模型过于自信的预测倾向。此
或者域配置如何变化,跨域故障诊断的核心挑战都
外,所提基于标签平滑的概率校准机制通过温度缩
是减小分类器在目标域中的预测偏差。为此,本研
放进一步平滑预测输出,其形式可表示为:
究将 PCC 设计为一种通用归纳偏差,并构建校准策
exp(z k /τ)
ˆ p k = (4) 略以准确度量类间混淆倾向,从而在统一框架下适
K ∑
exp(z k ′/τ)
k ′ =1 配多种配置场景下的跨域故障诊断问题。所提预测
式中, ˆ p k 与第 k类的概率相关; τ为控制输出分布锐度 类别混淆模块如图 4 所示。
基于原型相似性的判别
特征提取器
ˆ
p ·k'
μ 1 , μ 2 ,···, μ K 预测向量
原型分类器 Softmax 预测鲁棒性 C kk' LS
卷积1&批归一化&ReLU 最大池化 卷积2&批归一化&ReLU 最大池化 ... 全连接&ReLU Normalization 特征空间正则化 类别相关矩阵 不确定性重 加权
概率正则化
温度缩放
ˆ
LS
交叉熵 抑制过度自信 C kk'
平滑标签
预测类别混淆
基于标签平滑的概率校准
图 4 最小预测类别混淆模块
Fig. 4 The minimum predictive class confusion module
{ } B
记目标域一个批次样本为 X t = x t j j=1 ,原型分类 式中, ˆ p ·k 表示批中所有样本中对应于第 k类的预测概
′
[ ] 率向量; ˆ p ·k ′ 表示批中样本对应于第 类的预测概率向量。
k
器 输 出 的 概 率 矩 阵 为 ˆ Y t = ˆp t j,k ∈ R B×K , 其 中 ˆ p =
t
j,k
式 (5) 通过计算两组类概率向量的内积量化两
G c,k (G f (x ))表示第 j个目标样本属于第 k个故障类别
t
j
组类概率之间的相关性。 C 取值越高,表明模型越
LS
的预测概率。为了衡量输出概率中的类别混淆强 kk ′
容易混淆第 k类和第 类。在进行目标域样本分类
k
′
度,有必要初步估计类与类之间的混淆倾向,计算公
时,模型可能会产生高置信度的误分类,这使得类相
式如下:
关矩阵难以捕捉类别之间真实的混淆关系。本文提
C LS T (5)
kk ′ = ˆ p ˆ p ·k ′ 出的基于原型相似性的故障判别方法和基于标签平
·k

