Page 103 - 《振动工程学报》2025年第11期

P. 103

第 11 期张宇腾，等：面向不同标签与域配置的统一跨域故障诊断方法 2561

具体而言，在标准分类任务中，通常采用 One- 的温度参数。
hot 编码表示真实标签。标签平滑方法引入一个平通过标签平滑和温度缩放，基于标签平滑的概
滑因子 α，将原始的硬标签向量转换为软概率分布，率校准机制可使预测分布趋于平缓，使易混淆类别
其形式如下所示：的预测概率更贴近真实不确定性水平。上述机制在
{ s
1−α， k = y 跨域场景中尤为重要，由于域间分布差异更易引发
y s,LS = i （2）
i.k α/(K −1)，其他
预测偏差，该机制能使模型在学习过程中更鲁棒地
式中， α为平滑因子； k = 1,2,··· ,K，其中 K 为源域故应对此类潜在预测混淆情形，进而提升模型的跨域
障类总数。
适应能力。

经转换得到的软标签向量将部分概率分配给非
真实类别，既维持了标签监督的主导作用，又为模型 2.3 最小预测类别混淆模块
预留了表达预测不确定性的空间，从而在跨域场景
现有跨域诊断方法多依赖特定的标签或者域配
下可以更真实地反映类别间的混淆关系。基于此，
置假设，因此需针对不同配置场景进行专门设计或
定义标签平滑后的分类损失为：
修改。例如，在不同标签配置下，必须精心设计重加
1 n s ∑ s,LS
s
L LS = l ce (G c (G f (x )),y i ) （3）权策略以排除源域或目标域特有的故障类别 [16] 。在
CE
i
n s
i=1 不同域配置下，有效迁移策略的开发也面临显著挑
式中， l ce 为标准交叉熵损失； x 表示第 i个源样本；
s
i 战。本研究旨在构建一种无需针对特定场景调整模
y s,LS 为对应的平滑软标签。型即可处理多种配置场景的统一跨域诊断方法，以
i
基于标签平滑的概率校准机制鼓励模型考虑其
提高跨域诊断方法的通用性。本质而言，无论标签
他类别的概率，减轻模型过于自信的预测倾向。此
或者域配置如何变化，跨域故障诊断的核心挑战都
外，所提基于标签平滑的概率校准机制通过温度缩
是减小分类器在目标域中的预测偏差。为此，本研
放进一步平滑预测输出，其形式可表示为：
究将 PCC 设计为一种通用归纳偏差，并构建校准策
exp(z k /τ)
ˆ p k = （4）略以准确度量类间混淆倾向，从而在统一框架下适
K ∑
exp(z k ′/τ)
k ′ =1 配多种配置场景下的跨域故障诊断问题。所提预测
式中， ˆ p k 与第 k类的概率相关； τ为控制输出分布锐度类别混淆模块如图 4 所示。

基于原型相似性的判别

特征提取器
ˆ
p ·k'
μ 1 , μ 2 ,···, μ K 预测向量
原型分类器 Softmax 预测鲁棒性 C kk' LS
卷积1&批归一化&ReLU 最大池化卷积2&批归一化&ReLU 最大池化 ... 全连接&ReLU Normalization 特征空间正则化类别相关矩阵不确定性重加权

概率正则化
温度缩放
ˆ
LS
交叉熵抑制过度自信 C kk'
平滑标签
预测类别混淆
基于标签平滑的概率校准

图 4 最小预测类别混淆模块
Fig. 4 The minimum predictive class confusion module

{ } B
记目标域一个批次样本为 X t = x t j j=1 ，原型分类式中， ˆ p ·k 表示批中所有样本中对应于第 k类的预测概
′
[ ] 率向量； ˆ p ·k ′ 表示批中样本对应于第类的预测概率向量。
k
器输出的概率矩阵为 ˆ Y t = ˆp t j,k ∈ R B×K ，其中 ˆ p =
t
j,k
式 (5) 通过计算两组类概率向量的内积量化两
G c,k (G f (x ))表示第 j个目标样本属于第 k个故障类别
t
j
组类概率之间的相关性。 C 取值越高，表明模型越
LS
的预测概率。为了衡量输出概率中的类别混淆强 kk ′
容易混淆第 k类和第类。在进行目标域样本分类
k
′
度，有必要初步估计类与类之间的混淆倾向，计算公
时，模型可能会产生高置信度的误分类，这使得类相
式如下：
关矩阵难以捕捉类别之间真实的混淆关系。本文提
C LS T （5）
kk ′ = ˆ p ˆ p ·k ′ 出的基于原型相似性的故障判别方法和基于标签平
·k

98 99 100 101 102 103 104 105 106 107 108