Page 165 - 《振动工程学报》2026年第3期
P. 165
第 3 期 孟祥恒,等: 自编码器在机械设备未知故障检测中的应用 765
图 1 MDAEC 模型
Fig. 1 MDAEC model
用每一类样本的特征单独训练各自的解码器,并计 网络重构能力的同时学习不同类型样本之间的差
算相应的重构误差阈值。 异,使得中间隐藏层输出的特征不仅包含样本信息
(1) 将 全 部 的 训 练 数 据 X =( x 1,x 2,…,x N) 输 还包含不同类型样本之间的差异信息。
入模型中,此时通过解码器会得到训练数据的重构 (2) 将全部的已知样本输入训练好的编码器模型
̂
样 本 X =( x ̂ ,x ̂ ,…,x ̂ N),其 中 N 为 训 练 数 据 的 总 中,此时会在中间隐藏层得到全部样本的低维特征,之
2
1
数,为了使得重构样本在训练过程中不断接近输入 后将这些数据按照对应的样本标签分成 n组,其中第 k
样本,从而提高编码器的特征提取能力,采用均方误 组低维特征对应的训练样本为 X k =( x 1,x 2,…,x N k),
差损失函数作为重构损失: N k 为第 k 组的训练样本的个数,每一组的数据属于同
1 N
J M = ∑ ( x i - x ̂ ) 2 (1) 一个类别。现有的基于自编码器的异常检测方法只
i
N
i = 1
能在已知正常样本的情况下,通过对神经网络的训
此外,编码器输出的低维特征通过分类器会得
[15]
练,使用重构误差来判断异常样本 ,然而当已知样本
̂
到训练数据的预测标签 Y =( y ̂ ,y ̂ ,…,y ̂ N)。为了
1
的类型有多种时,在自编码器的训练过程中,神经网
2
提高分类器的分类能力以及编码器对不同类别样本
络的泛化能力会不断加强,这种泛化能力会将未知故
的特征提取能力,采用交叉熵损失函数作为模型的
障样本错误地识别为已知样本,为了降低解码器的泛
分类损失:
化能力,提高网络的未知故障检测能力,使用每一类
1 N n
J C =- ∑∑ y ic lg p ic (2) 型数据训练各自的解码器,此时相对应的第二阶段训
N
i = 1 c = 1
练的损失函数可以表示为:
式中, y ic 表示第 i 个输入样本是否为第 c 类,是第 c 类
1 N k P k
k
2
时值为 1,不是时值为 0; p ic 表示第 i 个输入样本是第 J 2 = ∑ ( x i - x ̂ ) + ξ k∑ w kp 2 (4)
i
p = 1
N k i = 1
c 类的概率; n 为已知样本的类别数。
k
式中, J 2 表示在训练的第二阶段第 k 组训练样本训
因此,综合考虑已知样本的重构损失以及分类
练解码器 k 的损失函数; ξ k 为训练解码器 k 时的正则
损失,在训练的第一阶段损失函数可以表示为:
P 化系数; P k 为解码器 k 中的参数总数; w kp 为解码器 k
J 1 = J M + λJ C + ξ ∑ w p 2 (3) 中的第 p 个参数。
p = 1
式中, λ 为分类损失的权重系数;为了防止过拟合, 当解码器 k 训练完毕后,将第 k 组低维特征作为
在损失函数中加入了 L2 正则化项, ξ 为正则化系数; 解码器 k 的输入,此时会得到训练数据所对应的重
̂
P 为网络中参数的总数; w p 为网络中的第 p 个参数。 构样本 X k =( x ̂ ,x ̂ ,…,x ̂ N k),因此第 i 个输入样本的
1
2
通过设置均方误差和交叉熵损失函数,可以在训练 重构误差可以表示为:

