Page 165 - 《振动工程学报》2026年第3期

P. 165

第 3 期孟祥恒，等：自编码器在机械设备未知故障检测中的应用 765

图 1 MDAEC 模型
Fig. 1 MDAEC model

用每一类样本的特征单独训练各自的解码器，并计网络重构能力的同时学习不同类型样本之间的差
算相应的重构误差阈值。异，使得中间隐藏层输出的特征不仅包含样本信息
（1）将全部的训练数据 X =( x 1，x 2，…，x N) 输还包含不同类型样本之间的差异信息。

入模型中，此时通过解码器会得到训练数据的重构（2）将全部的已知样本输入训练好的编码器模型
̂
样本 X =( x ̂ ，x ̂ ，…，x ̂ N)，其中 N 为训练数据的总中，此时会在中间隐藏层得到全部样本的低维特征，之
2
1
数，为了使得重构样本在训练过程中不断接近输入后将这些数据按照对应的样本标签分成 n组，其中第 k
样本，从而提高编码器的特征提取能力，采用均方误组低维特征对应的训练样本为 X k =( x 1，x 2，…，x N k)，
差损失函数作为重构损失： N k 为第 k 组的训练样本的个数，每一组的数据属于同
1 N
J M = ∑ ( x i - x ̂ ) 2 （1）一个类别。现有的基于自编码器的异常检测方法只
i
N
i = 1
能在已知正常样本的情况下，通过对神经网络的训
此外，编码器输出的低维特征通过分类器会得
［15］
练，使用重构误差来判断异常样本，然而当已知样本
̂
到训练数据的预测标签 Y =( y ̂ ，y ̂ ，…，y ̂ N)。为了
1
的类型有多种时，在自编码器的训练过程中，神经网
2
提高分类器的分类能力以及编码器对不同类别样本
络的泛化能力会不断加强，这种泛化能力会将未知故
的特征提取能力，采用交叉熵损失函数作为模型的
障样本错误地识别为已知样本，为了降低解码器的泛
分类损失：
化能力，提高网络的未知故障检测能力，使用每一类
1 N n
J C =- ∑∑ y ic lg p ic （2）型数据训练各自的解码器，此时相对应的第二阶段训
N
i = 1 c = 1
练的损失函数可以表示为：
式中， y ic 表示第 i 个输入样本是否为第 c 类，是第 c 类
1 N k P k
k
2
时值为 1，不是时值为 0； p ic 表示第 i 个输入样本是第 J 2 = ∑ ( x i - x ̂ ) + ξ k∑ w kp 2 （4）
i
p = 1
N k i = 1
c 类的概率； n 为已知样本的类别数。
k
式中， J 2 表示在训练的第二阶段第 k 组训练样本训
因此，综合考虑已知样本的重构损失以及分类
练解码器 k 的损失函数； ξ k 为训练解码器 k 时的正则
损失，在训练的第一阶段损失函数可以表示为：
P 化系数； P k 为解码器 k 中的参数总数； w kp 为解码器 k
J 1 = J M + λJ C + ξ ∑ w p 2 （3）中的第 p 个参数。
p = 1
式中， λ 为分类损失的权重系数；为了防止过拟合，当解码器 k 训练完毕后，将第 k 组低维特征作为
在损失函数中加入了 L2 正则化项， ξ 为正则化系数；解码器 k 的输入，此时会得到训练数据所对应的重
̂
P 为网络中参数的总数； w p 为网络中的第 p 个参数。构样本 X k =( x ̂ ，x ̂ ，…，x ̂ N k)，因此第 i 个输入样本的
1
2
通过设置均方误差和交叉熵损失函数，可以在训练重构误差可以表示为：

160 161 162 163 164 165 166 167 168 169 170