Page 165 - 《振动工程学报》2026年第3期
P. 165

第 3 期                    孟祥恒,等: 自编码器在机械设备未知故障检测中的应用                                        765































                                                       图 1  MDAEC 模型
                                                     Fig. 1  MDAEC model

              用每一类样本的特征单独训练各自的解码器,并计                            网络重构能力的同时学习不同类型样本之间的差
              算相应的重构误差阈值。                                       异,使得中间隐藏层输出的特征不仅包含样本信息
                 (1) 将 全 部 的 训 练 数 据 X =( x 1,x 2,…,x N) 输      还包含不同类型样本之间的差异信息。

              入模型中,此时通过解码器会得到训练数据的重构                                (2) 将全部的已知样本输入训练好的编码器模型
                    ̂
              样 本 X =( x ̂ ,x ̂ ,…,x ̂ N),其 中 N 为 训 练 数 据 的 总   中,此时会在中间隐藏层得到全部样本的低维特征,之
                            2
                         1
              数,为了使得重构样本在训练过程中不断接近输入                            后将这些数据按照对应的样本标签分成 n组,其中第 k
              样本,从而提高编码器的特征提取能力,采用均方误                           组低维特征对应的训练样本为 X k =( x 1,x 2,…,x N k),
              差损失函数作为重构损失:                                      N k 为第 k 组的训练样本的个数,每一组的数据属于同
                                 1  N
                            J M =  ∑  ( x i - x ̂ ) 2   (1)     一个类别。现有的基于自编码器的异常检测方法只
                                            i
                                 N
                                   i = 1
                                                                能在已知正常样本的情况下,通过对神经网络的训
                  此外,编码器输出的低维特征通过分类器会得
                                                                                             [15]
                                                                练,使用重构误差来判断异常样本 ,然而当已知样本
                                      ̂
              到训练数据的预测标签 Y =( y ̂ ,y ̂ ,…,y ̂       N)。为了
                                           1
                                                                的类型有多种时,在自编码器的训练过程中,神经网
                                              2
              提高分类器的分类能力以及编码器对不同类别样本
                                                                络的泛化能力会不断加强,这种泛化能力会将未知故
              的特征提取能力,采用交叉熵损失函数作为模型的
                                                                障样本错误地识别为已知样本,为了降低解码器的泛
              分类损失:
                                                                化能力,提高网络的未知故障检测能力,使用每一类
                                  1  N  n
                           J C =-   ∑∑   y ic lg p ic   (2)     型数据训练各自的解码器,此时相对应的第二阶段训
                                 N
                                    i = 1 c = 1
                                                                练的损失函数可以表示为:
              式中, y ic 表示第 i 个输入样本是否为第 c 类,是第 c 类
                                                                              1  N k             P k
                                                                          k
                                                                                           2
              时值为 1,不是时值为 0; p ic 表示第 i 个输入样本是第                          J 2 =   ∑ ( x i - x ̂ ) + ξ k∑  w kp 2  (4)
                                                                                          i
                                                                                                p = 1
                                                                              N k i = 1
              c 类的概率; n 为已知样本的类别数。
                                                                       k
                                                                式中, J 2 表示在训练的第二阶段第 k 组训练样本训
                  因此,综合考虑已知样本的重构损失以及分类
                                                                练解码器 k 的损失函数; ξ k 为训练解码器 k 时的正则
              损失,在训练的第一阶段损失函数可以表示为:
                                           P                    化系数; P k 为解码器 k 中的参数总数; w kp 为解码器 k
                           J 1 = J M + λJ C + ξ  ∑  w p 2  (3)  中的第 p 个参数。
                                          p = 1
              式中, λ 为分类损失的权重系数;为了防止过拟合,                              当解码器 k 训练完毕后,将第 k 组低维特征作为
              在损失函数中加入了 L2 正则化项, ξ 为正则化系数;                      解码器 k 的输入,此时会得到训练数据所对应的重
                                                                        ̂
              P 为网络中参数的总数; w p 为网络中的第 p 个参数。                    构样本 X k =( x ̂ ,x ̂ ,…,x ̂ N k),因此第 i 个输入样本的
                                                                              1
                                                                                 2
              通过设置均方误差和交叉熵损失函数,可以在训练                            重构误差可以表示为:
   160   161   162   163   164   165   166   167   168   169   170