Page 117 - 《振动工程学报》2025年第8期
P. 117

第 8 期                     郭   彪,等: 基于神经常微分方程的机械故障诊断方法                                     1757

              明其相较于时、频域特征提取更有优势。ZHANG                           优势,本文将神经常微分方程引入到机械故障诊断
                [3]
              等 将深度残差网络应用到滚动轴承故障诊断,有                            中,提出了基于神经常微分方程的机械故障诊断方
              效防止了梯度爆炸和梯度消失,解决了网络退化的                            法,为解决现有的智能诊断方法存在的架构可解释
                            [4]
              问题。时培明等 在深度残差网络的基础上结合注                            性差以及盲目堆叠层数导致的参数增加和内存消耗
              意力机制,有效地提高了滚动轴承故障诊断的准确                            等问题提供了一种思路。为突出该方法的优越性,
                        [5]
              率。刘飞等 为了克服现有基于深度学习的滚动轴                            本文还将提出的方法与传统的残差网络模型的故障
              承故障诊断算法训练参数量大、训练时间长且需要                            诊断方法进行了对比,试验结果验证了提出方法的
              大 量 训 练 样 本 的 缺 点 ,提 出 了 一 种 基 于 迁 移 学 习          有效性。
             (TL)与深度残差网络(residual network, ResNet)的
                                                      [6]
              快速故障诊断算法(TL‑ResNet)。池福临等 采用                       1 神经常微分方程
              联合最大平均偏差准则和条件对抗学习域适配网络
              这两大机制实现了对齐源域和目标域,通过添加软                                 残差网络(ResNet)作为一种卷积神经网络,用
              阈值构建深度收缩残差网络提取噪声冗余下的轴承                            于学习隐藏变量(如 x i + 1 和 x i )之间的差值。ResNet
              振动数据的特征信息。针对变负荷、变速度与变噪                            的表达式如下:
                                                    [7]
              声三种试验设置验证了模型有效性。尚杰 针对变                                          x i + 1 = x i + f i ( x i,θ i )  (1)
              转速工况下的滚动轴承故障问题,提出了一种结合                            式中, x i 为层数 i = 1,⋯,n 时的 ResNet 网络层的变
              同步提取变换和二维残差网络的故障诊断模型,该                            量; f i 为 ResNet 在第 i 层使用的神经网络函数; θ i 为
              模型将时频图作为数据集,利用深度残差网络在数                            第 i 层的网络参数。
              据集上进行训练,在噪声干扰下仍能保证诊断准确                                 将神经常微分方程(NODE)作为 ResNet 的连
                          [8]
              率。侯召国等 提出了一种改进深度残差网络模型                            续化引入     [11] ,并且把 NODE 表达式中网络层数 t 作
             (improved deep residual network,IDRN),主要用来         为连续变量,无限细分,就可以写出其微分形式:
              解决旋转机械标签样本不足而导致的故障特征提取                                             dx t
              困难问题。秦国浩等 为了减小由于卷积核尺度单                                             dt  = f ( x t,t,θ )       (2)
                                 [9]
              一导致的难以充分捕捉不同冲击的频率成分的问                             式中, x t 为层数 t = 1,⋯,n 时的变量; f 为由可微分

              题,提出了一种动态宽卷积残差网络(dynamic wide‑                    的神经网络构成的微分方程; θ 为网络中可学习的
              kernels residual network,DWResNet)轴承故障诊断          参数  [15] 。
              方法。通过改进网络动态权重加权机制有效提高了                                 若想要知道某层的隐藏状态,只需给出其初始
              在强背景噪声工况下轴承故障诊断的效果。                               状态 x t 0 , t 0, t 1 就可以利用下式进行积分计算:
                  在这些基于数据驱动的机械故障智能诊断方法                                                 t 1
                                                                               = x t 0 ∫  f ( x t,t,θ ) dt  (3)
                                                                                   +
              中,研究人员经常使用神经网络建立故障诊断模型。                                       x t 1      t 0
              但是,随着人们对诊断精度的要求不断提高,使得神                                图 1 展示一个简单的神经常微分方程网络层传
              经网络的层数不断增加、结构不断深化。很多研究                            递的示例,可视化地说明了 NODE 如何获取输入变
              者开始不关注模型本身的计算成本,使得模型的内                            量 并 通 过 网 络 将 其 转 换 为 输 出 变 量 的 过 程 。 图 1
              存成本和网络参数呈线性增长,导致模型难以被优                            中,每个实线箭头都是网络 dx t /dt = f ( x t,t ) 的值,
              化且易于过度拟合         [10] ,并且将模型应用到现实当中               用于查找下一步网络的隐藏层变量,其中网络 f 为
              也会变得非常困难。为了增强深度学习模型的可解                            描述一阶 ODE dx t /dt 的函数, t 为网络的深度。使
              释性、减少层数堆叠造成的内存消耗且不降低诊断                            用数值微分方程求解器将输入通过神经网络 f 描述
                                             [12]
              准确率,CHEN 等      [11] 提出残差网络 (ResNet)可以
                                        [13]
              被解释为离散的常微分方程 (ordinary differential
              equations,ODE)的观点,合理地阐明了神经网络与
              动态系统两者之间的关系。其中,CHEN 等                  [11] 在时
              间连续的前提下,利用常微分方程求解器对网络隐
              藏状态进行动力学建模,并使用被称为伴随灵敏度
              的方法   [11,14] 代替机器学习中的反向传递算法。该模
              型在监督学习、时间序列预测和连续归一化流等问
              题的解决上表现出在误差控制、内存效率以及自适                                图 1  神经常微分方程前向传递和伴随灵敏度方法
              应计算等方面的优势。基于神经常微分方程的独特                             Fig. 1  Forward and the adjoint sensitivity method of NODE
   112   113   114   115   116   117   118   119   120   121   122