Page 117 - 《振动工程学报》2025年第8期

P. 117

第 8 期郭彪，等：基于神经常微分方程的机械故障诊断方法 1757

明其相较于时、频域特征提取更有优势。ZHANG 优势，本文将神经常微分方程引入到机械故障诊断
［3］
等将深度残差网络应用到滚动轴承故障诊断，有中，提出了基于神经常微分方程的机械故障诊断方
效防止了梯度爆炸和梯度消失，解决了网络退化的法，为解决现有的智能诊断方法存在的架构可解释
［4］
问题。时培明等在深度残差网络的基础上结合注性差以及盲目堆叠层数导致的参数增加和内存消耗
意力机制，有效地提高了滚动轴承故障诊断的准确等问题提供了一种思路。为突出该方法的优越性，
［5］
率。刘飞等为了克服现有基于深度学习的滚动轴本文还将提出的方法与传统的残差网络模型的故障
承故障诊断算法训练参数量大、训练时间长且需要诊断方法进行了对比，试验结果验证了提出方法的
大量训练样本的缺点，提出了一种基于迁移学习有效性。
（TL）与深度残差网络（residual network， ResNet）的
［6］
快速故障诊断算法（TL‑ResNet）。池福临等采用 1 神经常微分方程
联合最大平均偏差准则和条件对抗学习域适配网络
这两大机制实现了对齐源域和目标域，通过添加软残差网络（ResNet）作为一种卷积神经网络，用
阈值构建深度收缩残差网络提取噪声冗余下的轴承于学习隐藏变量（如 x i + 1 和 x i ）之间的差值。ResNet
振动数据的特征信息。针对变负荷、变速度与变噪的表达式如下：
［7］
声三种试验设置验证了模型有效性。尚杰针对变 x i + 1 = x i + f i ( x i，θ i ) （1）
转速工况下的滚动轴承故障问题，提出了一种结合式中， x i 为层数 i = 1，⋯，n 时的 ResNet 网络层的变
同步提取变换和二维残差网络的故障诊断模型，该量； f i 为 ResNet 在第 i 层使用的神经网络函数； θ i 为
模型将时频图作为数据集，利用深度残差网络在数第 i 层的网络参数。
据集上进行训练，在噪声干扰下仍能保证诊断准确将神经常微分方程（NODE）作为 ResNet 的连
［8］
率。侯召国等提出了一种改进深度残差网络模型续化引入［11］，并且把 NODE 表达式中网络层数 t 作
（improved deep residual network，IDRN），主要用来为连续变量，无限细分，就可以写出其微分形式：
解决旋转机械标签样本不足而导致的故障特征提取 dx t
困难问题。秦国浩等为了减小由于卷积核尺度单 dt = f ( x t，t，θ ) （2）
［9］
一导致的难以充分捕捉不同冲击的频率成分的问式中， x t 为层数 t = 1，⋯，n 时的变量； f 为由可微分

题，提出了一种动态宽卷积残差网络（dynamic wide‑ 的神经网络构成的微分方程； θ 为网络中可学习的
kernels residual network，DWResNet）轴承故障诊断参数［15］。
方法。通过改进网络动态权重加权机制有效提高了若想要知道某层的隐藏状态，只需给出其初始
在强背景噪声工况下轴承故障诊断的效果。状态 x t 0 ， t 0， t 1 就可以利用下式进行积分计算：
在这些基于数据驱动的机械故障智能诊断方法 t 1
= x t 0 ∫ f ( x t，t，θ ) dt （3）
+
中，研究人员经常使用神经网络建立故障诊断模型。 x t 1 t 0
但是，随着人们对诊断精度的要求不断提高，使得神图 1 展示一个简单的神经常微分方程网络层传
经网络的层数不断增加、结构不断深化。很多研究递的示例，可视化地说明了 NODE 如何获取输入变
者开始不关注模型本身的计算成本，使得模型的内量并通过网络将其转换为输出变量的过程。图 1
存成本和网络参数呈线性增长，导致模型难以被优中，每个实线箭头都是网络 dx t /dt = f ( x t，t ) 的值，
化且易于过度拟合［10］，并且将模型应用到现实当中用于查找下一步网络的隐藏层变量，其中网络 f 为
也会变得非常困难。为了增强深度学习模型的可解描述一阶 ODE dx t /dt 的函数， t 为网络的深度。使
释性、减少层数堆叠造成的内存消耗且不降低诊断用数值微分方程求解器将输入通过神经网络 f 描述
［12］
准确率，CHEN 等［11］提出残差网络（ResNet）可以
［13］
被解释为离散的常微分方程（ordinary differential
equations，ODE）的观点，合理地阐明了神经网络与
动态系统两者之间的关系。其中，CHEN 等［11］在时
间连续的前提下，利用常微分方程求解器对网络隐
藏状态进行动力学建模，并使用被称为伴随灵敏度
的方法［11，14］代替机器学习中的反向传递算法。该模
型在监督学习、时间序列预测和连续归一化流等问
题的解决上表现出在误差控制、内存效率以及自适图 1 神经常微分方程前向传递和伴随灵敏度方法
应计算等方面的优势。基于神经常微分方程的独特 Fig. 1 Forward and the adjoint sensitivity method of NODE

112 113 114 115 116 117 118 119 120 121 122