Page 117 - 《振动工程学报》2025年第8期
P. 117
第 8 期 郭 彪,等: 基于神经常微分方程的机械故障诊断方法 1757
明其相较于时、频域特征提取更有优势。ZHANG 优势,本文将神经常微分方程引入到机械故障诊断
[3]
等 将深度残差网络应用到滚动轴承故障诊断,有 中,提出了基于神经常微分方程的机械故障诊断方
效防止了梯度爆炸和梯度消失,解决了网络退化的 法,为解决现有的智能诊断方法存在的架构可解释
[4]
问题。时培明等 在深度残差网络的基础上结合注 性差以及盲目堆叠层数导致的参数增加和内存消耗
意力机制,有效地提高了滚动轴承故障诊断的准确 等问题提供了一种思路。为突出该方法的优越性,
[5]
率。刘飞等 为了克服现有基于深度学习的滚动轴 本文还将提出的方法与传统的残差网络模型的故障
承故障诊断算法训练参数量大、训练时间长且需要 诊断方法进行了对比,试验结果验证了提出方法的
大 量 训 练 样 本 的 缺 点 ,提 出 了 一 种 基 于 迁 移 学 习 有效性。
(TL)与深度残差网络(residual network, ResNet)的
[6]
快速故障诊断算法(TL‑ResNet)。池福临等 采用 1 神经常微分方程
联合最大平均偏差准则和条件对抗学习域适配网络
这两大机制实现了对齐源域和目标域,通过添加软 残差网络(ResNet)作为一种卷积神经网络,用
阈值构建深度收缩残差网络提取噪声冗余下的轴承 于学习隐藏变量(如 x i + 1 和 x i )之间的差值。ResNet
振动数据的特征信息。针对变负荷、变速度与变噪 的表达式如下:
[7]
声三种试验设置验证了模型有效性。尚杰 针对变 x i + 1 = x i + f i ( x i,θ i ) (1)
转速工况下的滚动轴承故障问题,提出了一种结合 式中, x i 为层数 i = 1,⋯,n 时的 ResNet 网络层的变
同步提取变换和二维残差网络的故障诊断模型,该 量; f i 为 ResNet 在第 i 层使用的神经网络函数; θ i 为
模型将时频图作为数据集,利用深度残差网络在数 第 i 层的网络参数。
据集上进行训练,在噪声干扰下仍能保证诊断准确 将神经常微分方程(NODE)作为 ResNet 的连
[8]
率。侯召国等 提出了一种改进深度残差网络模型 续化引入 [11] ,并且把 NODE 表达式中网络层数 t 作
(improved deep residual network,IDRN),主要用来 为连续变量,无限细分,就可以写出其微分形式:
解决旋转机械标签样本不足而导致的故障特征提取 dx t
困难问题。秦国浩等 为了减小由于卷积核尺度单 dt = f ( x t,t,θ ) (2)
[9]
一导致的难以充分捕捉不同冲击的频率成分的问 式中, x t 为层数 t = 1,⋯,n 时的变量; f 为由可微分
题,提出了一种动态宽卷积残差网络(dynamic wide‑ 的神经网络构成的微分方程; θ 为网络中可学习的
kernels residual network,DWResNet)轴承故障诊断 参数 [15] 。
方法。通过改进网络动态权重加权机制有效提高了 若想要知道某层的隐藏状态,只需给出其初始
在强背景噪声工况下轴承故障诊断的效果。 状态 x t 0 , t 0, t 1 就可以利用下式进行积分计算:
在这些基于数据驱动的机械故障智能诊断方法 t 1
= x t 0 ∫ f ( x t,t,θ ) dt (3)
+
中,研究人员经常使用神经网络建立故障诊断模型。 x t 1 t 0
但是,随着人们对诊断精度的要求不断提高,使得神 图 1 展示一个简单的神经常微分方程网络层传
经网络的层数不断增加、结构不断深化。很多研究 递的示例,可视化地说明了 NODE 如何获取输入变
者开始不关注模型本身的计算成本,使得模型的内 量 并 通 过 网 络 将 其 转 换 为 输 出 变 量 的 过 程 。 图 1
存成本和网络参数呈线性增长,导致模型难以被优 中,每个实线箭头都是网络 dx t /dt = f ( x t,t ) 的值,
化且易于过度拟合 [10] ,并且将模型应用到现实当中 用于查找下一步网络的隐藏层变量,其中网络 f 为
也会变得非常困难。为了增强深度学习模型的可解 描述一阶 ODE dx t /dt 的函数, t 为网络的深度。使
释性、减少层数堆叠造成的内存消耗且不降低诊断 用数值微分方程求解器将输入通过神经网络 f 描述
[12]
准确率,CHEN 等 [11] 提出残差网络 (ResNet)可以
[13]
被解释为离散的常微分方程 (ordinary differential
equations,ODE)的观点,合理地阐明了神经网络与
动态系统两者之间的关系。其中,CHEN 等 [11] 在时
间连续的前提下,利用常微分方程求解器对网络隐
藏状态进行动力学建模,并使用被称为伴随灵敏度
的方法 [11,14] 代替机器学习中的反向传递算法。该模
型在监督学习、时间序列预测和连续归一化流等问
题的解决上表现出在误差控制、内存效率以及自适 图 1 神经常微分方程前向传递和伴随灵敏度方法
应计算等方面的优势。基于神经常微分方程的独特 Fig. 1 Forward and the adjoint sensitivity method of NODE

