Page 253 - 《振动工程学报》2025年第9期

P. 253

第 9 期赵启凡，等：BO-LSTM 和 Copula 理论相融合的桥梁构件时变可靠性预测 2183

神经网络算法不仅可以反映序列数据发展和变 c t−1 c t
化的趋势，而且可以考虑数据序列中随机波动的影 tanh
响，拟合并进行高精度预测。而针对时序数据的预 f t i t c t o t
测，采用较多的是内侧节点递归连接的循环神经网 σ σ tanh σ
络（recurrent neural network，RNN）模型 [12] ，该模型可以 h t−1 h t
实现多个隐藏层的相互连接，获得更好的网络状态 x t
向量元素乘向量和
反馈。在 RNN 模型的基础上，长短期记忆（ long Element-wise multiplication Element-wise addition

short-term memory，LSTM）网络解决了 RNN 模型无法图 1 LSTM 网络的循环单元结构
处理的长距离依赖问题，对时序数据能够进行更好 Fig. 1 Cyclic unit structure of LSTM network

的处理。图 1 中：
贝叶斯优化是一种通过近似逼近来估计最优解
i t = σ(W i x t +U i h t−1 + b i ) （1）
的优化方法，多适用于黑箱优化。贝叶斯优化的 f t = σ(W f x t +U f h t−1 + b f ) （2）

LSTM 模型可以给出最好的超参数组合。在面对不
o t = σ(W o x t +U o h t−1 + b o ) （3）
同的桥梁数据时，只需对贝叶斯优化的两个参数进
˜ c t = tanh(W c x t +U c h t−1 + b c ) （4）
行调整，而不需要额外对 LSTM 模型进行超参数确
c t = f t ∗ c t−1 + i t ∗ ˜c t （5）
定，大大提高了优化的效率 [13] 。
h t = o t ∗tanh(c t ) （6）
基于以上研究，本文采用 LSTM 模型，并引入贝
式中，i t 、f t 、o t 、c t 和 ˜ c t 分别为输入门、遗忘门、输出
叶斯优化方法对 LSTM 模型中的初始超参数进行优
门、细胞状态和细胞状态候选值；σ(∙) 为 Logistic 函
化，构建贝叶斯优化下的长短期记忆（BO-LSTM）网络
数，输出函数区间为 (0,1)；W i 、W f 、W o 和 W c 分别为
模型，利用 BO-LSTM 模型对桥梁监测应力极值进行
输入门、遗忘门、输出门和细胞状态候选值的权重
预测。并以天津富民桥为例，基于二元 Copula [14-15]
矩阵；U i 、U f 、U o 和 U c 分别为为输入门、遗忘门、输
理论，将二元 Gaussian Copula 推广至三元，建立三元
出门和细胞状态上一时刻外部状态的权重；b i 、b f 、
的 Gaussian Copula 模型，对桥梁可靠性进行计算分
b o 和 b c 分别为输入门、遗忘门、输出门和细胞状态
析，验证模型与方法的合理性。
候选值的偏置矩阵；x t 为当前时刻的输入；h t− 为上
1

一时刻的外部状态。
1 长短期记忆网络在 LSTM 网络中，记忆单元 c 可以在某个时刻捕
捉到某个关键信息，并有能力将此关键信息保存一
在一般的循环神经网络中，其参数往往可以通定的时间间隔。记忆单元 c 中保存信息的生命周期
过梯度下降的方法来进行较为高效的学习，进而进要长于短期记忆 h，但又远远短于长期记忆。

行神经网络的构建 [12] 。由于在一般循环神经网络
中，非线性激活函数经常使用导数小于 1 的 Logistic 2 贝叶斯优化
函数或 Tanh 函数，其权重矩阵均较小，因此往往会
出现梯度消失的问题。机器学习模型中一般有两类参数：第一类参数
一般循环网络尽管在理论上可建立长时间间隔通常称为模型参数（parameter），需要从数据中学习
数据状态之间的关系，但由于存在梯度爆炸或消失和估计得到，例如线性回归中的斜率与截距等；第二
的问题，在实际操作中只能学习到短期的依赖关系，类参数通常称为超参数（hyperparameter），是机器学
这种问题称为长程依赖问题。习算法中的调优参数（tuning parameter），需要提前设
为了解决一般循环神经网络的长程依赖问题，定，例如神经网络的初始学习率等。在本文中，使用
本文采用引入门控机制的方法来控制信息的积累速贝叶斯优化对 LSTM 网络的超参数进行优化。
度，对输入神经网络的信息进行一定程度的筛选，有贝叶斯优化 [13] 是一种通过近似逼近来估计最优
选择地加入新信息或遗忘之前的信息。长短期记忆解的优化方法，多适用于黑箱优化，采用高斯过程、
网络就是基于门控的循环神经网络的变体，可以有随机森林等各种概率代理模型拟合超参数与评价模
效解决梯度爆炸或消失的问题 [12] 。型之间的关系，得出效果最好的超参数组合。贝叶

LSTM 网络中的重复模块包含四个交互的层：斯优化会考虑之前的参数信息，更新目标函数的后
3 个 Sigmoid 层和 1 个 Tanh 层，并以图 1 所示的方式验分布，直到后验分布基本贴合真实分布。相较于
进行交互。传统的 LSTM 模型对于时序数据的预测，引入贝叶

248 249 250 251 252 253 254 255 256 257 258