Page 254 - 《振动工程学报》2025年第9期

P. 254

2184 振动工程学报第 38 卷

斯优化的 LSTM 模型可以通过对各种概率代理模型式中，M=K(X,X)+ σ I。通过求解极大似然函数的极
2
n
拟合超参数与模型之间的关系进行评价，得出最好值可以确定优化后的超参数组合。
的超参数组合，而不需要额外进行超参数模拟与组贝叶斯优化问题包括目标函数、域空间、优化
合，大大提高了优化的效率。后验概率的更新公式为：算法、结果历史记录 4 个主要部分，如表 1 所示。
p(D|f)p(f)
p( f|D) = （7）
p(D) 表 1 贝叶斯优化的主要内容
式中，D={(x 1 ,f 1 ),(x 2 ,f 2 ), ··· ,(x n ,f n )}为已经采集到的样本 Tab. 1 Main contents of Bayesian optimization

点，其中，x n 和 f n 分别为样本和其对应的概率；p(f) 为主要部分解释
先验分布，能够通过上述贝叶斯公式算出 f 的后验分模型想要最小化的函数，本文中为LSTM模型中使
目标函数
布； p(D| f)为似然函数； p( f|D)为后验分布函数。用该组超参数在验证集上的损失大小
需要调优的超参数的取值范围，本文中为LSTM单
贝叶斯优化中的概率代理模型指的是通过某种域空间
元内隐藏层的尺寸大小，初始学习率和正则化参数
概率模型替代目标函数，主要分为以下三类：TPE（树构造代理函数并选择下一个超参数的方法，
形 Parzen 评估器，tree parzen estimator）、SMAC（随机优化算法即采集函数
森林回归）和 GP（高斯过程）。本文采用高斯过程回结果历史记录目标函数评估的存储结果
归对贝叶斯优化模型进行建模，有：
（8）
y n = f n (x n )+ε n
式中，ε n 为高斯白噪声且服从正态分布 N(0, σ )，其 3 三元 Gaussian Copula 模型
2
n
中 σ n 为标准差。
由于本文所采用的桥例（天津富民桥）在横梁底
′
f(x)∼GP[m(x),k(x, x )] （9）
式中，m(x) 为均值；k(x,x') 为指数协方差，称为核函板横桥向布置了内侧、中部和外侧 3 个监测点，因此
将二元 Gaussian Copula 模型推广至三元 Gaussian
数，可表示为：
Copula，对监测点进行整体可靠指标预测与分析。
[ √ ]

′ T
2
′
−1
k(x, x ) = σ exp − (x, x ) Λ (x, x ) （10）
′
f
3.1 Copula 理论
2
式中，σ f 为核函数信号差；Λ 为超参数对称矩阵。
根据贝叶斯理论，基于样本数据集 D 由高斯过对于 X=(X 1 , X 2 , ··· ,X n )，本文假设 F 为 n 元联合概
程建立的先验函数在给定测试样本 x 的条件下将变率概率分布函数，其边缘分布函数为 F X1 ,F X2 , ··· ,F Xn ，
*
化为后验分布，因此样本数据集的观察目标值和预有 Copula 函数 C 1 ，使得对于任意的 x=(x 1 , x 2 , ··· ,
测值的联合分布为： x n )∈R ，都有下式成立 [14] ：
n
[ ] ( [ 2 ])
y K(X,X)+σ I K(X, x )
∗
n
∼ N 0, （11） F(x 1 , x 2 ,··· , x 3 ) = C 1 (F x 1 (x 1 ),F x 2 (x 2 ),··· ,F x n (x n )) （16）
f(x ) K(x ,X) K(x , x )
∗
∗
∗
∗
若边缘分布函数 F xi (i=1,2, ··· ,n) 连续，则 Copula
式中，K(X,x )=K (x ,X)，且该项为测试样本 x 与训练
*
*
T
*
函数唯一。由式 (16) 可得随机向量 X=(X 1 ,X 2 , ··· , X n )
集样本 X 之间的 N×1 阶协方差核矩阵；I 为单位矩阵。
的联合概率密度函数为：
由此可得测试样本 x 模型预测值 f(x ) 满足的后
*
*
验分布： p(x 1 , x 2 ,··· , x n ) =
n ∏
*
∗
∗
∗
p(f(x )|X,Y, x ) ∼ N(µ ,Σ ) （12） c(F X 1 (x 1 ),F X 2 (x 2 ),··· ,F X n (x n )) p X i (x i ) （17）
i=1
其中：
式中，p Xi (x i ) 为边缘密度函数；c(u) 为 Copula 函数的
−1
2
µ = K(x ,X)[K(X,X)+σ I] Y （13）
∗
∗
n
联合概率密度函数：
2
−1
*
∗
Σ = K(x , x )− K(x ,X)[K(X,X)+σ I N ] K(X, x )
∗
∗
∗
2
n ∂ C
（14） c(u 1 ,u 2 ,··· ,u n ) = (u 1 ,u 2 ,··· ,u n ) （18）
*
*
式中，Y 为样本数据集的观测目标值；μ 为均值； Σ 为 ∂u 1 ∂u 2 ···∂u n
若 F 为 (i=1,2, ··· ,n) 的广义逆函数，式 (17) 还
−1
方差；I N 为 N 维单位矩阵；K(X,X) 为协方差矩阵，是 X i F X i
可写为：
一个实对称阵。
 −1   
2
综上，θ={ σ σ , 2 n ,Λ}为超参数集合，一般而言，高  F (u 1 )     u 1   


X 1
f


 −1   
  F (u 2 )     u 2  
斯过程回归通过极大似然估计求解优化超参数，其    X 2          （19）
F   .  = C  .  


  .    .  

对数似然函数为：    .     .   



−1
F (u n )   u n 
L(θ) = −lg[p(Y|X,θ)] = X n
1 T −1 1 n 式中，u i = F X i (i=1,2, ··· ,n)；(u 1 ,u 2 , ··· ,u n )=u。
Y M Y + lg|M|+ lg2π （15）
2 2 2 式 (19) 表示在边缘分布已知的条件下构造 Copula

249 250 251 252 253 254 255 256 257 258 259