Page 254 - 《振动工程学报》2025年第9期
P. 254

2184                               振     动     工     程     学     报                     第 38 卷

              斯优化的     LSTM  模型可以通过对各种概率代理模型                    式中,M=K(X,X)+   σ I。通过求解极大似然函数的极
                                                                                2
                                                                                n
              拟合超参数与模型之间的关系进行评价,得出最好                            值可以确定优化后的超参数组合。
              的超参数组合,而不需要额外进行超参数模拟与组                                贝叶斯优化问题包括目标函数、域空间、优化
              合,大大提高了优化的效率。后验概率的更新公式为:                          算法、结果历史记录          4  个主要部分,如表      1  所示。
                                     p(D|f)p(f)
                             p( f|D) =                 (7)
                                       p(D)                                 表 1 贝叶斯优化的主要内容
              式中,D={(x 1 ,f 1 ),(x 2 ,f 2 ), ··· ,(x n ,f n )}为已经采集到的样本  Tab. 1 Main contents of Bayesian optimization

              点,其中,x n 和   f n 分别为样本和其对应的概率;p(f) 为                主要部分                     解释
              先验分布,能够通过上述贝叶斯公式算出                   f 的后验分                  模型想要最小化的函数,本文中为LSTM模型中使
                                                                  目标函数
              布;  p(D| f)为似然函数;    p( f|D)为后验分布函数。                         用该组超参数在验证集上的损失大小
                                                                           需要调优的超参数的取值范围,本文中为LSTM单
                  贝叶斯优化中的概率代理模型指的是通过某种                             域空间
                                                                           元内隐藏层的尺寸大小,初始学习率和正则化参数
              概率模型替代目标函数,主要分为以下三类:TPE(树                                    构造代理函数并选择下一个超参数的方法,
              形  Parzen  评估器,tree parzen estimator)、SMAC(随机       优化算法     即采集函数
              森林回归)和      GP(高斯过程)。本文采用高斯过程回                    结果历史记录 目标函数评估的存储结果
              归对贝叶斯优化模型进行建模,有:
                                                       (8)
                               y n = f n (x n )+ε n
              式中,ε n 为高斯白噪声且服从正态分布                 N(0, σ ),其   3    三  元  Gaussian Copula    模  型
                                                       2
                                                       n
              中  σ n 为标准差。
                                                                    由于本文所采用的桥例(天津富民桥)在横梁底
                                            ′
                            f(x)∼GP[m(x),k(x, x )]     (9)
              式中,m(x) 为均值;k(x,x') 为指数协方差,称为核函                   板横桥向布置了内侧、中部和外侧                3  个监测点,因此
                                                                将 二元   Gaussian  Copula 模 型 推 广 至 三 元  Gaussian
              数,可表示为:
                                                                Copula,对监测点进行整体可靠指标预测与分析。
                                [ √              ]

                                       ′ T
                            2
                        ′
                                           −1
                   k(x, x ) = σ exp − (x, x ) Λ (x, x )  (10)
                                               ′
                            f
                                                                3.1    Copula  理论
                     2
              式中,σ f 为核函数信号差;Λ         为超参数对称矩阵。
                  根据贝叶斯理论,基于样本数据集                 D  由高斯过           对于   X=(X 1 , X 2 , ··· ,X n ),本文假设  F  为  n  元联合概
              程建立的先验函数在给定测试样本                 x 的条件下将变          率概率分布函数,其边缘分布函数为                   F X1 ,F X2 , ··· ,F Xn ,
                                               *
              化为后验分布,因此样本数据集的观察目标值和预                            有  Copula 函 数  C 1 , 使 得 对 于 任 意 的  x=(x 1 ,  x 2 , ··· ,
              测值的联合分布为:                                         x n )∈R ,都有下式成立     [14] :
                                                                      n
                [     ]    ( [          2          ])
                   y           K(X,X)+σ I   K(X, x )
                                                 ∗
                                        n
                        ∼ N 0,                         (11)      F(x 1 , x 2 ,··· , x 3 ) = C 1 (F x 1  (x 1 ),F x 2  (x 2 ),··· ,F x n (x n )) (16)
                  f(x )          K(x ,X)    K(x , x )
                                    ∗
                    ∗
                                                 ∗
                                               ∗
                                                                    若 边 缘 分 布 函数    F xi (i=1,2, ··· ,n) 连 续 , 则  Copula
              式中,K(X,x )=K (x ,X),且该项为测试样本          x 与训练
                                                     *
                              *
                            T
                        *
                                                                函数唯一。由式         (16) 可得随机向量      X=(X 1 ,X 2 , ··· , X n )
              集样本   X  之间的   N×1  阶协方差核矩阵;I 为单位矩阵。
                                                                的联合概率密度函数为:
                  由此可得测试样本         x 模型预测值      f(x ) 满足的后
                                                  *
                                    *
              验分布:                                                   p(x 1 , x 2 ,··· , x n ) =
                                                                                             n ∏
                               *
                                      ∗
                                               ∗
                                            ∗
                           p(f(x )|X,Y, x ) ∼ N(µ ,Σ )  (12)         c(F X 1  (x 1 ),F X 2  (x 2 ),··· ,F X n (x n ))  p X i (x i )  (17)
                                                                                             i=1
              其中:
                                                                式中,p Xi (x i ) 为边缘密度函数;c(u) 为     Copula 函数的
                                            −1
                                          2
                      µ = K(x ,X)[K(X,X)+σ I] Y        (13)
                       ∗
                             ∗
                                          n
                                                                联合概率密度函数:
                                              2
                                                 −1
                   *
                                 ∗
                 Σ = K(x , x )− K(x ,X)[K(X,X)+σ I N ] K(X, x )
                        ∗
                                                        ∗
                           ∗
                                                                                     2
                                              n                                     ∂ C
                                                       (14)        c(u 1 ,u 2 ,··· ,u n ) =  (u 1 ,u 2 ,··· ,u n )  (18)
                                                *
                                                          *
              式中,Y   为样本数据集的观测目标值;μ 为均值;                Σ 为                      ∂u 1 ∂u 2 ···∂u n
                                                                    若 F 为     (i=1,2, ··· ,n) 的广义逆函数,式   (17) 还
                                                                        −1
              方差;I N 为  N  维单位矩阵;K(X,X) 为协方差矩阵,是                        X i  F X i
                                                                可写为:
              一个实对称阵。
                                                                                  −1         
                            2
                  综上,θ={  σ σ ,  2 n ,Λ}为超参数集合,一般而言,高                            F (u 1 )      u 1   
                                                                                            
                                                                                
                                                                                  X 1
                            f
                                                                                
                                                                                            
                                                                                  −1         
                                                                                  F (u 2 )      u 2  
              斯过程回归通过极大似然估计求解优化超参数,其                                                X 2              (19)
                                                                              F    .   = C  .  
                                                                                        
                                                                                            
                                                                                   .      .  
                                                                                            
              对数似然函数为:                                                              .       .   
                                                                                            
                                                                                            
                                                                                
                                                                                  −1
                                                                                 F (u n )      u n  
                    L(θ) = −lg[p(Y|X,θ)] =                                        X n
                         1  T  −1  1       n                    式中,u i =  F X i  (i=1,2, ··· ,n);(u 1 ,u 2 , ··· ,u n )=u。
                           Y M Y + lg|M|+ lg2π         (15)
                         2         2       2                        式  (19) 表示在边缘分布已知的条件下构造              Copula
   249   250   251   252   253   254   255   256   257   258   259