Page 100 - 《振动工程学报》2026年第2期
P. 100

416                                振     动     工     程     学     报                     第 39 卷


              包括主成分分析(PCA)、线性判别分析、局部线性                                  0.0006
                                                                                                   标准化前
              嵌入等   [26-27] 。由于  PCA  计算是基于对数据矩阵的特                      0.0005
                                                                        0.0004
              征值分解,将原始数据转化为一系列线性无关的特                                    0.0003
              征向量,不仅概念清晰,而且计算简单,因此本节将                                  Sa / g  0.0002
              利用   PCA  算法对地震动数据矩阵实现降维,即提取                              0.0001
              能够表征原始地震动主要特征的向量,并将其作为                                       0
              坐标系合成新的地震动的特征母波。                                                  0.1           1
                                                                                        周期 / s
                  为了便于描述       PCA  算法的基本原理        [28-29] ,本文           0.05
                                                                                                   标准化后
              将一个分组内的地震动表示为向量和矩阵的形式,                                     0.04
              即一条    n  个数据点的加速度时程可视为一个列向                                0.03
              量,一个分组内的        m条加速度时程可视为            m列向量,                Sa / g  0.02
              形成数据矩阵       A:                                            0.01
                                              
                               a 11  a 12  ···  a 1m                     0
                                              
                                              
                                              
                                       ···    
                               a 21  a 22  a 2m                               0.1           1
                                              
                          A =  .    . .  . .  . .      (2)                          周期 / s
                              
                               .
                              
                               .    .   .   .    
                              
                                              
                                              
                                                                        图 3 原始地震动数据集的标准化
                                a n1  a n2  ···  a nm
              式中,   n为每条加速度时程的数据点的个数;                 m为一         Fig. 3 Standardization of original ground motions data sets
              个分组内地震加速度的数量。                                     于地震动数据矩阵         A  的两个   n  维的列向量    a i 和  a j ,协
                  对地震动数据的向量化,能够更方便地运用机                          方差可以表示为:
              器学习算法对地震数据进行处理,有效提取数据中                                     (   )   1   n ∑
                                                                      cov a i , a j =  (a ip −a i )(a jp −a j )  (6)
              的特征信息。PCA        算法主要是通过线性变换将原始                                   n−1
                                                                                     p=1
              数据变换为一组各维度线性无关的向量,以此来提                                由于对矩阵      A  中的数据进行了标准化,均值为
              取原始数据的主要特征分量。在进行地震动数据矩                            0,因此两个     n  维的列向量    a i 和  a j 的协方差可以写为:
              阵  A  的  PCA  计算时,可采取以下步骤:                                                1  n ∑
                                                                                 (
                                                                                     )
                                                                              cov a i , a j =  a ip a jp  (7)
                  (1)对地震动数据矩阵         A  进行标准化处理                                        n
                                                                                          p=1
                  虽然一个分组内的地震动具有相似的特征,但                              如式(7)所示为两个列向量           a i 和  a j 的相关系数 r ij ,
              是由于加速度记录来源于不同的地震,且分组是按                            即 r ij = cov a i , a j 。求解矩阵  A  中各列向量的相关系
                                                                         (
                                                                              )
              照一个震级或距离范围划分,因此数据的离散性较                            数,得到相关系数矩阵          R:
              大。所以在采用        PCA  计算进行地震动数据集的降维                                   r 11  r 12  ···  r 1m  
                                                                                                
                                                                                                
                                                                                                
              前,需要首先对数据矩阵进行标准化。本文采用基                                             r 21  r 22  ···  r 2m   
                                                                                
                                                                                
                                                                             R =  .   .   .   .       (8)
                                                                                
                                                                                 .
                                                                                
              于标准差的标准化方法:                                                        .    . .  . .  .  
                                                                                
                                                                                               . 
                                                                                                
                                                                                                
                                                                                  r n1  r n2  ···  r nm
                      a ij −a j
                 ∗                                     (3)
                 ij                                                 (3)对相关系数矩阵        R  的特征值进行分解
                 a = √   ( ) ;i = 1,2,··· ,n; j = 1,2,··· ,m
                       var a j
              式中,  a ij 为矩阵  A  中的第  i 行、第  j 列数据;  a 为  a ij 标     构建相关系数矩阵         R  的特征方程:
                                                     ∗
                                                     ij
                                                     ( )
              准化后的数据;       a j 为第  j列数据的平均值,     var a j 为第                       |R−λE| = 0             (9)
                                                                式中,   λ为特征值;    E为单位矩阵。
              j列数据的方差,分别表示为:
                                                                    矩阵   R  为非对称矩阵,采用雅可比方法求解稳定
                              1  n ∑
                          a j =   a i j ;j = 1,2,··· ,m  (4)    性强,且具有收敛性。求解方程(9)可得矩阵                    的 m个
                              n                                                                        R
                                i=1
                           1   n ∑                              特征值,即    λ 1 ,λ 2 ,··· ,λ m ,以及相应的特征向量  x 1 , x 2 ,··· ,
                    ( )                2
                  var a j =     (a ij −a j ) ; j = 1,2,··· ,m  (5)
                         n−1                                    x m , 原 始 地 震 动 数 据 经 过 特 征 向 量 构 建 的 坐 标
                              i=1
                  图  3  给出了一个    10  条加速度样本的地震动数据               系重新投影后得到的数据称为特征母波,其相应的特
              集标准化前、后的反应谱,图中               Sa 表示谱加速度。           征值则表示每个特征母波对原始数据特征拟合的方差。
              可以看出,标准化前地震动峰值及中、高频段的谱                                (4)基于累计方差进行数据降维
              加速度值离散性较大,经过标准化处理后,地震动数                               对矩阵    R  进行特征值分解后,其特征向量将按
              据的分布相对集中,尤其是高频部分。                                 照特征值(方差)的大小进行排列。由于特征值表示
                  (2)构建地震动数据矩阵的相关系数矩阵                           其相应的特征母波对原始数据特征拟合的离散程
                  在一维空间中可以采用方差来表示数据的分散                          度,因此选择方差较大的特征向量意味着能够捕捉
              程度,而对于高维数据,则采用协方差进行约束。对                           原始数据中更多的特征和变化。
   95   96   97   98   99   100   101   102   103   104   105