Page 100 - 《振动工程学报》2026年第2期

P. 100

416 振动工程学报第 39 卷

包括主成分分析（PCA）、线性判别分析、局部线性 0.0006
标准化前
嵌入等 [26-27] 。由于 PCA 计算是基于对数据矩阵的特 0.0005
0.0004
征值分解，将原始数据转化为一系列线性无关的特 0.0003
征向量，不仅概念清晰，而且计算简单，因此本节将 Sa / g 0.0002
利用 PCA 算法对地震动数据矩阵实现降维，即提取 0.0001
能够表征原始地震动主要特征的向量，并将其作为 0
坐标系合成新的地震动的特征母波。 0.1 1
周期 / s
为了便于描述 PCA 算法的基本原理 [28-29] ，本文 0.05
标准化后
将一个分组内的地震动表示为向量和矩阵的形式， 0.04
即一条 n 个数据点的加速度时程可视为一个列向 0.03
量，一个分组内的 m条加速度时程可视为 m列向量， Sa / g 0.02
形成数据矩阵 A： 0.01
 
 a 11 a 12 ··· a 1m  0
 
 
 
 ··· 
 a 21 a 22 a 2m  0.1 1
   
A =  . . . . . . .    （2）周期 / s

 .

 . . . .   

 
 
  图 3 原始地震动数据集的标准化
a n1 a n2 ··· a nm
式中， n为每条加速度时程的数据点的个数； m为一 Fig. 3 Standardization of original ground motions data sets
个分组内地震加速度的数量。于地震动数据矩阵 A 的两个 n 维的列向量 a i 和 a j ，协
对地震动数据的向量化，能够更方便地运用机方差可以表示为：
器学习算法对地震数据进行处理，有效提取数据中 ( ) 1 n ∑
cov a i , a j = (a ip −a i )(a jp −a j ) （6）
的特征信息。PCA 算法主要是通过线性变换将原始 n−1
p=1
数据变换为一组各维度线性无关的向量，以此来提由于对矩阵 A 中的数据进行了标准化，均值为
取原始数据的主要特征分量。在进行地震动数据矩 0，因此两个 n 维的列向量 a i 和 a j 的协方差可以写为：
阵 A 的 PCA 计算时，可采取以下步骤： 1 n ∑
(
)
cov a i , a j = a ip a jp （7）
（1）对地震动数据矩阵 A 进行标准化处理 n
p=1
虽然一个分组内的地震动具有相似的特征，但如式（7）所示为两个列向量 a i 和 a j 的相关系数 r ij ，
是由于加速度记录来源于不同的地震，且分组是按即 r ij = cov a i , a j 。求解矩阵 A 中各列向量的相关系
(
)
照一个震级或距离范围划分，因此数据的离散性较数，得到相关系数矩阵 R：
大。所以在采用 PCA 计算进行地震动数据集的降维   r 11 r 12 ··· r 1m  
 
 
   
前，需要首先对数据矩阵进行标准化。本文采用基  r 21 r 22 ··· r 2m   


R =  . . . .    （8）

 .

于标准差的标准化方法：  . . . . . .  

. 
   
 
r n1 r n2 ··· r nm
a ij −a j
∗ （3）
ij （3）对相关系数矩阵 R 的特征值进行分解
a = √ ( ) ；i = 1,2,··· ,n； j = 1,2,··· ,m
var a j
式中， a ij 为矩阵 A 中的第 i 行、第 j 列数据； a 为 a ij 标构建相关系数矩阵 R 的特征方程：
∗
ij
( )
准化后的数据； a j 为第 j列数据的平均值， var a j 为第 |R−λE| = 0 （9）
式中， λ为特征值； E为单位矩阵。
j列数据的方差，分别表示为：
矩阵 R 为非对称矩阵，采用雅可比方法求解稳定
1 n ∑
a j = a i j ；j = 1,2,··· ,m （4）性强，且具有收敛性。求解方程（9）可得矩阵的 m个
n R
i=1
1 n ∑ 特征值，即 λ 1 ,λ 2 ,··· ,λ m ，以及相应的特征向量 x 1 , x 2 ,··· ,
( ) 2
var a j = (a ij −a j ) ； j = 1,2,··· ,m （5）
n−1 x m ，原始地震动数据经过特征向量构建的坐标
i=1
图 3 给出了一个 10 条加速度样本的地震动数据系重新投影后得到的数据称为特征母波，其相应的特
集标准化前、后的反应谱，图中 Sa 表示谱加速度。征值则表示每个特征母波对原始数据特征拟合的方差。
可以看出，标准化前地震动峰值及中、高频段的谱（4）基于累计方差进行数据降维
加速度值离散性较大，经过标准化处理后，地震动数对矩阵 R 进行特征值分解后，其特征向量将按
据的分布相对集中，尤其是高频部分。照特征值（方差）的大小进行排列。由于特征值表示
（2）构建地震动数据矩阵的相关系数矩阵其相应的特征母波对原始数据特征拟合的离散程
在一维空间中可以采用方差来表示数据的分散度，因此选择方差较大的特征向量意味着能够捕捉
程度，而对于高维数据，则采用协方差进行约束。对原始数据中更多的特征和变化。

95 96 97 98 99 100 101 102 103 104 105