Page 100 - 《振动工程学报》2026年第2期
P. 100
416 振 动 工 程 学 报 第 39 卷
包括主成分分析(PCA)、线性判别分析、局部线性 0.0006
标准化前
嵌入等 [26-27] 。由于 PCA 计算是基于对数据矩阵的特 0.0005
0.0004
征值分解,将原始数据转化为一系列线性无关的特 0.0003
征向量,不仅概念清晰,而且计算简单,因此本节将 Sa / g 0.0002
利用 PCA 算法对地震动数据矩阵实现降维,即提取 0.0001
能够表征原始地震动主要特征的向量,并将其作为 0
坐标系合成新的地震动的特征母波。 0.1 1
周期 / s
为了便于描述 PCA 算法的基本原理 [28-29] ,本文 0.05
标准化后
将一个分组内的地震动表示为向量和矩阵的形式, 0.04
即一条 n 个数据点的加速度时程可视为一个列向 0.03
量,一个分组内的 m条加速度时程可视为 m列向量, Sa / g 0.02
形成数据矩阵 A: 0.01
a 11 a 12 ··· a 1m 0
···
a 21 a 22 a 2m 0.1 1
A = . . . . . . . (2) 周期 / s
.
. . . .
图 3 原始地震动数据集的标准化
a n1 a n2 ··· a nm
式中, n为每条加速度时程的数据点的个数; m为一 Fig. 3 Standardization of original ground motions data sets
个分组内地震加速度的数量。 于地震动数据矩阵 A 的两个 n 维的列向量 a i 和 a j ,协
对地震动数据的向量化,能够更方便地运用机 方差可以表示为:
器学习算法对地震数据进行处理,有效提取数据中 ( ) 1 n ∑
cov a i , a j = (a ip −a i )(a jp −a j ) (6)
的特征信息。PCA 算法主要是通过线性变换将原始 n−1
p=1
数据变换为一组各维度线性无关的向量,以此来提 由于对矩阵 A 中的数据进行了标准化,均值为
取原始数据的主要特征分量。在进行地震动数据矩 0,因此两个 n 维的列向量 a i 和 a j 的协方差可以写为:
阵 A 的 PCA 计算时,可采取以下步骤: 1 n ∑
(
)
cov a i , a j = a ip a jp (7)
(1)对地震动数据矩阵 A 进行标准化处理 n
p=1
虽然一个分组内的地震动具有相似的特征,但 如式(7)所示为两个列向量 a i 和 a j 的相关系数 r ij ,
是由于加速度记录来源于不同的地震,且分组是按 即 r ij = cov a i , a j 。求解矩阵 A 中各列向量的相关系
(
)
照一个震级或距离范围划分,因此数据的离散性较 数,得到相关系数矩阵 R:
大。所以在采用 PCA 计算进行地震动数据集的降维 r 11 r 12 ··· r 1m
前,需要首先对数据矩阵进行标准化。本文采用基 r 21 r 22 ··· r 2m
R = . . . . (8)
.
于标准差的标准化方法: . . . . . .
.
r n1 r n2 ··· r nm
a ij −a j
∗ (3)
ij (3)对相关系数矩阵 R 的特征值进行分解
a = √ ( ) ;i = 1,2,··· ,n; j = 1,2,··· ,m
var a j
式中, a ij 为矩阵 A 中的第 i 行、第 j 列数据; a 为 a ij 标 构建相关系数矩阵 R 的特征方程:
∗
ij
( )
准化后的数据; a j 为第 j列数据的平均值, var a j 为第 |R−λE| = 0 (9)
式中, λ为特征值; E为单位矩阵。
j列数据的方差,分别表示为:
矩阵 R 为非对称矩阵,采用雅可比方法求解稳定
1 n ∑
a j = a i j ;j = 1,2,··· ,m (4) 性强,且具有收敛性。求解方程(9)可得矩阵 的 m个
n R
i=1
1 n ∑ 特征值,即 λ 1 ,λ 2 ,··· ,λ m ,以及相应的特征向量 x 1 , x 2 ,··· ,
( ) 2
var a j = (a ij −a j ) ; j = 1,2,··· ,m (5)
n−1 x m , 原 始 地 震 动 数 据 经 过 特 征 向 量 构 建 的 坐 标
i=1
图 3 给出了一个 10 条加速度样本的地震动数据 系重新投影后得到的数据称为特征母波,其相应的特
集标准化前、后的反应谱,图中 Sa 表示谱加速度。 征值则表示每个特征母波对原始数据特征拟合的方差。
可以看出,标准化前地震动峰值及中、高频段的谱 (4)基于累计方差进行数据降维
加速度值离散性较大,经过标准化处理后,地震动数 对矩阵 R 进行特征值分解后,其特征向量将按
据的分布相对集中,尤其是高频部分。 照特征值(方差)的大小进行排列。由于特征值表示
(2)构建地震动数据矩阵的相关系数矩阵 其相应的特征母波对原始数据特征拟合的离散程
在一维空间中可以采用方差来表示数据的分散 度,因此选择方差较大的特征向量意味着能够捕捉
程度,而对于高维数据,则采用协方差进行约束。对 原始数据中更多的特征和变化。

