Page 243 - 《软件学报》2020年第10期
P. 243
张伟 等:一种时间序列鉴别性特征字典构建算法 3219
Table 1 Symbol table
表 1 符号表
符号 释义
D 时间序列集合
N 时间序列集合 D 中的实例数
T 任意一条时间序列
n 时间序列 T 的长度
min 滑动窗口最小长度
max 滑动窗口最大长度
minF 最小单词长度
maxF 最大单词长度
k 交叉验证重数
S(a,ω) 时间序列 T 中起始位置为 a 长为ω的子序列
x f 第 f 个傅里叶系数
real i 第 i 个傅里叶系数的实部
imag j 第 j 个傅里叶系数的虚部
F 离散傅里叶变换矩阵
dict 数据集 D 的特征字典
TfIdfDict 基于 tf-idf 统计量建立的特征字典
1.2 时间序列离散傅里叶变换
本节我们介绍时间序列的离散傅里叶变换过程 [20,21] .
给定一条由 n 个数值组成的离散序列 T={t 0 ,t 1 ,…,t n–1 },其离散傅里叶变换公式为
1 n− 1 − 2πj fi 1 n− 1
x = i e t ∑ n = tW fi , f = ∑ 0, 1,..., n − 1 (1)
i
f
i n = 0 i n = 0
1,
其中,j 为虚数单位,即 j =− W 为
2πj
−
W = e n .
经公式(1)可将离散数值序列 T 转换为序列 x,转换过程可表示为
⎡ x 0 ⎤ 1 1 1 " 1 ⎤ ⎡ t 0 ⎤ ⎡
⎢ ⎥ 1 2 n− 1 ⎥ ⎢ ⎥ ⎢
⎢ x 1 ⎥ 1 1 W W " W ⎥ ⎢ t 1 ⎥ ⎢
x = ⎢ x ⎥ 2 1 W 2 W 4 " W 2(n− 1) ⎥ t ⎢ = 2 . ⎥ ⎢
⎢ ⎥ n ⎢ ⎥ ⎢ ⎥
⎢ # ⎥ # # # % # ⎥ ⎢ # ⎥ ⎢
⎢ ⎣ x n− 1⎦ ⎥ ⎣ 1 W n− ⎢ 1 W 2(n− 1) " W (n− 1)(n− 1) ⎢ ⎥ ⎦ ⎣ t n− 1⎦ ⎥
上式可简单记作:
x = F T (2)
其中,F 称为离散傅里叶变换矩阵.
矩阵 F 中第 i 行表示第 i 个正弦波,x i 表示时间序列在这个正弦波上的投影,即,时间序列 T 中包含的第 i 个
频率正弦波成分的多少.它反映了时间序列与该频率正弦波的相关性.
数据 x={x 0 ,x 1 ,…,x n–1 }为经离散傅里叶变换得到的数据,称为频域向量.时间序列 T 可通过逆变换来恢复,即,
H
T = F x (3)
H
其中,F 表示正交矩阵 F 的共轭转置.
定理 1(Parseval theorem) [25] . 若 x 为序列 T 经离散傅里叶变换得到的序列,则有
n− 1 n− 1
∑ ||t i 2 = ∑ | x i | .
2
i= 0 i= 0
上述定理说明序列 T 在时域空间的能量与在频域空间的能量相同.
时间序列的每个元素可以表示为