Page 243 - 《软件学报》2020年第10期
P. 243

张伟  等:一种时间序列鉴别性特征字典构建算法                                                          3219


                                            Table 1    Symbol table
                                                表 1   符号表
                                 符号                        释义
                                  D                     时间序列集合
                                  N                时间序列集合 D 中的实例数
                                  T                   任意一条时间序列
                                  n                   时间序列 T 的长度
                                 min                  滑动窗口最小长度
                                 max                  滑动窗口最大长度
                                 minF                   最小单词长度
                                 maxF                   最大单词长度
                                  k                     交叉验证重数
                                 S(a,ω)       时间序列 T 中起始位置为 a 长为ω的子序列
                                  x f                 第 f 个傅里叶系数
                                 real i             第 i 个傅里叶系数的实部
                                 imag j             第 j 个傅里叶系数的虚部
                                  F                  离散傅里叶变换矩阵
                                 dict                数据集 D 的特征字典
                                TfIdfDict        基于 tf-idf 统计量建立的特征字典

         1.2   时间序列离散傅里叶变换
             本节我们介绍时间序列的离散傅里叶变换过程                 [20,21] .
             给定一条由 n 个数值组成的离散序列 T={t 0 ,t 1 ,…,t n–1 },其离散傅里叶变换公式为
                                      1  n−  1  − 2πj  fi  1  n−  1
                                  x =     i e t ∑  n  =  tW  fi , f = ∑  0, 1,..., n −  1     (1)
                                                      i
                                   f
                                        i n =  0   i n =  0
                               1,
         其中,j 为虚数单位,即 j =− W 为
                                                      2πj
                                                      −
                                                 W =  e  n  .
             经公式(1)可将离散数值序列 T 转换为序列 x,转换过程可表示为
                                   ⎡  x 0 ⎤  1  1     1   "      1   ⎤  ⎡  t 0 ⎤ ⎡
                                   ⎢  ⎥          1     2         n− 1  ⎥  ⎢  ⎥ ⎢
                                   ⎢  x 1 ⎥  1  1  W  W   "    W     ⎥  ⎢  t 1 ⎥ ⎢
                                x  =  ⎢  x ⎥  2  1  W  2  W 4  "  W 2(n− 1)  ⎥  t ⎢ =  2  . ⎥ ⎢
                                   ⎢  ⎥   n ⎢                        ⎥  ⎢  ⎥
                                   ⎢  #  ⎥  #   #     #   %      #   ⎥  ⎢  #  ⎥ ⎢
                                   ⎢ ⎣ x n−  1⎦  ⎥  ⎣  1 W  n− ⎢  1  W  2(n−  1)  "  W (n−  1)(n−  1) ⎢  ⎥  ⎦  ⎣  t n−  1⎦  ⎥
             上式可简单记作:
                                                   x  = F T                                   (2)
         其中,F 称为离散傅里叶变换矩阵.
             矩阵 F 中第 i 行表示第 i 个正弦波,x i 表示时间序列在这个正弦波上的投影,即,时间序列 T 中包含的第 i 个
         频率正弦波成分的多少.它反映了时间序列与该频率正弦波的相关性.
             数据 x={x 0 ,x 1 ,…,x n–1 }为经离散傅里叶变换得到的数据,称为频域向量.时间序列 T 可通过逆变换来恢复,即,
                                                       H
                                                  T = F x                                     (3)
               H
         其中,F 表示正交矩阵 F 的共轭转置.
             定理 1(Parseval theorem) [25] .  若 x 为序列 T 经离散傅里叶变换得到的序列,则有
                                               n−  1  n−  1
                                              ∑  ||t i  2  = ∑  | x i  | .
                                                          2
                                               i=  0  i=  0
             上述定理说明序列 T 在时域空间的能量与在频域空间的能量相同.
             时间序列的每个元素可以表示为
   238   239   240   241   242   243   244   245   246   247   248