Page 208 - 《软件学报》2021年第12期
P. 208

3872                                Journal of Software  软件学报 Vol.32, No.12, December 2021

         对应电极帽上第 n 个电极的读数.
             从 EEG 头皮电极分布图可以看出:每个电极在物理上都与多个电极相邻,用于测量大脑某一区域的 EEG 信
         号,而且不同的大脑区域对应于不同的大脑活动.上述一维链式 EEG 数据向量仅能表示两个相邻电极位置的相
         关性,因此,本文根据 EEG 采集系统的电极空间位置关系,将获取的一维原始脑电序列转换为二维网状矩阵序
         列.本文将 32 通道一维 EEG 数据向量 X t 转换成如下所示的二维网状矩阵 Y t :
                                        0 ⎡  0  0  x 1  0  x 30  0  0  0 ⎤
                                       ⎢            t 2     t 29         ⎥
                                       ⎢  0  0  0  x t  0  x t  0  0   0  ⎥
                                       ⎢  x 3  0  x 4  0  x 31  0  x 27  0  x 28 ⎥
                                       ⎢  t     t       t       t       t  ⎥
                                        0 ⎢  x t 6  0  x t 5  0  x 26  0  x t 25  0 ⎥
                                                            t
                              Y =  t  T (X =  t )  ⎢  ⎢ x 7 t  0  x t 8  0  x t 32  0  x 23  0  x t 24⎥  ⎥  (1)
                                                                t
                                        0 ⎢  x 10  0  x 9  0  x 22  0  x 21  0 ⎥
                                       ⎢  11  t  12  t  13  t   19  t   20 ⎥
                                       ⎢ x t  0  x t  0  x t  0  x t  0  x t ⎥
                                        0 ⎢  0  x 14  0  0  0  x 18  0  0 ⎥
                                       ⎢        t               t        ⎥
                                        0 ⎢ ⎣  0  0  x 15  x 16  x 17  0  0  0 ⎥ ⎦
                                                            t
                                                        t
                                                    t
         其中,t 表示某一具体的时间点,没有使用的电极位置被置为 0,在神经网络中不起作用.通过转换,观测时间段
         [t,t+N−1]内的一维 EEG 向量序列[X t ,X t+1 ,…,X t+N−1 ]被转换成二维矩阵序列[Y t ,Y t+1 ,…,Y t+N−1 ],其中,二维网状矩阵
         的数量仍然是 N.再通过 Z-score 算法对该二维矩阵中的非零数据进行归一化处理,这样产生的二维网状矩阵序
         列既包含了时间信息,又包含了该时间点相关大脑活动的空间信息.然后,如图 1 的最后一步所示,应用滑动窗将
         二维网状矩阵序列划分为一个个单独的片段 P j ,作为融合了时空特征的一个 EEG 样本,每个片段具有固定长度
         (窗口大小),而且相邻两个片段之间不重叠,具体表示为 P j =[Y t ,Y t+1 ,…,Y t+s−1 ].其中,s 表示窗口的大小,即采样点的
         个数;j=1,2,…,q,q 是观测时间段被划分成 EEG 样本片段的个数.本文将进一步提出一种有效的混合深度学习模
         型,同时学习每个样本的矩阵序列 P j 在时间和空间上的相关性特征,并预测每个样本片段被试对应的情感类别.
         1.2   Casc-CNN-LSTM级联卷积循环神经网络模型
             本文首先提出用来学习捕获 EEG 序列的空间和时间特征的 Casc-CNN-LSTM 的模型结构,如图 2 所示.模
         型的输入是经过上述预处理的二维网状矩阵序列(如样本 P j ),它是一个包含了空间和时间信息的三维数据结
         构.首先,采用 CNN 网络从每一个二维网状矩阵中提取 EEG 数据的空域特征;然后,将提取的空间特征序列输入
         到 LSTM 网络,进一步提取 EEG 数据的时域特征;最后,通过一个全连接层接收 LSTM 网络最后一个时间点的
         输出,得到的特征向量再输入到一个 softmax 层进行最后的情感类别预测.
             为了提取每一个二维网状矩阵的空间特征,我们采用如图 2 所示的一个深度二维 CNN 网络进行空间特征
         学习.如上所述,输入模型的第 j 个 EEG 片段用二维网状矩阵序列 P j =[Y t ,Y t+1 ,…,Y t+s−1 ]∈R     s×h×w  表示,其中包含 s
         个 Y k (k=t,t+1,…,t+s−1)表示的二维网状矩阵元素,其大小是 h×w,h 和 w 分别表示电极位置网状矩阵的高和宽.将
         每一个网状矩阵分别输入到一个 2D-CNN 网络,经学习得到对应的空间特征表示 Z k (k=t,t+1,…,t+s−1):Z k =
                      l
         CNN 2D (Y k ),Z k ∈R .Z k 是一个包含 l 个元素的一维特征向量.由此,输入的 EEG 矩阵序列被转换成空间特征向量的
                                                  s×l
         序列:Cas-CNN:P j →Q j , where Q j =[Z t ,Z t+1 ,…,Z t+s-1 ]∈R .该 2D-CNN 模型包含 4 个卷积层,每层分别采用 16,32,64,
         128 个大小都是 3×3 的卷积核进行非填充的卷积操作,每一层都采用 ReLu 激活函数和 Adam 优化器,学习率取
         0.0005.经过学习,第 1 个卷积层得到 16 个 7×7 的特征图,第 2 个卷积层得到 32 个 5×5 的特征图,第 3 个卷积层
         得到 64 个 3×3 的特征图,第 4 个卷积层得到 128 个 1×1 的特征图.之后,应用一个包含 128 个神经元的全连接层
         将 128 个特征映射转换成最终的空间特征表示 Z k ∈R            128 .在将 2D-CNN 的输出结果输入 RNN 网络之前,这个全
         连接层是可选的.但是实验发现:添加这个全连接层,对于帮助模型收敛、提高整个框架的性能起着重要的作用.
             通过对模型的精准性和时效性的双重筛选,本文最终使用如图 2 所示的 LSTM 单元构建一个单层双向
         RNN 模型,将空间特征表示序列 Q j 输入到该 RNN 模型,进一步计算 EEG 片段时域的相关性特征.LSTM 是一种
         为了解决梯度消失和梯度爆炸问题而提出对 RNN 隐含层改进后的神经元结构.在双向 LSTM 中,顺逆序传播可
   203   204   205   206   207   208   209   210   211   212   213