Page 9 - 《中国医疗器械杂志》2026年第1期
P. 9

Chinese Journal of Medical Instrumentation                                         2026年 第50卷 第1期

                                                     医  学  人   工  智  能



              序信号特征提取与融合的LSTM方法而言,在基于                               从混淆矩阵可见,本文方法在“静息”与“压
              心电信号的情绪识别研究中,心电信号的特征模式                            力”两类之间未出现误分类,体现出更强的判别能
              比较契合CNN的特征提取方式,相较于ResNet,                         力,特别是 “娱乐”类误判数量从97例降至4例,
              LSTM计算过程更加复杂,不具备显著的优势,                            说明本文方法在时-空特征提取、融合方面具有优
              反而可能导致训练困难与过拟合(我们观察到                              势。总体上,改进后的模型在类别边界更模糊的场
                                            −4
              LSTM在训练集上的loss值接近10 ,这高于相同实                       景中表现出了更高的鲁棒性。
              验配置训练下ResNet的loss值)。进一步地,与                            为了进一步凸显本文方法的优势,我们使用
                    [14]
              SUN等 提出的以二维特征图为输入的情绪识别方                           SWELL-KW数据集进行验证。由于缺少表2中各方法
              法(CNN+RFE)相比,由于该方法的特征提取部                          的源码,因此本文在SWELL-KW数据集的实验中
              分采用了人工提取的特征,在其重新排列构成的二                            仅比较了可以复现的网络结果。SWELL-KW数据
              维特征图中,相邻特征值的逻辑关系并不清晰,对                            集的ECG信号采样率为2 048 Hz,共有25个受试者,
              于与情绪识别任务相关的时-空特征的提取、融合                            74条数据。本文随机将22个受试者的数据划分为训
                                            [14]
              不够充分,这可能是影响SUN等 方法取得更高性
                                                                练集,3个受试者的数据划分为测试集,并以10 s为
              能的瓶颈。
                                                                一个数据片段。各方法的情绪识别结果如表3所示。
                  为了验证在ResNet18网络方面的改进,本文以
                                                                      表3   SWELL-KW数据集上各方法的实验结果
              相同的经过小波包分解重排后的二维信号作为输                              Tab.3  Experimental results of various methods on the SWELL-KW
              入,重新在传统ResNet18网络上进行了训练,其准                                             dataset
              确度与F1分数分别为92.36%与82.53%。结果相较                             方法              Acc(%)        F1(%)
              于 以 一 维 原 始 心 电 信 号 作 为 输 入 的 ResNet18                 ResNet(1D)        67.61          59.57
              网络有所提升(92.36% vs. 90.49%),但相较于引                          LSTM            59.82          N/A
              入Fusion Block模块的网络仍落后4.49%。该消融实                        ResNet(2D)        71.98          57.17
              验表明,本文提出的1D-2D信号转换方法、Fusion                            本文方法              80.27          73.02

              Block模块均具备良好的时空特征提取、融合能
                                                                    由表3可知,虽然在SWELL-KW数据集上,各
              力,提高了基于心电信号的情绪识别性能。
                                                                方法的性能均低于在WESAD数据集上的结果,但
                  为了评估本文方法的计算复杂度,本文对比了
                                                                本文提出的基于1D-2D信号转换的情绪识别方法
            “  一维心电+ResNet18”以及本文方法的网络参数
                                                                仍然取得了最好的量化结果,相较于单纯的一维
              量与计算开销。对于“一维心电+ResNet18”的情
                                                                处理方法,准确度与F1分数均提高了超过10%。
              绪识别网络,其参数量约为3.85×10 ,计算开销约
                                               6
              为1.20 GFLOPs。对于本文方法,信号转换的计算                        3    结论
                                                           6
              量约为0.37 MFLOPs,网络参数量约为11.17×10 ,
              网络计算开销约为0.48 GFLOPs。综上,本文方法                           情绪识别是具有广泛应用前景的研究领域,受
              虽然参数量有所增加,但是计算代价小于一维网络。                           到了研究人员的普遍关注。目前研究人员多关注于
                  为进一步分析模型在各类状态下的具体表现,                          通过设计特定的网络结构来实现时-空特征的高效
              我们对ResNet18(2D)与本文方法的预测结果进行了                      提取与融合,通过提升数据规模来提升情绪识别的
              混淆矩阵可视化,如图4所示。                                    性能与泛化性,但是这些研究仍主要以一维信号、
                                                                一维网络结构为基础。一维信号分析、处理的局限
                   娱乐  455  1  13        娱乐  445  0  24         性是相关研究性能提升的瓶颈所在。一方面,受信
                 真实类别  压力  12  260  4  真实类别  压力  0  262  14     号重排方面研究的启发;另一方面,二维图像处理
                                                                相关的研究提供了大量高性能的网络结构、模块,
                   静息  72  25  48        静息  2   2  141         本文希望能够从二维研究中获得解决传统一维问题
                                                                的新思路。因此,本文提出了一种基于1D-2D信号
                     静息   压力   娱乐          静息  压力   娱乐
                        预测结果                  预测结果              转换的情绪识别方法,在WESAD与SWELL-KW数
                        (a) ResNet18          (b) 本文方法          据集上获得了良好的情绪识别结果。对于基于1D-
                        (a) ResNet18   (b) Method proposed in this paper
                                                                2D信号转换的研究任务而言,转换方法是研究的
                       图4   WESAD数据集实验的混淆矩阵
                  Fig.4  Confusion matrix for the WESAD dataset experiments  重点。信号转换的目标是通过重排所需特征,使其


                                                              5
   4   5   6   7   8   9   10   11   12   13   14