Page 6 - 《中国医疗器械杂志》2026年第1期

P. 6

Chinese Journal of Medical Instrumentation 2026年第50卷第1期

医学人工智能

[7]
以及基于生理信号的识别方法。情绪的产生与表多个CNN-based深度学习模型，采用递归特征消除
recursive feature elimination, RFE）的选择方法，
达涉及大脑、自主神经系统等多个生理系统的活（
动，这些系统的活动会产生对应变化的电生理信最终在 WESAD数据集的三分类任务中，使用
号，为人体情绪状态的识别提供了客观、真实的信 EfficientNet实现了89.12%的情绪识别准确度。为了
[8]
号基础。与脑电、皮电等电生理信号相比，心电解决CNN在情绪识别中的过拟合问题，ROVINSKA
信号具有获取难度低、成本低、更易被使用者接等提出了一种无监督的特征自编码器，结合一维
[15]
受、可长时间连续测量等优点，因此本文基于心电 CNN作为分类器，在仅以心电信号作为信号源
信号开展情绪识别研究。时，达到了81.47%的分类准确度，在以多模态
早期，研究者主要以心电信号的心率变异性生理信号作为信号源时，达到了85.66%的分类准
heart rate variability, HRV）作为情绪识别的生物
（确度。
标志物，计算的参数包括长时序列心电信号的对于基于心电信号的情绪识别任务而言，以一
RR间期标准差、相邻RR间期差值的均方值、分形维心电信号作为输入的一维时间序列网络，其通常
维数、样本熵等，根据若干参数的变化进行情绪识仅具备有限的感受野，难以捕获到情绪识别任务所
[9]
别。后来，随着人工智能技术的发展，基于机器需的长程特征。而如果降低原始信号的采样率，使
学习、深度学习的方法展现出更高的情绪识别性其与网络感受野相适应，则可能丢失原始信号中有
[10]
能。2021年，PANAHI等采用分数傅里叶变换提效的空间特征。受信号变换理论与SUN等的工作启
取了心电信号的分数阶时、频域特征，通过支持向发，如果能够通过某种方法将一维时间序列的心电
量机实现了情绪识别，准确度达到78.3%。AXEL 信号转换为二维信号，将心电信号的时序特征转换
[11]
等在提取经典时、频域特征之外，采用小波散射到二维信号的组织方式里，则可以在保留原始信号
算法提取了心电信号的多尺度特征，在AMIGOS数特征的同时，实现“时－空”特征的高效提取与融
据集上探讨了多种机器学习方法的情绪识别性能，合，进而达到情绪识别的目标。
最终使用集成分类器取得了88.8%的准确度。2023年，
1 方法
[12]
VAZ等提取了心电信号的幅度、心率、HRV等
共109维特征，结合特征选择与数据均衡技术，使
基于上述分析，本文以心电信号为情绪识别的
用随机森林分类器在 WESAD数据集上达到了
信号基础，首先提出一种基于小波包分解的1D-
86.4%的分类准确度。虽然基于机器学习的情绪识
2D信号转换方法，将一维心电信号转换为“二维
别模型具有解释性，但其通常需要人工进行特征设
图像”。随后，以此二维图像为输入，以ResNet18
计与选择，对所在领域知识和经验要求较高，若特
作为骨干网，通过改进跨层融合方式达到充分
征提取不当，模型性能会显著下降。近年来，基于
提取、融合心电信号空间、时序特征的目标，在
深度学习的情绪识别模型受到广泛关注。根据情绪
WESAD与SWELL-KW两个数据集上完成情绪识别
产生、表达与心电信号之间的生理基础关系，在采
任务。本文提出的情绪识别方法如图1所示。
用心电信号进行情绪识别时，不仅要提取短时心电
LLL
的空间特征，还要提取类似于节律特征的长时心电 LLH 预测结果
预处理情绪识别网络 0, 1, 2
[13]
的时序特征。曹轩萌在其硕士学位论文中提出了 HHH
1D心电信号小波包分解 1D-2D信号转换
时、频域多层次特征融合模型，为将时、频域特征
(a) 整体流程
与时序特征融合，其将卷积神经网络（convolutional (a) Overview flowchart
neural network, CNN）与长短期记忆网络（long
short-term memory, LSTM）进行了双分支设计，在 Conv 1×1 Conv 1×1 Conv l×1
WESAD数据集上达到了95.9%的情绪识别准确
度。 2024年，SUN等综合了机器学习与深度学 ൻೆ Conv 7×7 64 Max Pooling Fusion Block 64 Fusion Block 64 Basic Block 128 Fusion Block 128 Basic Block 256 Fusion Block 256 Basic Block 512 Fusion Block 512 Average Pooling FC-Laver ൻԛ
[14]
习的思路，从皮电（galvanic skin response, GSR）、
皮肤温度（skin temperature, SKT）以及血液容积 (b) 情绪识别网络
(b) Emotion recognition network
脉搏波（blood volume pulse, BVP）等三类一维信
图1 本文提出的情绪识别方法
号中生成了二维特征图，应用图像处理的方法构建 Fig.1 The emotion recognition method proposed in this paper

1 2 3 4 5 6 7 8 9 10 11