Page 6 - 《中国医疗器械杂志》2026年第1期
P. 6
Chinese Journal of Medical Instrumentation 2026年 第50卷 第1期
医 学 人 工 智 能
[7]
以及基于生理信号的识别方法 。情绪的产生与表 多个CNN-based深度学习模型,采用递归特征消除
recursive feature elimination, RFE)的选择方法,
达涉及大脑、自主神经系统等多个生理系统的活 (
动,这些系统的活动会产生对应变化的电生理信 最 终 在 WESAD数 据 集 的 三 分 类 任 务 中 , 使 用
号,为人体情绪状态的识别提供了客观、真实的信 EfficientNet实现了89.12%的情绪识别准确度。为了
[8]
号基础 。与脑电、皮电等电生理信号相比,心电 解决CNN在情绪识别中的过拟合问题,ROVINSKA
信号具有获取难度低、成本低、更易被使用者接 等 提出了一种无监督的特征自编码器,结合一维
[15]
受、可长时间连续测量等优点,因此本文基于心电 CNN作为分类器,在仅以心电信号作为信号源
信号开展情绪识别研究。 时,达到了81.47%的分类准确度,在以多模态
早期,研究者主要以心电信号的心率变异性 生理信号作为信号源时,达到了85.66%的分类准
heart rate variability, HRV)作为情绪识别的生物
( 确度。
标志物,计算的参数包括长时序列心电信号的 对于基于心电信号的情绪识别任务而言,以一
RR间期标准差、相邻RR间期差值的均方值、分形 维心电信号作为输入的一维时间序列网络,其通常
维数、样本熵等,根据若干参数的变化进行情绪识 仅具备有限的感受野,难以捕获到情绪识别任务所
[9]
别 。后来,随着人工智能技术的发展,基于机器 需的长程特征。而如果降低原始信号的采样率,使
学习、深度学习的方法展现出更高的情绪识别性 其与网络感受野相适应,则可能丢失原始信号中有
[10]
能。2021年,PANAHI等 采用分数傅里叶变换提 效的空间特征。受信号变换理论与SUN等的工作启
取了心电信号的分数阶时、频域特征,通过支持向 发,如果能够通过某种方法将一维时间序列的心电
量机实现了情绪识别,准确度达到78.3%。AXEL 信号转换为二维信号,将心电信号的时序特征转换
[11]
等 在提取经典时、频域特征之外,采用小波散射 到二维信号的组织方式里,则可以在保留原始信号
算法提取了心电信号的多尺度特征,在AMIGOS数 特征的同时,实现“时-空”特征的高效提取与融
据集上探讨了多种机器学习方法的情绪识别性能, 合,进而达到情绪识别的目标。
最终使用集成分类器取得了88.8%的准确度。2023年,
1 方法
[12]
VAZ等 提取了心电信号的幅度、心率、HRV等
共109维特征,结合特征选择与数据均衡技术,使
基于上述分析,本文以心电信号为情绪识别的
用 随 机 森 林 分 类 器 在 WESAD数 据 集 上 达 到 了
信号基础,首先提出一种基于小波包分解的1D-
86.4%的分类准确度。虽然基于机器学习的情绪识
2D信号转换方法,将一维心电信号转换为“二维
别模型具有解释性,但其通常需要人工进行特征设
图像”。随后,以此二维图像为输入,以ResNet18
计与选择,对所在领域知识和经验要求较高,若特
作为骨干网,通过改进跨层融合方式达到充分
征提取不当,模型性能会显著下降。近年来,基于
提取、融合心电信号空间、时序特征的目标,在
深度学习的情绪识别模型受到广泛关注。根据情绪
WESAD与SWELL-KW两个数据集上完成情绪识别
产生、表达与心电信号之间的生理基础关系,在采
任务。本文提出的情绪识别方法如图1所示。
用心电信号进行情绪识别时,不仅要提取短时心电
LLL
的空间特征,还要提取类似于节律特征的长时心电 LLH 预测结果
预处理 情绪识别网络 0, 1, 2
[13]
的时序特征。曹轩萌 在其硕士学位论文中提出了 HHH
1D心电信号 小波包分解 1D-2D信号转换
时、频域多层次特征融合模型,为将时、频域特征
(a) 整体流程
与时序特征融合,其将卷积神经网络(convolutional (a) Overview flowchart
neural network, CNN)与长短期记忆网络(long
short-term memory, LSTM)进行了双分支设计,在 Conv 1×1 Conv 1×1 Conv l×1
WESAD数据集上达到了95.9%的情绪识别准确
度。 2024年,SUN等 综合了机器学习与深度学 ൻೆ Conv 7×7 64 Max Pooling Fusion Block 64 Fusion Block 64 Basic Block 128 Fusion Block 128 Basic Block 256 Fusion Block 256 Basic Block 512 Fusion Block 512 Average Pooling FC-Laver ൻԛ
[14]
习的思路,从皮电(galvanic skin response, GSR)、
皮肤温度(skin temperature, SKT)以及血液容积 (b) 情绪识别网络
(b) Emotion recognition network
脉搏波(blood volume pulse, BVP)等三类一维信
图1 本文提出的情绪识别方法
号中生成了二维特征图,应用图像处理的方法构建 Fig.1 The emotion recognition method proposed in this paper
2

