Page 106 - 《软件学报》2024年第4期
P. 106
1684 软件学报 2024 年第 35 卷第 4 期
数据主要包括结构磁共振成像(structuralmagnetic resonance imaging, sMRI)、弥散磁共振成像(diffusion
magnetic resonance imaging, dMRI)、电子计算机断层扫描(computed tomography, CT)等, 其中, 基于 NAS 的脑
结构数据分析主要围绕 sMRI 数据进行研究. 此外, 本篇综述还涉及两篇基于 dMRI 和两篇基于 CT 的研究.
• 代表性脑功能数据介绍
fMRI 采集原理是利用磁振造影方法测量神经元活动所引发的血氧水平依赖(blood oxygenation level
dependent, BOLD)的改变 [11] . fMRI 数据在每个时间点扫描全脑空间数据, 在扫描时长内, 被试可根据要求处
于静息且非睡眠状态(静息态 fMRI)或执行认知任务(任务态 fMRI). 基于 fMRI 数据, 研究人员可开展特征提
取、大脑认知功能分析、脑疾病辅助诊断、信号重建等多种类型的研究. EEG 测量头皮上电位变化, 由大脑皮
质神经元电活动和生理/非生理伪迹等组成, 是大脑神经细胞的电生理活动在大脑皮层或头皮表面的总体反
映 [12] . EEG 原始信号由一系列随着时间不断变化的曲线组成, 其通道(channel)数量由参与采集的电极数量决
定. 对于 EEG 信号, 一般分析频段包括 delta(0−4 Hz), theta(4−8 Hz), alpha(8−13 Hz), beta(13−30 Hz)和 gamma
(30 Hz 以上)这 5 个频段. 基于 EEG 数据, 研究人员可开展脑状态编解码、特征提取、认知反馈、情感识别、
认知训练等多种类型的研究. NIR 是介于可见光和中红外光之间的电磁波 [13] , 波长在 780−2526 nm 范围内, 可
分为近红外短波(780−1100 nm)和近红外长波(1100−2526 nm). 由于含氧血红蛋白和脱氧血红蛋白具有不同的
吸收光谱, 因此, NIR 可测量流经传感器所在组织的血氧水平. 基于 NIR 数据, 研究人员可开展精神疾病辅助
诊断、术中实时脑活动检测等类型的研究.
• 代表性脑结构数据介绍
sMRI 利用原子核在磁场内共振产生的信号进行重建成像, 是一种非侵入、无辐射暴露的神经影像数据.
在数据采集过程中, 改变采集序列可生成不同类型的加权像 [14] . 当前, 主要的采集序列包括 T1 序列、T2 序列
和 Flair 序列: T1 加权像能够更清晰地显示断层解剖, T2 加权像可着重关注病灶所处的位置和大小, Flair 加权
像更关注病灶周围的情况. 基于 sMRI 数据, 研究人员可开展脑疾病辅助诊断、病灶分割、脑结构重建、脑影
像生成等类型的研究. dMRI 能够无创、无辐射及无需注射对比剂地检测体内组织水分子的布朗运动, 从而揭
示组织的微观结构变化, 可对脑白质结构进行刻画 [15] . 基于 dMRI 数据, 可利用纤维成像技术重建脑白质神
经纤维的三维结构, 实现脑图像的分割、脑疾病的辅助诊断、图像去噪、信号重建等. CT 利用 X 射线束对大
脑不同横断面的解剖关系和具体的脑组织结构进行显示 [16] , 对脑外伤的颅内水肿及颅内压、颅骨骨折、脑肿
瘤等脑疾病的诊断具有重要作用. 研究人员可基于 CT 数据开展数据重建、脑结构分割、脑疾病诊断等方面
的研究.
1.2 脑数据分析领域的主要深度学习方法
为了实现基于脑数据的分类诊断、影像重建、特征提取、图像分割、情感识别等目的, 已有众多经典
的深度学习方法被引入至脑数据分析领域, 主要包括全连接网络(fully connected neural network, FCNN)、卷
积神经网络(convolutional neural network, CNN)、循环神经网络(recurrent neural network, RNN)、深度置信网
络(deep belief network, DBN)、图卷积网络(graph convolutional network, GCN)、Transformer、生成对抗网络
(generative adversarial network, GAN)等. 其中, 在脑数据分析领域中, 作为 NAS 主干算法(backbone)的主要
深度学习方法包括 CNN, RNN, DBN, Transformer 及相关变种算法.
CNN 主要由卷积(核心层)、池化、归一化和全连接等操作层构成. 在处理脑数据时, CNN 可将欧式结
构的二维或三维脑数据作为模型的输入, 以保持原始大脑体素(voxel)、脑区之间的空间信息 [17] . CNN 具有
局部感知和参数共享的特点, 能够快速提取临近体素的关键特征, 再综合为全局信息, 因此更适用于对脑
空间数据的研究, 尤其适合基于脑结构数据的特征提取、分割与分类. RNN 可对数据中的时序信息进行挖
掘和利用, 前多个时刻的输出和当前时刻的输入共同决定了当前时刻的输出. 长短时记忆(long short-term
memory, LSTM)和门控循环单元(gated recurrent unit, GRU)是 RNN 的两个主要变种. RNN 及相关变种算法
RNN 及相关变种算法包含了记忆单元, 通过将神经单元的输出再输入的方式保留时间序列信息, 具有对时
[4]
序依赖关系的刻画能力, 因此能够对脑功能数据时序特征进行有效利用 . DBN 是一种概率生成模型, 由多