Page 119 - 《软件学报》2024年第4期
P. 119
李晴 等: 神经网络结构搜索在脑数据分析领域的研究进展 1697
StructSeg 2019 数据集(https://structseg2019.grand-challenge.org/)是 2019 年 MICCAI 会议提供的头颈部 CT
图像数据集, 该数据集提供了 60 名头颈癌患者的头颈部 CT 图像. 其中, 训练集包含 50 名被试, 测试集包含
10 名被试. 数据集标记了了 22 个头颈部结构区域: 脑干、眼睛(左、右)、内耳(左、右)、晶状体(左、右)、下
颌骨(左、右)、中耳(左、右)、视交叉、视神经(左、右)、腮腺(左、右)、垂体、脊髓、颞叶(左、右)和颞下颌
关节(左、右).
4.2 实验设置
由于不同实验策略在不同的应用场景、数据集和识别难度上均存在差异, 因此, 为了验证 NAS 模型在不
同方面的表现, 满足不同任务对算法模型的性能进行对比和评估的需求, 本文选择了 HCP, MSD, ABDIDE,
BCI Competition IV 这 4 个在不同模态数据和应用任务上最常用的数据集, 在表 5 中比较了开展 NAS 算法研
究的实验策略, 以进行横向对比和分析.
表 5 基于不同的公开数据集和任务类型的实验策略
文献 数据集 被试数量/样本数量 任务类型 实验策略
文献[31] 情绪任务, 选取 32 名被试 −
文献[32] 全部 7 个任务, 每个任务选取 600 名被试 训练集:测试集=5:1
训练集:验证集:
文献[10] 全部 7 个任务, 每个任务选取 750 名被试
测试集=3:1:1
文献[22] 全部 7 个任务, 每个任务选取 700 名被试 N-折交叉验证
HCP 情绪和工作记忆 2 个任务 特征提取 训练集:验证集:
文献[21]
每个任务选取 750 名被试 测试集=3:1:1
情绪和运动任务, 选取 200 名被试 训练集:验证集:
文献[34]
其他 5 个任务选取 100 名被试 测试集=5:3:2
情绪、赌博、语言这 3 个任务态: 训练集:测试集=
文献[35]
每个任务选取 865 名被试 75:11
训练集:测试集=4:1
文献[49] 484 个大脑样本, 20 个心脏样本, 64 个肺样本
5 折交叉验证
文献[57] 750 个大脑样本, 30 个心脏样本, 48 个前列腺样本 5 折交叉验证
750 个大脑样本, 30 个心脏样本, 201 个肝脏样本, 医学图像
文献[58] MSD 394 个海马体样本, 48 个前列腺样本, 96 个肺样本, 分割(识别 5 折交叉验证
420 个胰腺样本, 443 个血管样本, 61 个脾脏样本 病灶/器官)
文献[61] 3264 个大脑样本 训练集:测试集约 7:1
文献[54] 281 个样本 5 折交叉验证
文献[55] 20 个心脏样本, 195 个海马体样本 5 折交叉验证
BNI 站点的 58 名被试中随机选择了 20 名被试
文献[36] (10 名 ASD 患者和 10 名健康被试) 3 分类 训练:测试=7:3
ABIDE (沟、回、
文献[9] BNI 站点的 58 名被试(29 名 ASD 患者和 29 名健康被试) 三回交叉点) 训练:测试=7:3
EMC 站点的 51 名被试(24 名 ASD 患者和 27 名健康被试)
BCI Competition IV 2a:9 名被试 运动想象 单被试&跨被试&
文献[25] BCI BCI Competition IV 2b:9 名被试 4 分类、2 分类 混合被试
Competition
文献[28] IV BCI Competition IV 2a:9 名被试 运动想象 单被试&跨被试&
4 分类 混合被试
表 5 表明, 研究者选择的实验策略很大程度取决于所采用的数据集和研究的任务类型. 其中, 在基于
EEG 的相关研究中会采用被试内、跨被试和混合被试的不同训练和测试策略. 被试内是指训练集和测试集均
使用同一个被试的数据. 当数据集的被试量较小、而每名被试都进行了多个 session 的实验时, 可以将每个被
试不同 session 的数据分别用于模型的训练和测试. 由于人脑数据具有较大的个体间差异, 这种单被试策略可
以一定程度上避免数据分布的偏移问题, 易获得较高的识别精度. 跨被试是指训练集使用部分被试的样本数
据, 测试集使用另一批被试的样本数据. 大脑存在个体差异性, 任意选择单个个体可能不能有效代表群体分
布. 因此, 跨被试策略可用于验证模型对不同个体的泛化能力. 混合被试是指训练集和测试集均来源于不同
被试进行同一任务的样本数据. 样本标签不以被试进行划分, 更符合实际应用场景. 在基于 NAS 对脑数据进
行分析的研究中, 当被试不足时, 可采用被试内的研究方式扩充数据; 当被试量充足时, 更适合采用混合被