Page 451 - 《软件学报》2024年第6期
P. 451
朱光辉 等: 基于自引导进化策略的高效自动化数据增强算法 3027
需的搜索耗时差异较大, 如在训练轮数固定为 60 轮时, ResNet-18 耗时 4.8 h, 远远小于 WRN 40×2 所需的 21.85 h,
但是两者最终输出的数据增强策略在 WRN 40×2 和 WRN 28×10 上的测试集准确率表现差异比较小. 同时, 在固
定评估网络架构的情况下, 随着评估网络训练轮数的增加, 算法输出的数据增强策略在最终的训练模型上表现均
有提升, 但是 60 轮至 90 轮的准确率提升较小, 90 轮至 120 轮的准确率几乎不再变化.
表 15 在 CIFAR-10 上评估网络架构和训练轮数对 SGES AA 准确率的影响对比
最终训练模型的测试集准确率 (%)
评估网络架构 评估网络训练轮数 搜索耗时 (h)
WRN 40×2 WRN 28×10
30 2.56 96.52±0.009 97.29±0.014
60 4.80 96.63±0.003 97.39±0.006
ResNet-18
90 7.48 96.63±0.006 97.38±0.010
120 9.98 96.64±0.005 97.39±0.008
30 11.14 96.54±0.015 97.30±0.013
60 21.85 96.64±0.008 97.39±0.011
WRN 402
90 33.08 96.64±0.007 97.39±0.010
120 44.24 96.65±0.009 97.38±0.008
表 16 和表 17 说明了 SGES AA 算法在 ESC-50 和 AGNews 数据集上使用不同的评估网络架构以及不同的训
练轮数对最终测试网络架构准确率的影响对比结果. 与 CIFAR-10 数据集上的结果类似, 即在固定训练轮数时, 评
估网络的架构越复杂, 算法输出的数据增强策略在最终的训练模型上会有小的提升, 但是复杂的评估网络模型需
要耗费更多的搜索时间. 在固定评估网络架构时, 随着评估网络训练轮数的增加, 算法输出的数据增强策略在最终
的训练模型上表现持平或有小幅提升. 因此, 本文针对 SGES AA 算法在数据集 CIFAR-10 上所选择的评估网络架
构模型为 ResNet-18, 并将训练轮数固定为 60 轮; 在数据集 ESC-50 上所选择的评估网络架构模型为 Inception, 并
将训练轮数固定为 5 轮; 在数据集 AGNews 上所选择的评估网络架构模型为 fastText, 并将训练轮数固定为 2 轮,
这样的选择可以在兼顾算法表现能力的同时缩减算法所需的耗时.
AGNews 上评估网络架构和训练轮数对
表 16 在 ESC-50 上使用 Inception 84.49±0.10 90.27±0.09
评估网络架构和训
表 17 在
练轮数对 SGES AA 准确率的影响对比 SGES AA 准确率的影响对比
最终训练模型的测试集 最终训练模型的测试集
评估网络 搜索耗时 评估网络 搜索耗时
评估网络架构 准确率 (%) 评估网络架构 准确率 (%)
训练轮数 (h) 训练轮数 (h)
Inception DenseNet fastText Transformer
3 1.60 83.70±0.22 89.74±0.16 1 0.38 91.35±0.14 91.90±0.10
5 3.13 84.46±0.18 90.23±0.20 2 0.72 91.66±0.05 92.12±0.04
Inception fastText
7 4.41 84.46±0.14 90.23±0.19 3 1.28 91.68±0.09 92.12±0.05
9 5.80 84.48±0.13 90.25±0.18 4 1.81 91.68±0.11 92.13±0.04
3 1.82 83.73±0.18 89.41±0.10 1 2.20 91.37±0.12 91.90±0.14
5 3.64 84.49±0.12 90.25±0.08 2 4.53 91.66±0.06 92.13±0.09
ResNet Transformer
7 5.37 84.50±0.13 90.26±0.06 3 6.87 91.67±0.04 92.14±0.16
9 6.78 4 9.05 91.68±0.10 92.14±0.11
4.5 子策略对实验准确率的影响分析
4.5.1 策略个数对实验准确率的影响分析
在 SGES AA 算法设计中, 策略个数 N H 作为算法超参数影响着最终输出数据增强策略的表现效果. 由算法 1
可知, 最终算法返回的容器 H 中存放的是最优表现的数据增强策略集合. 图 5–图 10 分别为不同策略个数在
CIFAR-10、ESC-50 和 AGNews 数据集下所得到的测试集准确率. 图中阴影是误差带阴影, 每个实验运行 3 次, 统
计均值 (黑点) 和标准差. 可以看出, 随着策略个数的增加, SGES AA 算法的准确率也会逐渐提升, 而在 5 个数据增
强策略时保持了最好的准确率, 继续增加策略个数反而会降低准确率. 上述结果表明在某个范围内增加策略个数