Page 451 - 《软件学报》2024年第6期
P. 451

朱光辉 等: 基于自引导进化策略的高效自动化数据增强算法                                                    3027


                 需的搜索耗时差异较大, 如在训练轮数固定为              60  轮时, ResNet-18  耗时  4.8 h, 远远小于  WRN 40×2  所需的  21.85 h,
                 但是两者最终输出的数据增强策略在             WRN 40×2  和  WRN 28×10  上的测试集准确率表现差异比较小. 同时, 在固
                 定评估网络架构的情况下, 随着评估网络训练轮数的增加, 算法输出的数据增强策略在最终的训练模型上表现均
                 有提升, 但是   60  轮至  90  轮的准确率提升较小, 90   轮至  120  轮的准确率几乎不再变化.

                             表 15    在  CIFAR-10  上评估网络架构和训练轮数对      SGES AA  准确率的影响对比

                                                                          最终训练模型的测试集准确率 (%)
                    评估网络架构          评估网络训练轮数            搜索耗时 (h)
                                                                         WRN 40×2          WRN 28×10
                                          30               2.56          96.52±0.009       97.29±0.014
                                          60               4.80          96.63±0.003       97.39±0.006
                     ResNet-18
                                          90               7.48          96.63±0.006       97.38±0.010
                                         120               9.98          96.64±0.005       97.39±0.008
                                          30              11.14          96.54±0.015       97.30±0.013
                                          60              21.85          96.64±0.008       97.39±0.011
                      WRN 402
                                          90              33.08          96.64±0.007       97.39±0.010
                                         120              44.24          96.65±0.009       97.38±0.008

                    表  16  和表  17  说明了  SGES AA  算法在  ESC-50  和  AGNews 数据集上使用不同的评估网络架构以及不同的训
                 练轮数对最终测试网络架构准确率的影响对比结果. 与                  CIFAR-10  数据集上的结果类似, 即在固定训练轮数时, 评
                 估网络的架构越复杂, 算法输出的数据增强策略在最终的训练模型上会有小的提升, 但是复杂的评估网络模型需
                 要耗费更多的搜索时间. 在固定评估网络架构时, 随着评估网络训练轮数的增加, 算法输出的数据增强策略在最终
                 的训练模型上表现持平或有小幅提升. 因此, 本文针对                SGES AA  算法在数据集    CIFAR-10  上所选择的评估网络架
                 构模型为   ResNet-18, 并将训练轮数固定为      60  轮; 在数据集  ESC-50  上所选择的评估网络架构模型为          Inception, 并
                 将训练轮数固定为       5  轮; 在数据集  AGNews 上所选择的评估网络架构模型为            fastText, 并将训练轮数固定为     2  轮,
                 这样的选择可以在兼顾算法表现能力的同时缩减算法所需的耗时.
                                                                        AGNews 上评估网络架构和训练轮数对
                 表 16    在  ESC-50  上使用  Inception 84.49±0.10 90.27±0.09
                                            评估网络架构和训
                                                               表 17    在
                       练轮数对   SGES AA  准确率的影响对比                         SGES AA  准确率的影响对比

                                          最终训练模型的测试集                                    最终训练模型的测试集
                           评估网络 搜索耗时                                    评估网络 搜索耗时
                 评估网络架构                        准确率 (%)        评估网络架构                        准确率 (%)
                           训练轮数      (h)                                训练轮数      (h)
                                           Inception  DenseNet                           fastText  Transformer
                              3      1.60  83.70±0.22 89.74±0.16           1      0.38  91.35±0.14 91.90±0.10
                              5      3.13  84.46±0.18 90.23±0.20           2      0.72  91.66±0.05 92.12±0.04
                   Inception                                    fastText
                              7      4.41  84.46±0.14 90.23±0.19           3      1.28  91.68±0.09 92.12±0.05
                              9      5.80  84.48±0.13 90.25±0.18           4      1.81  91.68±0.11 92.13±0.04
                              3      1.82  83.73±0.18 89.41±0.10           1      2.20  91.37±0.12 91.90±0.14
                              5      3.64  84.49±0.12 90.25±0.08           2      4.53  91.66±0.06 92.13±0.09
                   ResNet                                      Transformer
                              7      5.37  84.50±0.13 90.26±0.06           3      6.87  91.67±0.04 92.14±0.16
                              9      6.78                                  4      9.05  91.68±0.10 92.14±0.11
                  4.5   子策略对实验准确率的影响分析

                  4.5.1    策略个数对实验准确率的影响分析
                    在  SGES AA  算法设计中, 策略个数     N H  作为算法超参数影响着最终输出数据增强策略的表现效果. 由算法                    1
                 可知, 最终算法返回的容器         H  中存放的是最优表现的数据增强策略集合. 图                5–图  10  分别为不同策略个数在
                 CIFAR-10、ESC-50  和  AGNews 数据集下所得到的测试集准确率. 图中阴影是误差带阴影, 每个实验运行                    3  次, 统
                 计均值   (黑点) 和标准差. 可以看出, 随着策略个数的增加, SGES AA           算法的准确率也会逐渐提升, 而在           5  个数据增
                 强策略时保持了最好的准确率, 继续增加策略个数反而会降低准确率. 上述结果表明在某个范围内增加策略个数
   446   447   448   449   450   451   452   453   454   455   456