Page 450 - 《软件学报》2024年第6期
P. 450

3026                                                       软件学报  2024  年第  35  卷第  6  期


                 略参数随机选择. 实验结果表明, SGES AA         算法在语音分类任务的         ESC-50  和  GTZAN  上均达到了最佳的数据增
                 强效果.

                                  表 13    SGES AA  算法和其他算法在语音数据集上的准确率对比             (%)

                      数据集               算法               ResNet           Inception         DenseNet
                                       Baseline         84.75±0.13        81.25±0.14        87.15±.012
                                       Random           86.20±0.18        81.68±0.21        88.29±0.17
                                       DADA             89.45±0.26        83.25±0.44        89.75±0.76
                      ESC-50
                                       Rand AA          88.58±0.31        83.75±0.54        89.08±0.82
                                       ARS AA           88.74±0.11        83.85±0.20        89.92±0.33
                                      SGES AA           90.06±0.11        84.46±0.18        90.23±0.20
                                       Baseline         91.60±0.09        85.21±0.14        92.40±0.10
                                       Random           91.55±0.21        86.20±0.18        92.93±0.17
                                       DADA             91.75±0.26        86.80±0.40        92.42±0.28
                      GTZAN
                                       Rand AA          91.50±0.52        85.87±1.54        92.80±0.32
                                       ARS AA           91.83±0.14        87.44±0.11        92.88±0.10
                 算法输出的数据增强策略在测试集上的准确率. 本文分别在
                                      SGES AA           92.23±0.07        88.40±0.10        93.62±0.09
                  4.3.3    文本分类实验
                    表  14  为不同的模型与算法在       AGNews 和  DBpedia 数据集上的测试准确率结果, 其中          Random  代表数据增
                 强策略参数随机选择. 实验结果表明, SGES AA            算法在文本分类任务的         AGNews 上达到了最佳的数据增强效
                 果, 除了  DBpedia 的  TextCNN  模型比使用增强随机搜索的        ARS AA  算法稍差之外, 其他模型均达到了最佳的
                 数据增强效果. 由于分类的准确率已经较高, 相对于图像分类和语音分类, 数据增强对于文本分类任务的作用
                 效果比较微弱, 而且从随机的数据增强策略也可以发现, 坏的数据增强策略反而会降低文本分类模型的预测能
                 力和泛化能力.

                                  表 14    SGES AA  算法和其他算法在文本数据集上的准确率对比             (%)

                     数据集          算法           fastText     TextCNN      Bi-LSTM+Attention   Transformer
                                 Baseline     90.59±0.06   91.94±0.06       91.34±0.10       90.93±0.04
                                 Random       90.67±0.06   91.87±0.05       90.89±0.09       91.02±0.06
                                 DADA         91.57±0.08   91.75±0.13       90.98±0.28       91.64±0.29
                    AGNews
                                 Rand AA      91.04±0.12   90.92±0.17       90.41±0.06       91.57±0.14
                                 ARS AA       91.49±0.08   92.11±0.06       91.10±0.08       92.06±0.05
                                SGES AA       91.66±0.05   92.60±0.07       91.56±0.08       92.12±0.04
                                 Baseline     97.71±0.02   98.61±0.05       98.70±0.08       98.27±0.06
                                 Random       97.88±0.04   98.10±0.05       98.26±0.10       97.95±0.08
                                 DADA         97.74±0.08   98.56±0.07       98.78±0.13       98.34±0.10
                    DBpedia
                                 Rand AA      97.83±0.12   98.49±0.04       98.74±0.10       98.35±0.09
                                 ARS AA       97.92±0.04   98.76±0.06       98.82±0.10       98.44±0.04
                                SGES AA       98.04±0.05   98.72±0.06       98.94±0.07       98.62±0.09
                  4.4   策略评估对实验准确率的影响分析
                    在  SGES AA  算法的策略评估流程中, 算法需要将策略向量转换为具体的数据增强策略, 然后再对该策略进
                 行评估. 不同的评估网络架构以及评估网络架构训练轮次均会对策略的评估产生不同的评估值, 从而最终影响到
                                                               CIFAR-10、ESC-50  和  AGNews 数据集上, 针对不同
                 的评估网络架构和不同的网络架构训练轮次这两个因素进行了相关实验.
                    由表  15  可以看出, 在固定评估网络训练轮数的情况下, 针对两种不同的评估网络架构, 即                       ResNet-18 (网络模
                 型结构相对更简单) 与       WRN 40×2 (网络模型结构相对更复杂), SGES AA        得到的数据增强策略对于最终训练模型
                 的测试集准确率影响不显著. 但是, 由于简单的网络架构模型在训练时更加快速, 导致最终自动化数据增强算法所
   445   446   447   448   449   450   451   452   453   454   455