Page 450 - 《软件学报》2024年第6期
P. 450
3026 软件学报 2024 年第 35 卷第 6 期
略参数随机选择. 实验结果表明, SGES AA 算法在语音分类任务的 ESC-50 和 GTZAN 上均达到了最佳的数据增
强效果.
表 13 SGES AA 算法和其他算法在语音数据集上的准确率对比 (%)
数据集 算法 ResNet Inception DenseNet
Baseline 84.75±0.13 81.25±0.14 87.15±.012
Random 86.20±0.18 81.68±0.21 88.29±0.17
DADA 89.45±0.26 83.25±0.44 89.75±0.76
ESC-50
Rand AA 88.58±0.31 83.75±0.54 89.08±0.82
ARS AA 88.74±0.11 83.85±0.20 89.92±0.33
SGES AA 90.06±0.11 84.46±0.18 90.23±0.20
Baseline 91.60±0.09 85.21±0.14 92.40±0.10
Random 91.55±0.21 86.20±0.18 92.93±0.17
DADA 91.75±0.26 86.80±0.40 92.42±0.28
GTZAN
Rand AA 91.50±0.52 85.87±1.54 92.80±0.32
ARS AA 91.83±0.14 87.44±0.11 92.88±0.10
算法输出的数据增强策略在测试集上的准确率. 本文分别在
SGES AA 92.23±0.07 88.40±0.10 93.62±0.09
4.3.3 文本分类实验
表 14 为不同的模型与算法在 AGNews 和 DBpedia 数据集上的测试准确率结果, 其中 Random 代表数据增
强策略参数随机选择. 实验结果表明, SGES AA 算法在文本分类任务的 AGNews 上达到了最佳的数据增强效
果, 除了 DBpedia 的 TextCNN 模型比使用增强随机搜索的 ARS AA 算法稍差之外, 其他模型均达到了最佳的
数据增强效果. 由于分类的准确率已经较高, 相对于图像分类和语音分类, 数据增强对于文本分类任务的作用
效果比较微弱, 而且从随机的数据增强策略也可以发现, 坏的数据增强策略反而会降低文本分类模型的预测能
力和泛化能力.
表 14 SGES AA 算法和其他算法在文本数据集上的准确率对比 (%)
数据集 算法 fastText TextCNN Bi-LSTM+Attention Transformer
Baseline 90.59±0.06 91.94±0.06 91.34±0.10 90.93±0.04
Random 90.67±0.06 91.87±0.05 90.89±0.09 91.02±0.06
DADA 91.57±0.08 91.75±0.13 90.98±0.28 91.64±0.29
AGNews
Rand AA 91.04±0.12 90.92±0.17 90.41±0.06 91.57±0.14
ARS AA 91.49±0.08 92.11±0.06 91.10±0.08 92.06±0.05
SGES AA 91.66±0.05 92.60±0.07 91.56±0.08 92.12±0.04
Baseline 97.71±0.02 98.61±0.05 98.70±0.08 98.27±0.06
Random 97.88±0.04 98.10±0.05 98.26±0.10 97.95±0.08
DADA 97.74±0.08 98.56±0.07 98.78±0.13 98.34±0.10
DBpedia
Rand AA 97.83±0.12 98.49±0.04 98.74±0.10 98.35±0.09
ARS AA 97.92±0.04 98.76±0.06 98.82±0.10 98.44±0.04
SGES AA 98.04±0.05 98.72±0.06 98.94±0.07 98.62±0.09
4.4 策略评估对实验准确率的影响分析
在 SGES AA 算法的策略评估流程中, 算法需要将策略向量转换为具体的数据增强策略, 然后再对该策略进
行评估. 不同的评估网络架构以及评估网络架构训练轮次均会对策略的评估产生不同的评估值, 从而最终影响到
CIFAR-10、ESC-50 和 AGNews 数据集上, 针对不同
的评估网络架构和不同的网络架构训练轮次这两个因素进行了相关实验.
由表 15 可以看出, 在固定评估网络训练轮数的情况下, 针对两种不同的评估网络架构, 即 ResNet-18 (网络模
型结构相对更简单) 与 WRN 40×2 (网络模型结构相对更复杂), SGES AA 得到的数据增强策略对于最终训练模型
的测试集准确率影响不显著. 但是, 由于简单的网络架构模型在训练时更加快速, 导致最终自动化数据增强算法所