Page 166 - 《软件学报》2024年第4期
P. 166

1744                                                       软件学报  2024 年第 35 卷第 4 期

                各种对比算法在不同任务上的收敛效果以及 BBT 系列任务的泛化性能(泛化性能只在测试集上测试
                当前最优解的性能,  测试集并不会参与到训练过程).  从图 8 中可以看出, GRACE 算法在各任务上均
                能够较快地收敛;  从表 3 中展示的各种算法的最终收敛情况,  可以看出 GRACE 可以收敛到高质量解;
             •  在运行时间方面,  从表 3 中的平均评估时间可以看出, GRACE 算法能够很好地权衡优化时间和解的
                性能,  在使用远少于多保真度优化方法(BOHA, ASHA)运行时间的情况下,  实现高质量的收敛.
             (3)  稳健性.
             我们设计了针对 GRACE 超参数γ的实验,  通过不同超参数配置下的实验结果说明 GRACE 算法的超参数
         稳健性.  超参数γ控制着对批量相似树的分割,  同时间接控制着每次评估使用的批量数.  在算法超参数稳健性
         分析部分,  本文通过选取γ的不同取值{1.0,2.0,4.0,5.0,6.0,8.0,10.0,12.0},  观察 GRACE 的性能变化.  在 SST-2 数
         据集和 Housing 数据集上的超参数实验结果分别如图 8(e)、图 8(g)所示.  从图中可以看出:  除了较为极端的(1.0
         和 12.0),  其他超参数取值均能取得较好的收敛效果,  这体现了 GRACE 算法的稳健性.  同时可以发现:  尽管在
         一定范围的超参数配置下, GRACE 算法在各任务上均能取得较好的收敛效果,  但对于不同的任务,  超参数γ的
         最优取值可能有所不同,  这也是未来工作可进一步探索的问题,  即自适应调节γ.
             (4)  可理解性.
             通过展示 GRACE 算法在优化过程中使用批量数目的动态变化,  我们可以加强对算法行为的理解,  进而
         分析算法的行为特征.  同时,  针对不同的批量大小进行实验,  观察算法的性能变化.
             通过动态展示优化过程中评估使用的批量数,  进而对算法的内部运行过程进行深入的分析.  在这部分实
         验中,  选取了分类任务 SST-2、AG’s News 和回归任务 Housing 进行进一步的分析,  实验结果如图 8(a)~图(c)
         所示.  同时,  在超参数实验中,  本文也绘制了 GRACE 在超参数γ不同取值下的评估批量数动态变化图,  如图
         8(f)和图 8(h)所示.









                (a) SST-2 低维                     (b) SST-2 高维                 (c) AG’s News 低维              (d) AG’s News 高维









              (e) SST-2 低维(泛化)              (f) SST-2 高维(泛化)            (g) AG’s News 低维(泛化)     (h) AG’s News 高维(泛化)









                  (i) Housing                    (j) CovType                 (k) Digits (50)                  (l) Digits (100)
                                            图 7   对比实验结果图
   161   162   163   164   165   166   167   168   169   170   171