Page 226 - 《软件学报》2025年第5期
P. 226

2126                                                       软件学报  2025  年第  36  卷第  5  期



                     1.2               Base     250                         600
                                       λ A =e −1
                                       λ A =e −2  200              Base     500                Base
                                       λ A =5e −3
                     1.0
                   Supervised loss  0.8  λ A =5e −4  ALCW loss  150  λ A =e −2  Ratio  400     λ A =e −2
                                                                                               λ A =e −1
                                                                   λ A =e −1
                                       λ A =e −3
                                                                                               λ A =5e −3
                                                                   λ A =5e −3
                                                                   λ A =e −3
                                                                                               λ A =e −3
                                                                            300
                                                                                               λ A =5e −4
                                                                   λ A =5e −4
                                                100
                                                                            200
                     0.6
                     0.4                         50                         100
                                                  0                           0
                        0 4 8 12 16 20 24 28 32 36 40  0 4 8 12 16 20 24 28 32 36 40  0 4 8 12 16 20 24 28 32 36 40
                                Epochs                      Epochs                      Epochs
                             (a) 监督损失变化               (b) ALWR 正则损失变化        (c) ALWR 正则损失与监督损失比值变化
                                      图 4 ALWR   模型训练过程中监督损失和正则损失的变化


                       99.0                      96
                                                                          50
                                                 94
                       98.5
                                                                          40
                                                 92
                       99.0                                               30
                                           λ A =1.00  90            λ A =1.00               λ A =1.00
                       97.5                λ A =0.50                λ A =0.50               λ A =0.50
                                           λ A =0.10  88            λ A =0.10  20           λ A =0.10
                       97.0                λ A =0.05  86            λ A =0.05  10           λ A =0.05
                              0.200 0.100 0.050 0.020 0.010 0.005 0.001  0.200 0.100 0.050 0.020 0.010 0.005 0.001  0.200 0.100 0.050 0.020 0.010 0.005 0.001
                                    λ T /λ A                 λ T /λ A                 λ T /λ A
                                 (a) 自然准确率            (b) PGB(ϵ=0.05)健壮准确率    (c) PGB(ϵ=0.20)健壮准确率
                                 图 5 MNIST  上不同参数的     LWR  模型自然准确度和       PGD  健壮准确度

                    图  6  给出了  LWR  在不同正则参数下的训练所得模型在            CIFAR-10  数据集上的自然准确度和在两个不同强弱
                 的  C&W  攻击下的健壮准确度. 考虑到        VGG19  结构更加复杂且     LWR  的微调作用, 我们取较小的        0.01  为  λ A  值, 然
                                                          λ A  的比值为横坐标, 最左侧的+号点为        Base 模型各准确率表
                 后改变  λ T  的值, 观察各准确率的变化情况, 仍以        λ T  与
                 现. 发现自然准确度由      λ A  值决定, 且随着  λ T  的减小而减小, 与  MNIST  数据集上展现出的结果一致. 在面对基于优
                 化的攻击时的健壮性表现上, 无论噪声的强弱, 准确率都随                 λ T  的减小而表现出明显的提升.

                                           90
                                           80
                                           70
                                           60
                                           50
                                           40
                                           30
                                                                   NA
                                                                   C&W(λ cw =0.1)
                                           20
                                                                   C&W(λ cw =10)
                                                   1.000 0.500 0.100 0.050 0.010 0.005
                                                              λ T /λ A
                                图 6 CIFAR-10  上不同参数的    LWR  模型自然准确度和      C&W  健壮准确度

                    综上分析, 结合没有免费午餐定理           (no free lunch, NFL), 我们认为获得一个泛化性能优异且对任何类型的攻击
                 都具有很好健壮性的模型是困难的. 针对不同的学习任务采用不同的学习策略是必要的, 对于泛化要求高且不会
                 受对抗攻击的任务, 可以使用较小的           λ T  值并将  λ A  设置为  0  即训练  TLWR  模型, 对于模型健壮性要求较高的任务,
   221   222   223   224   225   226   227   228   229   230   231