Page 352 - 《软件学报》2025年第9期
P. 352

赵亚茹 等: 云边联邦学习系统下抗投毒攻击的防御方法                                                      4263



                     76                   70                    76
                                                                                     60
                     75                   60                    74                   50
                                          50
                    Acc (%)  74          ASR (%)  40           Acc (%)  70          ASR (%)  40
                                                                72
                                                                                     30
                     73
                                          30
                     72                   20                    68                   20
                                                                66
                                          10                                         10
                     71                                         64
                       10  20   30   40     10   20   30   40     10  20   30   40     10   20   30  40
                             b (%)                 b (%)                b (%)                b (%)
                            (a) Acc              (b) ASR               (c) Acc              (d) ASR
                                              Ours  FedAvg  MKrum  Median  FoolsGold
                                     图 5 不同防御算法在       CIFAR-10  数据集下的   Acc 和  ASR 比较

                                                       b 的增加, FedDiscrete 防御模型在   non-IID  场景下均获得了最高
                    我们注意到, 在所有比较的防御方法中, 随着
                 的   Acc  和最低的  ASR, 表现出最好的防御性能. 例如, 在       b = 40%  时, FedDiscrete  实现了  ASR 27.60%, 明显低于
                 FedAvg, MKrum, Median  和  FoolsGold  防御所获得的  ASR, 分别为  52.40%, 61.80%, 58.00%  和  57.10%, 类似地  Acc.
                 而且, 在  IID  场景下, FedDiscrete  仍然获得了较好的防御效果, 除了在        b = 30% 时, FedDiscrete  有第  2  好的  ASR
                 20.60%, 略高于  FoolsGold  防御实现的  ASR 16.90%, 仅增加了  3.70%, 在这种情况下, 即使从     b = 10% 到  b = 40%,
                                   ASR, 仅浮动了             Acc 浮动了  0.94%.
                 我们的防御方案实现了                    16.20%, 以及
                    而且, 从图   5(a) 和  (d) 中也可以观察到, 无论是在     IID  还是  non-IID  场景下, MKrum  均获得了最差的   Acc 和
                 ASR, 因此, 我们可以视为     MKrum  在防御数据投毒攻击方面不是有效的. FedAvg            和  Median  在  IID  场景下实现了
                             ASR 明显弱于我们的防御方案. 在这          4  种对比的防御方法中, FoolsGold     在  IID  场景下表现最好,
                 相当的结果, 但
                                         ASR, 略优于  FedDiscrete 方法, 然而, FoolsGold  在  non-IID  场景下表现出较差的
                 且在  b = 30% 时实现了较低的
                 防御效果, 这表明     FoolsGold 在检测并应对投毒攻击方面可能不是可行和有效的. 综上可知, 结果表明                     FedDiscrete
                 在抵抗投毒攻击方面具有一定的有效性, 同时也反映出兼顾攻击者搭便车以及采用离散更新空间实施防御的策
                 略是可行和有效的, 这也进一步强调了第             4.2.2  节中的结论. 此外, 这个结果也支持了我们在第            4.2.2  节中的推测.

                 4.2.4    不同攻击者数量下的评估
                    在不同的攻击者占比   (                     40%) 下, 我们首先展示了      IID  场景下  FedDiscrete  在  MNIST  和
                                     b 10%, 20%, 30%  和
                 CIFAR-10  数据集上的防御性能, 并采用        Acc Cpre Crec F1 和  ASR 指标进行评估. 值得注意的是, 本节引入了
                                                    ,
                                                              ,
                                                         ,
                                                 ,
                 b = 0 的情况作为对比基准, 并使用       Cpre tc Crec tc  和  F1 tc  指标集中于评估目标标签的测试性能.
                    对于  MNIST, 如图  6(a) 所示, 随着  b 的增加, 目标标签的类精度       (Cpre tc ) 和类召回率  (Crec tc ) 明显下降,  Acc 和
                               30% 时出现反向增长, 主要原因在于每一轮随机选择的攻击者并非相同, 局部模型训练受到不
                 F1 tc  在  b = 20% 和
                 同程度的攻击影响, 使得每一轮的离散更新空间及参与者的贡献度存在差异. 尽管                          b 不断增加, 但   FedDiscrete 仍
                 然实现了    90%  以上的   Acc Crec tc  和  F1 tc , 特别地, 除了在   b = 40% 时实现了  Cpre tc  88.00%, 其表现出同样的性能.
                                     ,
                 同时可以观察到, 不同      b 下实现的   Acc 均弱于没有发起投毒攻击        (b = 0) 的情况下所获得的    Acc 97.83%.


                     100
                                                  70                          20   MNIST
                                                                                   CIFAR-10
                    Metric results (%) 98  Acc   Metric results (%)  60  Acc  ASR (%)  15
                                                  65
                                                                                   Fashion-MNIST
                     96
                     94
                                                  55
                                                                     Cpre tc
                                                                              10
                                                  50
                     92
                                                                     Crec tc
                                                  45
                          Cpre tc
                     90
                          Crec tc
                                                  40                 F1 tc     5
                     88   F1 tc                                                0
                                                  35
                        0    10   20   30   40       0   10   20   30   40       10    20     30    40
                                 b (%)                       b (%)                        b (%)
                               (a) MNIST                   (b) CIFAR-10                  (c) ASR
                                                           b 下的指标对比
                                                  图 6 不同
   347   348   349   350   351   352   353   354   355   356   357