Page 355 - 《软件学报》2025年第9期
P. 355

4266                                                       软件学报  2025  年第  36  卷第  9  期



                 的比例   α ∈ (0.05,1000), 未能清晰划分两种攻击场景的界限. 结果例证了即使在              non-IID  攻击场景下, FedDiscrete
                 防御仍然是有效的和鲁棒的, 并优于先进的解决方案.
                    3) 不同指标下    FedDiscrete  性能评估: 为了公平, 我们也给出了        non-IID  场景下  FedDiscrete  在  MNIST  和
                                                                         ,
                                                                    ,
                                                               ,
                 CIFAR-10  数据集上的指标评估. 注意, 这里仍然是采用           Acc Cpre Crec F1 和  ASR 指标, 其中, 图  9(a) 的结果是
                 在  MNIST  数据集上实现, 图   9(b) 的结果是在   CIFAR-10  上实现, 最后, 图  9(c) 提供了不同   b 下  ASR 的变化.

                     100                          70                               MNIST
                     95                           65                          25   CIFAR-10
                    Metric results (%)  85  Acc  Metric results (%)  55  Acc  ASR (%) 20
                                                  60
                     90
                                                                              15
                     80
                                                  50
                                                                              10
                          Cpre tc
                                                  45
                     75
                                                      Cpre tc
                          Crec tc
                                                      Crec tc                  5
                     70   F1 tc                   40  F1 tc
                        0    10   20   30   40       0   10   20   30   40       10    20     30    40
                                 b (%)                       b (%)                        b (%)
                               (a) MNIST                   (b) CIFAR-10                  (c) ASR
                                            图 9 在  non-IID  场景不同  b 下的指标评估

                    首先, 如图   9(a) 所示, 随着  b 的增加,   Acc Cpre tc  和   F1 tc  以不同的幅度下降, 而  Crec tc  在  b = 20% 和  b = 30% 时
                                                   ,
                 出现了反向增长, 但从      b = 10% 到  b = 40% 整体上仅下降  3.80%. 其次, 在图  9(b) 中, 我们发现  b 的增加使得所有指
                 标均以不同的幅度不断下降. 具体地,           Acc 浮动相对平缓, 从    b = 10% 时实现的  64.88%  到  b = 40% 的  61.26%, 仅下
                 降  3.62%.   Cpre tc  和  Crec tc  表现相似, 均呈现大幅度下降趋势,  F1 tc  有相对较小的下降幅度. 相同的是,      Cpre tc ,
                 Crec tc  和  F1 tc  在  b = 40% 时均获得了  40.00%  左右的结果, 这证实了第  4.2.4  节  1) 中的猜测. 综上, 相较于第  4.2.4
                 节描述的    IID  场景而言, 我们发现    FedDiscrete 防御在  non-IID  下的表现更多样化和复杂化, 这也与       non-IID  场景
                 具有数据多样性和攻击形式多样性的特点相关. 特别地, 比较无攻击者投毒的场景,                          Cpre tc  和  Crec tc  在  b = 10% 时
                 都实现了更好的性能, 这主要是因为仅存在少数攻击者时, 检测并防御攻击者是可能的, 这也体现了                               FedDiscrete
                 防御的有效性. 接下来, 图      9(c) 展示了  b 的增加导致    ASR 也不断增长, 尤其是     CIFAR-10  数据集, 其从  b = 10% 到
                 b = 40%  实现了从  4.60%  到  27.60%  的明显增长, 而  FedDiscrete  在  MNIST  数据集下实现了  ASR 从  2.69%  到
                 16.93%  的增长.
                                                             ,
                    4) PathMNIST  数据集下的性能评估: 此外, 基于       Acc Cpre Crec 和  F1 这  4  个指标, 我们也评估了   IID  场景
                                                                  ,
                 下  FedDiscrete 方法在  PathMNIST  数据集上的性能, 实验结果如表     7  和图  10  所示.

                                                                    97.5                      Cpre tc
                                                                                              Crec tc
                                                                    95.0
                                                                                              F1 tc
                                                                   Metric results (%)  90.0
                                                                    92.5
                                                                    87.5
                              b 下的  FedDiscrete 性能评估  (%)
                     表 7 不同
                                                                    85.0
                          b                    Acc
                                                                    82.5
                          0                   73.05
                          10                  71.69                 80.0
                          20                  69.12                     0     10     20    30     40
                          30                  70.00                                 b (%)
                          40                  63.73
                                                                 图 10    不同指标下的   FedDiscrete 性能评估: IID
                    从表  7  中可以观察到, 在没有攻击者发起投毒攻击的情况下, FedDiscrete 实现了最高的                  Acc 73.05%, 且防御
                 性能随着攻击者数量的增加而呈现下降趋势. 具体地, 当                  b = 10% 时, FedDiscrete  算法在  IID  场景下实现了  Acc
                                             Acc 63.73%, 比较  CIFAR-10  数据集, FedDiscrete 获得了更优的防御效果. 结
                 71.69%, 甚至在  b = 40% 时也获得了
   350   351   352   353   354   355   356   357   358   359   360