Page 452 - 《软件学报》2026年第1期
P. 452

李迪 等: 复杂应用场景下侧信道分析的可移植性研究综述                                                      449



                                                                                     分类算法
                           建
                           模                       预处理技术                            TA、SA、
                           阶                                     预处理轨迹 (训练)         MLP、CNN …
                           段    轨迹 (建模设备)                                               最优算法
                                                  PCA、LDA、
                           攻                      DTW、FFT、
                           击                      EDA、U-Net …                        评估指标
                           阶
                           段                                     预处理轨迹 (攻击)         攻击正确率、
                                轨迹 (目标设备)                                            猜测熵 …
                                             图 4 基于预处理的可移植性攻击方案

                  3.1   基于统计分析的方法
                    基于统计方法的数据预处理方法是使用统计学原理和技术来处理数据, 以便更好地适应建模和分析. 这些方
                 法旨在利用数据的统计性质、分布和关系, 以提高数据的质量、减少噪声和无关特征. 在此类方法中, 根据算法能
                 否自动迭代更新参数又可细分为可迭代算法和不可迭代算法.
                    1) 不可迭代算法
                    统计分析中两种常见的不可迭代方法是主成分分析                   (principal component analysis, PCA) [63] 和线性判别分析
                 (linear discriminant analysis, LDA) [64] . 其中  PCA  是一种无监督降维技术, 用于将高维数据转换为低维表示, 同时保
                 留尽可能多的信息. 其目标是通过找到数据中的主要变化方向. 而                    LDA  是一种监督降维技术, 主要用于在分类问
                 题中提取最具判别性的特征. 其目标是通过最大化类别间的离散度和最小化类别内的散度矩阵之间比值来实现最
                 佳的特征投影. 与     PCA  不同, LDA  考虑到了类别标签信息, 以便在降维的同时保留最大的类别间差异. 这两种方
                 法经常在模式识别和人脸识别等领域中广泛应用, 其特点同样也适用于功耗轨迹的预处理. 因此, 一系列学者展开
                 了  PCA、LDA  在模型可移植性方向的研究.
                    2012  年, Elaabid  等人  [32] 提出了使用  PCA  技术预处理功耗轨迹. 实验结果表明, 当目标设备的采集设置发生
                 变化时, 产生的垂直振幅差异会导致            TA  失效, 而使用  PCA  预处理技术可以消除这部分差异. 但在该方案中只考
                 虑  PCA  方法, 并且没有详细探讨     PCA  具体参数的选择和作用. 在        COSADE 2014  会议上, Choudary  等人  [48] 详细探
                 讨了  PCA  和  LDA  的参数选择和适用场景. 他们采用        XMEGA  [65] 微控制器的  4  个不同副本进行实验, 其工作主要
                 考虑温度变化引起的直流偏移对攻击性能的影响. 实验结果表明, 选择良好参数的                          LDA  或  PCA  能最大化  TA  的
                 性能, 其中   LDA  能够补偿由合并协方差矩阵捕获的温度变化, 并且这种温度变化在不同的设备中的活动是相似
                 的. 他们表明使用     LDA  时应该忽略特征向量中最强的直流贡献, 而             PCA  应该选择足够数量的特征向量, 其中至少
                 包括一个最强的直流贡献. 2018        年, Choudary  等人  [49] 继续完善对  TA  中  PCA  和  LDA  的工作. 他们对信噪比、平
                 均差以及绝对平均差等多种样本选择方法进行讨论, 并额外添加了                       AES  硬件实现的实验验证. 实验结果证明了
                 PCA  和  LDA  在硬件实现下同样适用, 并给出参数选择细节. 2021          年, Danial 等人  [66] 进一步讨论了在低信噪比环境
                 下  PCA、LDA  等预处理方法对神经网络的训练帮助. 实验环境中功耗采集轨迹的信噪比为                         19.6 dB, 而电磁采集
                 轨迹的信噪比仅为       3.1 dB. 因此, 作者声明相较于功耗轨迹, 电磁轨迹的训练难度更大, 即便是使用同一设备下收
                 集的电磁轨迹进行训练, 也会导致攻击失效. 在实验中, 他们对电磁轨迹进行均值化处理来提高信噪比, 并采用
                 PCA、LDA  方法对波形进行预处理并加入训练. 结果表明, 对于高维功耗数据, LDA                    是最有效的预处理方法, 在跨
                 设备攻击中其单字节正确率可达到            91.5%. 此外, 2021  年, Won  等人  [67] 总结了移动平均数、相位相关算法、PCA、
                 弹性对齐等预处理方法在促进分类模型学习方面的积极效果, 并推广到不同的公开数据集上, 但尚未有人系统讨
                 论这一类技术在可移植性攻击中的作用.
                    通过对现有文献分析可以得出, PCA、LDA            两种方法在处理“同一设备, 不同副本”场景有着良好的实用性, 其
                 中  LDA  在各个环境的预处理效果更好. 在         Choudary  等人  [48] 的研究中表明, 在处理直流偏移时, LDA    效果更好. 同
                 时  Danial 等人  [66] 的研究也表明, 在低信噪比环境下, LDA     在处理高维数据方面也有着更好的效果. 然而, LDA              是
                 监督学习算法, 它的运算过程需要标签信息, 而在现实场景中攻击者很难获得目标设备的标签信息. 同时                                LDA  的
   447   448   449   450   451   452   453   454   455   456   457