Page 9 - 《中国电力》2026年第5期
P. 9

陈梓宏等:一种基于          Patch  机制与通道独立结构的改进             Transformer 日前电价预测方法 2026          年第 5 期



              一步分析发现,当          P<S  时,Patch   的宽度小于步           2.4    实验结果
              长,在    Patch  分割时会出现信息损失,导致模型                         不 同 模 型 的 实 验 结 果 如 表     2  所 示 , 模 型  A、
              预测精度不高;当          P>S  时,Patch   的宽度大于步           B、C、D    相较于    XGBoost 模型,在周末和工作日
              长,Patch  分割时不同的        Patch  之间会存在信息冗            的预测性能有显著提升。XGBoost 在节假日时的
              余,当信息冗余过量时,也会影响模型对电价变                             预 测 能 力 优 于 本 文 所 提 出 的      Transformer-based  模
              化的敏感度,导致预测误差增大。因此,合理选                             型 , 原 因 是   Transformer-based  模 型 的 预 测 曲 线 更
              择  P  和  S  是提高预测精度的关键。                           加平缓,对于节假日的低谷电价无法准确捕捉,
                  将  Patch  维 度 和 步 长 固 定 为  P=4、 S=2, 继 续      导 致 预 测 偏 差 。 相 较 于 模 型      A, 模 型   B  和 模 型
              研究自注意力头数量和模型编码维度的灵敏度。                             C  在各场景误差指标均有降低,但是不同场景下
              自注意力头数量实验结果如表                1  所示,通过对比           2  个模型的提升效果不一样。与模型                  A  相比,模
              不 同 自 注 意 力 头 数 量 和 编 码 维 度 的 实 验 结 果 发           型  B  在 周 末 的  MAE  从  32.95  降 低 至  28.27, 模 型
              现,自注意力头数量            H = 8、编码维度      D model =512  C  从  32.95  降低至  30.90,说明时间因素特征的改
              时,模型在测试集和训练集上的                  MAE  指标达到         进有利于模型捕捉周末负荷需求下降对电价的影

              最优,进一步验证了自注意力机制在电价预测中                             响。模型      D  的预测性能全面优于其他             3  个模型,
              的关键作用。提升自注意力头数量能够一定程度                             相比模型      A,模型    D  在周末的    MAE  从  32.95  降低
              上提高编码器的信息处理能力。8                  头自注意力模           至  23.88;在预测难度大的节假日,模型                D  的  MAE
              型 的 测 试 集 最 优   MAE  下 降 到 了   32.52, 相 比  4  头   从  78.33  降低至  70.33。

              降幅约为     14.44%。进一步分析可知,两者需联合
                                                                              表 2   不同模型实验结果
              优化,性能最优的组合为             H = 8、  D model =512  或  H =  Table 2   Experimental results with different models
              6、  D model =768。保持  D model /H ≈ 64 ∼ 128,可平衡                     数据集(节点A)        数据集(节点B)
                                                                 日类型     模型
              多样性与信息密度。           D model 不足时(如    256),增                        RMSE    MAE     RMSE    MAE
              加  H收益有限;      D model 过大时(如    768),   H过多                 A       40.81  32.95    50.93  45.78
              (如   8)会导致注意力分散,MAE             上升。                         B       39.43  28.27    45.75  33.46
                                                                  周末      C       40.32  30.90    47.12  36.41
                         表 1   自注意力头数量实验结果                                D       34.04  23.88    37.78  27.77
               Table 1   Self-attention head number experiment results
                                                                        XGBoost   53.75  46.17    67.21  56.15
               自注意力头数量H 编码维度       D model  测试集MAE 训练集MAE                 A       71.74  46.53    80.21  59.31
                                  96        52.25     43.24               B       70.42  43.42    82.97  53.86
                                 128        49.37     44.37      工作日      C       70.63  43.74    76.67  52.57
                     4           256        50.25     38.58               D       69.32  41.57    73.27  48.21
                                 512        38.01     35.96             XGBoost   88.61  49.27    92.67  62.83
                                 768        44.55     45.90               A      137.37  78.33   155.82  92.18
                                                                          B      136.23  75.78   147.20  89.15
                                  96        50.55     49.99
                                                                 节假日      C      129.90  75.52   138.51  87.01
                                 128         —         —
                                                                          D      127.45  70.33   135.77  81.60
                     6           256        46.22     43.07
                                                                        XGBoost  122.67  68.89   131.39  78.86
                                 512        39.61     41.08

                                 768        34.94     32.62
                                                                    模 型  B( 通 道 独 立 ) 在 周 末 场 景 提 升 明 显 ,
                                  96        48.03     42.80
                                                                因为周末负荷模式与工作日差异显著,且受时间
                                 128         —         —
                                                                因素影响更大。通道独立结构将时间特征与其他
                     8           256        41.40     41.60
                                                                变量分离处理,使模型更专注于学习周末特有的
                                 512        32.52     31.69
                                                                时间-负荷关联模式,减少其他因素的干扰;模
                                 768        43.38     39.78
                                                                型  D(Patch+通道独立)在节假日表现最优,因为
                                                                                                            5
   4   5   6   7   8   9   10   11   12   13   14