Page 9 - 《中国电力》2026年第5期
P. 9
陈梓宏等:一种基于 Patch 机制与通道独立结构的改进 Transformer 日前电价预测方法 2026 年第 5 期
一步分析发现,当 P<S 时,Patch 的宽度小于步 2.4 实验结果
长,在 Patch 分割时会出现信息损失,导致模型 不 同 模 型 的 实 验 结 果 如 表 2 所 示 , 模 型 A、
预测精度不高;当 P>S 时,Patch 的宽度大于步 B、C、D 相较于 XGBoost 模型,在周末和工作日
长,Patch 分割时不同的 Patch 之间会存在信息冗 的预测性能有显著提升。XGBoost 在节假日时的
余,当信息冗余过量时,也会影响模型对电价变 预 测 能 力 优 于 本 文 所 提 出 的 Transformer-based 模
化的敏感度,导致预测误差增大。因此,合理选 型 , 原 因 是 Transformer-based 模 型 的 预 测 曲 线 更
择 P 和 S 是提高预测精度的关键。 加平缓,对于节假日的低谷电价无法准确捕捉,
将 Patch 维 度 和 步 长 固 定 为 P=4、 S=2, 继 续 导 致 预 测 偏 差 。 相 较 于 模 型 A, 模 型 B 和 模 型
研究自注意力头数量和模型编码维度的灵敏度。 C 在各场景误差指标均有降低,但是不同场景下
自注意力头数量实验结果如表 1 所示,通过对比 2 个模型的提升效果不一样。与模型 A 相比,模
不 同 自 注 意 力 头 数 量 和 编 码 维 度 的 实 验 结 果 发 型 B 在 周 末 的 MAE 从 32.95 降 低 至 28.27, 模 型
现,自注意力头数量 H = 8、编码维度 D model =512 C 从 32.95 降低至 30.90,说明时间因素特征的改
时,模型在测试集和训练集上的 MAE 指标达到 进有利于模型捕捉周末负荷需求下降对电价的影
最优,进一步验证了自注意力机制在电价预测中 响。模型 D 的预测性能全面优于其他 3 个模型,
的关键作用。提升自注意力头数量能够一定程度 相比模型 A,模型 D 在周末的 MAE 从 32.95 降低
上提高编码器的信息处理能力。8 头自注意力模 至 23.88;在预测难度大的节假日,模型 D 的 MAE
型 的 测 试 集 最 优 MAE 下 降 到 了 32.52, 相 比 4 头 从 78.33 降低至 70.33。
降幅约为 14.44%。进一步分析可知,两者需联合
表 2 不同模型实验结果
优化,性能最优的组合为 H = 8、 D model =512 或 H = Table 2 Experimental results with different models
6、 D model =768。保持 D model /H ≈ 64 ∼ 128,可平衡 数据集(节点A) 数据集(节点B)
日类型 模型
多样性与信息密度。 D model 不足时(如 256),增 RMSE MAE RMSE MAE
加 H收益有限; D model 过大时(如 768), H过多 A 40.81 32.95 50.93 45.78
(如 8)会导致注意力分散,MAE 上升。 B 39.43 28.27 45.75 33.46
周末 C 40.32 30.90 47.12 36.41
表 1 自注意力头数量实验结果 D 34.04 23.88 37.78 27.77
Table 1 Self-attention head number experiment results
XGBoost 53.75 46.17 67.21 56.15
自注意力头数量H 编码维度 D model 测试集MAE 训练集MAE A 71.74 46.53 80.21 59.31
96 52.25 43.24 B 70.42 43.42 82.97 53.86
128 49.37 44.37 工作日 C 70.63 43.74 76.67 52.57
4 256 50.25 38.58 D 69.32 41.57 73.27 48.21
512 38.01 35.96 XGBoost 88.61 49.27 92.67 62.83
768 44.55 45.90 A 137.37 78.33 155.82 92.18
B 136.23 75.78 147.20 89.15
96 50.55 49.99
节假日 C 129.90 75.52 138.51 87.01
128 — —
D 127.45 70.33 135.77 81.60
6 256 46.22 43.07
XGBoost 122.67 68.89 131.39 78.86
512 39.61 41.08
768 34.94 32.62
模 型 B( 通 道 独 立 ) 在 周 末 场 景 提 升 明 显 ,
96 48.03 42.80
因为周末负荷模式与工作日差异显著,且受时间
128 — —
因素影响更大。通道独立结构将时间特征与其他
8 256 41.40 41.60
变量分离处理,使模型更专注于学习周末特有的
512 32.52 31.69
时间-负荷关联模式,减少其他因素的干扰;模
768 43.38 39.78
型 D(Patch+通道独立)在节假日表现最优,因为
5

