Page 6 - 《中国电力》2026年第5期
P. 6
2026 年 第 59 卷
作中的关键环节。电价波动不仅影响电力市场稳 爆炸问题;3)多头注意力机制可灵活捕捉序列
定 性 和 效 率 , 还 直 接 关 系 到 发 电 企 业 、 输 电 公 中不同子空间或模式下的依赖关系 [16-17] 。这些特
司、分销商以及最终用户的经济利益。准确预测 性使 Transformer 在处理具有复杂长期依赖关系的
电价能够为市场主体提前应对波动提供依据,对 电价时序预测任务上具有理论优势。文献 [18] 利
于优化电力资源配置、降低运营成本、提高市场 用 Transformer 编码器对电价时序数据进行编码,
竞争力具有重要意义 [1-3] 。 通过自注意力机制捕捉时间步之间的依赖关系,
在电价预测领域,现有方法主要分为时序分 使得模型能够自适应调整信息关注度,缩短了信
析法、传统机器学习法、深度学习法 3 类。时序 息计算路径,提高了学习效率,验证了 Transformer
分析法基于电价时序规律分析,对未来进行外推 在电价预测中的潜力。
预测,常用模型包括差分自回归滑动平均模型、 然而,传统 Transformer 架构在时序预测任务
广义自回归条件异方差模型、指数平滑法和向量 中存在明显局限性,仅能从单一时间步提取信息,
自回归模型。由于电价的形成机制比较复杂,本身 难以充分捕捉时间序列中连续时间步之间的关联
的时序可解释性较差,导致模型的预测效果也较 特征。在当前电碳耦合机制下,碳价波动与配额
差 。传统机器学习法基于数据分析,利用极端梯 政策会通过影响煤电机组报价策略间接推动现货
[4]
度提升算法(extreme gradient boosting,XGBoost)、 电价变化 [19-20] ,但这类报价信息往往难以直接获
随机森林、模型堆叠等集成学习模型,学习市场 取,其影响只能通过其他可观测变量的分布变化
边界数据对电价的映射关系,更贴合电价形成的 间接体现,使得多变量与电价之间的映射关系更
逻辑,预测结果更有解释性 。但是机器学习法 趋复杂。而传统 Transformer 对这类包含隐式影响
[5]
难以捕捉时序传递的信息,对市场边界数据与电 的特征关联建模能力不足,亟须通过架构改进,
价的拟合能力有限,随着新能源的发展,其不确 增强对复杂映射规律的学习能力。
定性给电价预测带来新挑战 [6-10] 。深度学习法使 综上,本文提出在自注意力计算中引入 Patch
用 递 归 神 经 网 络 ( recurrent neural network, RNN) 机制和独立通道结构来克服现有模型的局限性。
搭建模型,提高了捕捉时序传递信息的能力和电价 将时间序列数据划分为若干连续的时间段,每个
预测模型的拟合能力 [11-12] 。为缓解 RNN 在处理较 Patch 作为一个整体进行处理,从而提取时间序列
大数据集时面临的梯度消失和梯度爆炸问题,出 中的局部时序信息。同时,引入的通道独立结构
现了长短时记忆单元(long short-term memory,LSTM) 有效降低了多变量系统建模的复杂度,提升模型
和门控循环单元(gated recurrent unit,GRU),通 收敛速度和泛化能力。最后,比较了所提方法与
过门结构选择并传递重要信息。文献 [13] 利用卷 多种模型方法预测广东现货日前电价的效果,以
积神经网络(convolutional neural network,CNN)- 实验数据证明所提方法对于模型改进的有效性。
双向长短时记忆(bidirectional long short-term mem-
ory,BiLSTM)模型进行电价预测,使用 CNN 捕 1 电价影响因子
捉多变量的局部特征,使用 BiLSTM 额外捕捉时
序反向传递的信息,提高了模型的拟合能力。随 电价取决于市场供需情况 [21] ,准确的电价预
着新能源占比提高,电价序列的非线性、非平稳 测需要综合考虑发电资源与用电需求。以广东省
性和长程依赖性特征愈发显著。RNN、LSTM 等 级现货市场为例,由于数据类型众多,盲目选取
递归神经网络虽然能捕捉序列依赖关系,但顺序 可能会造成数据冗余,提高模型复杂度,降低计
计 算 效 率 低 , 且 难 以 捕 捉 长 时 间 序 列 之 间 的 关 算 效 率 甚 至 影 响 预 测 精 度 [22] 。 为 了 缓 解 这 个 问
系 [14-15] 。Transformer 架构摒弃了递归结构,完全 题,需要先通过筛选或构建新的特征因子,提炼
依赖自注意力机制(self-attention)计算序列元素 出影响电价的关键因素。
间的全局依赖关系。其优势在于:1)并行计算 1.1 竞价空间
效率高;2)能够直接建模任意距离时间步之间 为了量化市场供需情况,引入竞价空间值,
的关联,克服了递归网络在长序列上的梯度消失/ 计算式为
2

