Page 8 - 《中国电力》2026年第5期
P. 8
2026 年 第 59 卷
式中:x 为原输入变量;μ 为变量均值;σ 为变量 码器对编码后的特征进行全局关联建模,融合局
方差; x 为归一化输出。 部子单元信息与全局时序依赖,最终通过输出层
′
2.2.3 特征选择 映射得到预测结果。该框架既保留 Transformer 对
在多变量时序预测领域,解释变量的适当选 长时序依赖的建模能力,又通过局部分割与独立
择是提升模型性能的关键,不恰当的特征集可能 编码增强了对特征物理属性的适配性,适用于复
引 入 噪 声 或 冗 余 信 息 , 显 著 降 低 预 测 精 度 [24-26] 。 杂动态系统的时序预测任务 [30-33] 。
特征选择应遵循模型性能与特征精简相平衡的准 为了验证改进方法的有效性,设置 4 组模型
则 , 合 理 选 取 特 征 数 量 对 提 升 模 型 性 能 至 关 重 进行对比实验。模型 A 作为基准模型,先对输入
要,理想的特征子集应在精简特征数量的前提下 数据做嵌入处理,然后使用 Transformer Encoder 进
保持模型效果 [27] 。当特征数量过少时,模型难以 行 编 码 处 理 , 最 后 通 过 多 层 感 知 器 ( multilayer
充分挖掘电价波动背后的复杂规律,使得预测误 perceptron,MLP)层输出电价序列。模型 B 在模
差显著增大 [28] 。智能电网环境下的相关研究 [29] 也 型 A 的嵌入层做了修改,从传统混合通道结构改
表明,若仅采用少量特征进行建模,在处理电力 成了独立通道结构,并且对时间特征序列使用了
负荷数据时,模型对其复杂变化趋势的跟踪能力 Time2Vec 的方式嵌入化。模型 C 在模型 A 基础上
明显减弱,印证了特征过少对模型性能存在负面 引入了 Patch 机制,在对输入数据做嵌入处理之
影响。在电价预测场景下,若特征不足,模型易 前,先把输入的时序数据分割成 Patch 序列,然
出现欠拟合现象,无法适应电力市场的动态变化。 后对 Patch 序列编码,输出到 MLP 层,最后输出
本文进一步通过特征重要度分析筛选核心特 电价预测。模型 D 是在模型 A 的基础上,同时加
征用于后续建模。通过训练轻量梯度提升机模型 上模型 B 和模型 C 的修改措施。另外,为了体现
对候选特征进行重要度量化,以特征在决策树分 所提出模型相较于传统模型的优越性,选取经典
裂过程中的总增益为指标(增益越高表明对模型 机器学习模型 XGBoost 作为对比模型。
预测精度的贡献越大)。结果显示,竞价空间的 训练数据选择距离预测目标时间点最近的 3
重要度增益约为 0.312,时刻约为 0.235,日类型 个月数据(2024 年 6 月 1 日—2024 年 8 月 31 日)。
约为 0.178,统调负荷约为 0.114,电价日同比变化 测 试 集 数 据 为 2024 年 9 月 全 月 数 据 。 超 参 数 方
率为 0.082,负荷小时环比增长量为 0.051,这 6 项 面,设置为 50 个训练轮次,采用早停策略进行训
特征的累计增益占比达 97.2%,而西电东送出力、 练,学习率设置为 0.001,批次大小设置为 64。输
节点历史电价等因素增益占比不足 3%。 入嵌入维度以及编码输出维度均为 256,dropout
经筛选,最终确定的模型输入特征为时刻、 参数设置为 0.1,注意力头数量设置为 8。MLP 层
日类型、竞价空间、统调负荷、电价日同比变化 包括 3 个线性层,以及 1 个激活函数层,激活函
率、负荷小时环比增长量。该特征集既覆盖了初 数选择 GeLU。3 个线性层的输出维度分别为 512、
始大特征集中的关键信息,又通过业务逻辑与数 128、24。
据驱动的双重验证,确保对电价波动的核心影响 2.3 超参数灵敏度分析
因素具有高效表征能力。 探 究 Patch 分 割 时 相 关 参 数 对 预 测 精 度 的 影
2.2.4 模型配置 响,由于 Patch 维度 P 和步长 S 之间存在复杂的交
针对传统 Transformer 在时序预测中对局部特 互关系,本文采用全因子实验设计进行灵敏度分
征捕捉不足、多特征交互干扰的问题,采用“分 析,详细记录不同参数组合下的 MAE 和 RMSE 的
割-编码-融合”3 阶框架实现优化。首先,对输 变化。实验中,除研究对象(Patch 维度和步长)
入的长时序数据进行局部分割,将连续序列拆解 外,其余模型配置均保持一致,以确保实验的单
为含局部关联信息的子单元,强化对短时波动特 一变量控制,从而准确反映研究对象对模型性能
征的提取。其次,基于特征属性差异设计独立编 的独立影响。实验结果发现,当 P=4、S=2 时,模
码机制,通过专属网络分别处理不同类型的特征, 型在测试集上的 MAE 和 RMSE 均达到最低值,表
减少信息混淆。最后,引入改进的 Transformer 编 明此参数组合对电价预测精度提升最为显著。进
4

