Page 8 - 《中国电力》2026年第5期
P. 8

2026  年 第 59 卷



              式中:x 为原输入变量;μ            为变量均值;σ 为变量              码器对编码后的特征进行全局关联建模,融合局
              方差;    x 为归一化输出。                                  部子单元信息与全局时序依赖,最终通过输出层
                      ′

              2.2.3    特征选择                                     映射得到预测结果。该框架既保留                   Transformer 对
                  在多变量时序预测领域,解释变量的适当选                           长时序依赖的建模能力,又通过局部分割与独立
              择是提升模型性能的关键,不恰当的特征集可能                             编码增强了对特征物理属性的适配性,适用于复
              引 入 噪 声 或 冗 余 信 息 , 显 著 降 低 预 测 精 度       [24-26] 。  杂动态系统的时序预测任务           [30-33] 。
              特征选择应遵循模型性能与特征精简相平衡的准                                 为了验证改进方法的有效性,设置                   4  组模型
              则 , 合 理 选 取 特 征 数 量 对 提 升 模 型 性 能 至 关 重           进行对比实验。模型           A  作为基准模型,先对输入
              要,理想的特征子集应在精简特征数量的前提下                             数据做嵌入处理,然后使用               Transformer Encoder 进
              保持模型效果       [27] 。当特征数量过少时,模型难以                  行 编 码 处 理 , 最 后 通 过 多 层 感 知 器 ( multilayer
              充分挖掘电价波动背后的复杂规律,使得预测误                             perceptron,MLP)层输出电价序列。模型               B  在模
              差显著增大      [28] 。智能电网环境下的相关研究             [29]  也  型  A  的嵌入层做了修改,从传统混合通道结构改
              表明,若仅采用少量特征进行建模,在处理电力                             成了独立通道结构,并且对时间特征序列使用了
              负荷数据时,模型对其复杂变化趋势的跟踪能力                             Time2Vec 的方式嵌入化。模型           C  在模型   A  基础上
              明显减弱,印证了特征过少对模型性能存在负面                             引入了    Patch 机制,在对输入数据做嵌入处理之
              影响。在电价预测场景下,若特征不足,模型易                             前,先把输入的时序数据分割成                  Patch  序列,然
              出现欠拟合现象,无法适应电力市场的动态变化。                            后对   Patch  序列编码,输出到        MLP  层,最后输出
                  本文进一步通过特征重要度分析筛选核心特                           电价预测。模型         D  是在模型    A  的基础上,同时加
              征用于后续建模。通过训练轻量梯度提升机模型                             上模型    B  和模型   C  的修改措施。另外,为了体现
              对候选特征进行重要度量化,以特征在决策树分                             所提出模型相较于传统模型的优越性,选取经典
              裂过程中的总增益为指标(增益越高表明对模型                             机器学习模型       XGBoost 作为对比模型。
              预测精度的贡献越大)。结果显示,竞价空间的                                 训练数据选择距离预测目标时间点最近的                       3
              重要度增益约为         0.312,时刻约为       0.235,日类型        个月数据(2024      年  6  月  1  日—2024  年  8  月  31  日)。

              约为   0.178,统调负荷约为        0.114,电价日同比变化            测 试 集 数 据 为   2024  年  9  月 全 月 数 据 。 超 参 数 方
              率为   0.082,负荷小时环比增长量为             0.051,这  6  项   面,设置为      50  个训练轮次,采用早停策略进行训
              特征的累计增益占比达            97.2%,而西电东送出力、              练,学习率设置为          0.001,批次大小设置为         64。输
              节点历史电价等因素增益占比不足                  3%。              入嵌入维度以及编码输出维度均为                    256,dropout
                  经筛选,最终确定的模型输入特征为时刻、                           参数设置为       0.1,注意力头数量设置为            8。MLP  层
              日类型、竞价空间、统调负荷、电价日同比变化                             包括   3  个线性层,以及        1  个激活函数层,激活函
              率、负荷小时环比增长量。该特征集既覆盖了初                             数选择    GeLU。3   个线性层的输出维度分别为              512、
              始大特征集中的关键信息,又通过业务逻辑与数                             128、24。

              据驱动的双重验证,确保对电价波动的核心影响                             2.3    超参数灵敏度分析
              因素具有高效表征能力。                                           探 究  Patch  分 割 时 相 关 参 数 对 预 测 精 度 的 影

              2.2.4    模型配置                                     响,由于     Patch  维度  P  和步长  S  之间存在复杂的交
                  针对传统     Transformer 在时序预测中对局部特               互关系,本文采用全因子实验设计进行灵敏度分
              征捕捉不足、多特征交互干扰的问题,采用“分                             析,详细记录不同参数组合下的                 MAE  和  RMSE  的
              割-编码-融合”3          阶框架实现优化。首先,对输                  变化。实验中,除研究对象(Patch                维度和步长)
              入的长时序数据进行局部分割,将连续序列拆解                             外,其余模型配置均保持一致,以确保实验的单
              为含局部关联信息的子单元,强化对短时波动特                             一变量控制,从而准确反映研究对象对模型性能
              征的提取。其次,基于特征属性差异设计独立编                             的独立影响。实验结果发现,当                 P=4、S=2 时,模
              码机制,通过专属网络分别处理不同类型的特征,                            型在测试集上的         MAE  和  RMSE  均达到最低值,表
              减少信息混淆。最后,引入改进的                   Transformer 编   明此参数组合对电价预测精度提升最为显著。进

               4
   3   4   5   6   7   8   9   10   11   12   13