Page 148 - 《中国电力》2026年第5期

P. 148

2026 年第 59 卷

而削弱模型对灾难性遗忘的抑制能力。与之不同，集 1 为输入进行初步训练，得到基准模型；2）将
深度经验回放++（deep experience replay，DER++）子集 1 训练得到的模型参数作为迁移学习中训练
算法在存储历史样本的同时，还保留了原始光伏子集 2 的初始参数；3）子集 2 优化后的模型参数
预测模型在历史训练过程中习得的响应行为。通同样作为训练子集 3 的初始参数。
过回放标签 y 与模型响应，即使面对数据波动，这种链式迁移机制通过参数继承与迭代优
模型仍可有效解决灾难性遗忘问题。在这种双重化，模拟了实时数据流更新下的模型演化过程。
知识保留机制下，模型对光伏功率的预测能力得验证集用于评估每个阶段模型的性能，预测集则
到进一步提升。针对在线时间序列预测任务，本作为最终模型的独立测试基准。
研究将 PatchTST 模型与 DER++算法相结合，以快在预测阶段，采用滚动预测机制。模型通过
速适应光照条件变化对光伏发电系统的影响。加入最新实际值并剔除最早历史数据点来更新滚
本研究提出一种融合深度学习与增量学习的动窗口，从而实现对下一个时间点数值的预测。
在线多变量时间序列预测模型，即 PTER 模型。该机制可动态更新时间输入窗口，避免预测误差
该模型将 DER++增量学习算法融入基于 PatchTST 累积，适用于需实时更新预测结果的场景。

的时间序列预测框架中。具体而言，在每个时间
步，模型接收新观测到的气象时间序列数据，并 2 数据处理与模型配置
通过 PatchTST 架构进行预测。将新的气象数据及
其对应的模型输出与实际发电功率值存储到固定 2.1 数据预处理
大小的内存缓冲区中。在后续训练迭代过程中，在光伏数据的采集、传输与存储过程中，易
DER++算法从内存缓冲区中随机采样历史光伏功出现数据缺失、异常值及噪声干扰等问题。这些
率数据批次，与当前任务数据融合后在 PatchTST 异常数据会导致模型从历史数据中学习错误信
网络中进行联合训练。损失函数由当前预测损失息，进而造成光伏功率预测结果偏差，最终对现
与历史样本的重构损失组成，形成混合优化目标。场调度人员的决策判断产生不利影响。因此，在
通过在 PatchTST 训练循环中融入 DER++算法，PTER 进行功率预测前，对原始数据集进行预处理，以

模型实现了可塑性与稳定性的平衡，提升了动态确保输入数据的完整性与可靠性。
环境下光伏功率长期预测的精度。本研究使用的数据来源于山西某光伏电站，
为模拟光伏电站的在线模型更新过程，本研采集时间范围为 2023 年 7 月 1 日 —2024 年 7 月
究提出一种分阶段迁移学习方法以还原真实场 31 日，共包含 570 240 条数据样本，采样间隔设
景。将原始数据集按时间顺序划分为训练集、验为 1 min。
证集与预测集 3 个独立数据集，其中训练集进一本研究按照以下数据预处理流程对光伏发电
步划分为 3 个连续子集：子集 1、子集 2、子集 3。时间序列数据进行处理。首先，将原始 1 min 采
各子集数据量占比依据季节周期特征设定：子集样间隔的高频数据重采样为 15 min 间隔，以降低
1（2023 年 7—9 月，夏季）包含 82 天数据，占训数据冗余度与计算复杂度；其次，采用基于滑动
练集总数据量的 30%；子集 2（2023 年 10—12 月，窗口的异常检测机制，滑动窗口大小设为 48 个连
冬季）包含 92 天数据，占训练集总数据量的续观测值，对应 12 h 跨度，通过四分位距（inter-
35%；子集 3（2024 年 1—4 月，春季）包含 90 天 quartile range，IQR）法计算每个窗口的第 25 百分
数据，占训练集总数据量的 35%。参数初始化位数与第 75 百分位数，将超出特定范围的观测值
时，以子集 1 训练得到的模型所有可训练参数作判定为异常值，并采用线性插值法对检测出的异
为子集 2 训练的初始参数；子集 3 训练则继承子常值进行替换，以保证数据的时间连续性。针对
集 2 优化后的最终参数，且每个子集训练时均保缺失数据，采用相邻两个有效观测值的算术平均
留上一子集的经验回放缓冲区数据，仅在缓冲区值对缺失值进行填充。通过上述多步骤数据处理
容量达到上限时，按样本重要性替换低贡献度样本。流程，显著提升了数据质量，为后续建模与分析
采用迁移学习策略的训练步骤为：1）以子奠定了可靠基础。

144

143 144 145 146 147 148 149 150 151 152 153