Page 182 - 《中国电力》2026年第5期

P. 182

2026 年第 59 卷

迭代组合数学符号与表达式，平衡预测精度与模短期记忆网络的权重组合，得到数据驱动预测功
型复杂度 [31] ，最终确定能表征数据内在规律的最率 P ；3）采用符号回归算法，融合物理驱动与
2
优方程。与传统回归方法（如线性回归）不同，数据驱动结果，得到预测功率 P 。
3
符号回归通过遗传算法动态构建方程，并通过选所提融合方法充分发挥了两种方法的优势。
择、交叉、变异和评估等操作进行迭代。经参数优化后的经验尾流模型能准确捕捉尾流亏
1）交叉：交换父方程之间的子树，以生成混损特性，而聚类加权网络增强的数据驱动模型可
合表达式，从而扩展搜索空间。提升对风电数据时间特征的识别能力，两者结合
2）变异：随机修改运算符、常数或变量，以旨在实现更精准、可靠的功率预测。

逃离局部最优解。
3）选择：优先选择均方误差（ mean squared 3 不同风电场功率预测方法的性能评估
error，MSE）较低且复杂度较低的方程进行保留，
确保迭代优化向帕累托最优解收敛。本研究以山西某风电场为验证对象，其布局
由于符号回归无需预设模型形式，可直接从示意图如图 3 所示。该风电场的 50 台风电机组沿
观测数据中自动挖掘内在函数关系，是多范式融从西北向东南的方向呈线性排布，布局规整且具
合研究的重要工具，能将理论推导得到的关键特有明显的方向性，激光雷达位于风电机组阵列的
征 [32] 与机器学习数据驱动方法相结合，得到泛化中部区域（横坐标 X 约为 3 km，纵坐标 Y 约为
能力强且具备物理可解释性的显式函数模型。
8 km 处）。提取的数据包括实测风速、风向、温
因预测数据与原始数据存在较强线性相关度和功率，采样分辨率为 15 分钟。训练集共
性，直接构建特征矩阵 [33] 易导致过拟合。为此，
672 个数据点，测试集共 192 个数据点。训练集与
本研究通过平衡预测值之间的差值、乘积及平方测试集的原始风速、风向及温度数据如图 4 所示。
差等来构建特征，采用数据自适应原则，将物理
驱动预测功率 P 与数据驱动预测功率 P 的衍生 12
1
2
特征 P –P 、P *P 、(P –P ) 等作为融合模型的初 10 N
2
1
1
2
2
2
1
始输入特征。随后通过遗传算法的选择操作，以
8
均方误差最小化为目标，自动筛选对融合结果贡
献度高的特征。通过不同组合将数值数据转化为 Y/km 6
多个符号表达式，从海量候选公式中筛选出最优 4
方程，作为融合模型的预测表达式。
2 风电机组；
物理与数据融合的风电场功率预测流程如图 2 LiDAR
所示。具体方法为：1）结合历史风速数据，通 0
0 3 6 9 12 15
过改进高斯尾流模型，得到物理驱动预测功率 X/km
P ；2）对历史风电数据进行聚类和分解，结合长图 3 风电场机位
1
Fig. 3 Wind farm turbine layout

K-means +
EMD + LSTM
为了评估模型预期性能，本研究采用均方根
长短期记忆
功率数据并行权重网络误差（root mean square error，RMSE）和平均绝对
物理驱动
误差（ mean absolute error， MAE）两种指标 [34-35] ，
数据驱动
最优参数辨识对不同方法的有效性进行评估与比较。基于训练
风资源数据
Gaussian尾流集和参数优化方法，对尾流膨胀系数进行优化，
模型 + PSO
以改进流场计算结果，提升物理驱动方法的功率
物理知识 PySR 融合功率预测模型 PySR 经验数据
预测性能。采用 K 均值聚类算法对训练集进行聚
图 2 物理数据融合功率预测类，分析不同聚类数对应的轮廓系数，发现当 K=
Fig. 2 Power prediction via physical data fusion 2 时，轮廓系数达到最大值 0.809，表明风电数据
178

177 178 179 180 181 182 183 184 185 186 187