Page 46 - 《中国电力》2026年第3期

P. 46

2026 年第 59 卷

以负荷聚合商总收益为适应度评价基准，通旋状运动为
过罚函数法处理约束条件为 D = |X (t)− X(t)| （26）
∗
′
M ∑ ′ bl
∗
F(X k ) = F −λ max(0,g m (X k )) （19） X(t +1) = X (t)+ D e cos(2πl) （27）
m=1
式中：D′为当前搜索个体与当前最优解之间的距
式中： F(X k )为 GWOA 算法在每次迭代中实际用离；b 为定义对数螺旋形状的常数，通过调整 b
于评估每个鲸鱼个体优劣的最终指标，由于本模控制螺旋紧密度，优化购电套利收益；l 为取值范
型的目标是最大化收益 F，任何违反约束的行为围为 [−1,1]的随机数。为明确座头鲸个体的位置
都将通过减去一个正的惩罚项来降低其适应度更新行为，WOA 设置了一个随机数 p ∈ [0,1]，即
值； λ为动态惩罚系数，随迭代次数递增以强化  ∗
X (t)− AD, p＜0.5

 （28）
约束满足； g m (X k )为第 m 个约束违反量，包括可 X(t +1) =  X (t)+ D e cos(2πl), p≥0.5
′ bl
 ∗

调资源潜力约束、功率平衡约束和行业生产约束。
阶段 3：搜索猎物（探索）。为扩大鲸鱼种
然后进一步根据激励值 µ i,t 计算实际负荷调节
群搜索范围，防止由于一般工业功率平衡约束而
量 ∆P i,t 为
陷入局部最优，当 |A|＞1时，选择基于一个随机
( ) max
∆P i,t = f(µ i,t ) = α i µ i,t / µ i,t +β i ∆P （20）
i,t 个体而不是最优个体进行位置更新为
式中： α i 和为可调资源 i 的激励-响应特性参数， X(t +1) = X rand (t)− AD rand （29）
β i
∆P max 为工业可调资源 i 在 t 时段的最大负荷调节量。
i,t D rand = |CX rand (t)− X(t)| （30）
所采用的 WOA 算法求解过程模拟座头鲸的
式中： X rand (t)为随机选择的鲸鱼位置向量， D rand
“气泡网”捕食方式，包括 3 个阶段。
为搜索猎物的步长。
阶段 1：包围猎物。WOA 中的猎物是指最优
针对 WOA 存在的问题对 3 阶段流程进行改进，
解或近似最优解，在算法初期根据适应度函数定
在 GWOA 中，初始种群首先根据适应度值对总体
义种群中的最优个体，其他成员基于这个最优个
进行排序，然后根据代价函数将排序后总体划分
体更新自己的位置，每次位置更新的行为为
为 δ组，再从每组中随机选择一个成员，则有
∗ （21）
D = |CX (t)− X(t)| δ ∑
∗
X p = β(X − X ij ) （31）
∗
X(t +1) = X (t)− AD （22） i=1
∗
式中：t 为迭代次数； X (t)为迭代到第 t 代时最优 β = exp((1−t/T max )∗log(1/γ)) （32）
解的位置向量；D 为包围的步长；A 和 C 为系数
式中： X p 为目标猎物的位置向量； β为对数螺旋
向量，数学模型为
形状常数； X ij 为选中的第 i 组中的第 j 个成员；
A = 2ar −a （23） γ为取值范围为 [0,1]的随机数。
C = 2r （24）随后，基于式（33）和式（34）更新位置为
∗
（25） X(t +1) = X (t)− AD （33）
a = 2−2t/T max

式中：r 为取值范围为 [0,1]的随机向量； a为收敛 D = CX p − X(t) （34）

因子； T max 为算法设置的最大迭代次数。本节在 WOA 的基础上引入分组思想，在包围
阶段 2：气泡网攻击（开发）。该阶段包含猎物阶段进行改进，GWOA 算法流程如图 3 所示。

收缩包围机制以及螺旋更新位置 2 种方法。针对
储能充放电等需跨时段协调的变量，首先在式 4 算例分析
（ 20）的基础上，通过迭代将参数 a从 2 减小至

0 来计算收缩包围机制；随后螺旋更新位置计算 4.1 算例简介
鲸鱼和猎物所在位置之间的距离，然后在鲸鱼和本算例基于某试点工业园区真实数据对所提
猎物的位置之间建立螺旋方程，模拟座头鲸的螺低碳调度决策方法进行验证。选取 A 城市试点工

41 42 43 44 45 46 47 48 49 50 51