Page 46 - 《中国电力》2026年第3期
P. 46
2026 年 第 59 卷
以负荷聚合商总收益为适应度评价基准,通 旋状运动为
过罚函数法处理约束条件为 D = |X (t)− X(t)| (26)
∗
′
M ∑ ′ bl
∗
F(X k ) = F −λ max(0,g m (X k )) (19) X(t +1) = X (t)+ D e cos(2πl) (27)
m=1
式中:D′为当前搜索个体与当前最优解之间的距
式中: F(X k )为 GWOA 算法在每次迭代中实际用 离;b 为定义对数螺旋形状的常数,通过调整 b
于评估每个鲸鱼个体优劣的最终指标,由于本模 控制螺旋紧密度,优化购电套利收益;l 为取值范
型的目标是最大化收益 F,任何违反约束的行为 围为 [−1,1]的随机数。为明确座头鲸个体的位置
都 将 通 过 减 去 一 个 正 的 惩 罚 项 来 降 低 其 适 应 度 更新行为,WOA 设置了一个随机数 p ∈ [0,1],即
值; λ为动态惩罚系数,随迭代次数递增以强化 ∗
X (t)− AD, p<0.5
(28)
约束满足; g m (X k )为第 m 个约束违反量,包括可 X(t +1) = X (t)+ D e cos(2πl), p≥0.5
′ bl
∗
调资源潜力约束、功率平衡约束和行业生产约束。
阶段 3:搜索猎物(探索)。为扩大鲸鱼种
然后进一步根据激励值 µ i,t 计算实际负荷调节
群搜索范围,防止由于一般工业功率平衡约束而
量 ∆P i,t 为
陷入局部最优,当 |A|>1时,选择基于一个随机
( ) max
∆P i,t = f(µ i,t ) = α i µ i,t / µ i,t +β i ∆P (20)
i,t 个体而不是最优个体进行位置更新为
式中: α i 和 为可调资源 i 的激励-响应特性参数, X(t +1) = X rand (t)− AD rand (29)
β i
∆P max 为工业可调资源 i 在 t 时段的最大负荷调节量。
i,t D rand = |CX rand (t)− X(t)| (30)
所采用的 WOA 算法求解过程模拟座头鲸的
式中: X rand (t)为随机选择的鲸鱼位置向量, D rand
“气泡网”捕食方式,包括 3 个阶段。
为搜索猎物的步长。
阶段 1:包围猎物。WOA 中的猎物是指最优
针对 WOA 存在的问题对 3 阶段流程进行改进,
解或近似最优解,在算法初期根据适应度函数定
在 GWOA 中,初始种群首先根据适应度值对总体
义种群中的最优个体,其他成员基于这个最优个
进行排序,然后根据代价函数将排序后总体划分
体更新自己的位置,每次位置更新的行为为
为 δ组,再从每组中随机选择一个成员,则有
∗ (21)
D = |CX (t)− X(t)| δ ∑
∗
X p = β(X − X ij ) (31)
∗
X(t +1) = X (t)− AD (22) i=1
∗
式中:t 为迭代次数; X (t)为迭代到第 t 代时最优 β = exp((1−t/T max )∗log(1/γ)) (32)
解的位置向量;D 为包围的步长;A 和 C 为系数
式中: X p 为目标猎物的位置向量; β为对数螺旋
向量,数学模型为
形 状 常 数 ; X ij 为 选 中 的 第 i 组 中 的 第 j 个 成 员 ;
A = 2ar −a (23) γ为取值范围为 [0,1]的随机数。
C = 2r (24) 随后,基于式(33)和式(34)更新位置为
∗
(25) X(t +1) = X (t)− AD (33)
a = 2−2t/T max
式中:r 为取值范围为 [0,1]的随机向量; a为收敛 D = CX p − X(t) (34)
因子; T max 为算法设置的最大迭代次数。 本节在 WOA 的基础上引入分组思想,在包围
阶段 2:气泡网攻击(开发)。该阶段包含 猎物阶段进行改进,GWOA 算法流程如图 3 所示。
收缩包围机制以及螺旋更新位置 2 种方法。针对
储 能 充 放 电 等 需 跨 时 段 协 调 的 变 量 , 首 先 在 式 4 算例分析
( 20) 的 基 础 上 , 通 过 迭 代 将 参 数 a从 2 减 小 至
0 来计算收缩包围机制;随后螺旋更新位置计算 4.1 算例简介
鲸鱼和猎物所在位置之间的距离,然后在鲸鱼和 本算例基于某试点工业园区真实数据对所提
猎物的位置之间建立螺旋方程,模拟座头鲸的螺 低碳调度决策方法进行验证。选取 A 城市试点工
42

