Page 191 - 《爆炸与冲击》2026年第5期
P. 191
第 46 卷 韩思豪,等: 机器学习驱动的折纸超材料夹芯结构低速冲击响应预测及多目标优化 第 5 期
[ ]
Q(S, A) ← Q(S, A)+λ R+γmaxQ(S , A)− Q(S, A) (13)
′
A
式中:学习率 λ=0.1,折扣因子 γ=0.9, S ′ 是执行动作 A 产生的新状态。随后更新当前训练轮次及历史最
优的 Q 值记录,并对线性加权系数 χ 1 和 χ 2 同步更新。Agent 通过与力学环境的不断交互,从动作空间中
选择并执行动作,将获得的 Q(S, A) 储存在表 4 所示的 Q 值表中,并用于帕累托前沿分析。所有状态首
ρ eff 进行非支配排序,筛选所得的非支配解集合,即为所求的
先依据其对应的峰值力响应 F P 和等效密度
帕累托最优前沿。随着训练进行,Agent 通过持续迭代填充 Q 值表,逐步收敛到全局最优策略,最终实现
对峰值力响应和等效密度的多目标优化。综上所述,该优化问题可以定义为:
[ ]
Find S = α,β,θ
Max R
◦
◦
α ∈ [15 ,35 ]
(14)
◦ ◦
β ∈ [15 ,35 ]
S.t.
◦
◦
θ ∈ [15 ,35 ]
tanα+tanθ<1
Q -learning Q 表
表 4 多目标 优化模型所使用的
Table 4 The Q-table used in the multi-objective Q-learning optimization model
S=(α, β, θ) A 1 A 2 ··· A 7
Q(S 1 , A 1 ) Q(S 1 , A 2 ) ··· Q(S 1 , A 7 )
S 1
Q(S 2 , A 1 ) Q(S 2 , A 2 ) ··· Q(S 2 , A 7 )
S 2
⋮ ⋮ ⋮ ⋮ ⋮
3.2 承载-轻量化多目标优化
在厚装甲、硬质防弹衣、工业安全装置等需要坚固防护设计中,其主要安全功能和目标是在冲击加
载下维持自身完整性,此时有必要优化结构的承载性来抵御冲击危害。如前所述,峰值力和等效密度之
间相互独立,需要分别考虑并权衡使二者同时达到最优。因此,不存在单一的最优解使得 2 个目标同时
达到最优,而是存在一个平衡这 2 个目标最优解的帕累托前沿(Pareto front)。图 12 所示为针对夹芯复合
结构的最佳承载能力和轻量化性能的多目标优化设计结果,即最大化峰值力并最小化等效密度。图 12(a)
中的绿星代表乌托邦点(Utopia point),即 2 个优化目标理论上同时达到各自可能最优值最优的理想点。
蓝色曲线为帕累托前沿,代表了最接近乌托邦点的最优解集,位于该曲线左上方的其他解均为劣解。在
帕累托前沿上,膝点(knee point)通常定义为曲线曲率最大的点,其代表着峰值力最大化和等效密度最小
化之间的最佳折衷方案。选择膝点之外的解,意味着需要通过牺牲一个目标来改善另一个目标。帕累
托前沿上的两个极值点被称为纳达尔点(Nadir points),对应于其中一个目标达到了乌托邦点的值。
图 12(c) 展示了膝点 Θ 9 所对应设计的冲击响应和拓扑结构,其峰值力为 16.58 kN,等效密度为
0.244 3。而在工程实际中,可以根据具体性能偏好选择帕累托前沿上的其他解。图 12(b)、(d) 分别代表
了 2 个纳达尔点 Θ 8 和 Θ 10 。 Θ 8 以最大化承载能力为目标,峰值力为 17.72 kN,对应的等效密度为 0.256 4。
Θ 10 以最轻量化为目标,等效密度为 0.240 4,对应的峰值力为 14.97 kN。若需优先满足更强承载能力或更
Θ 10 点。对比 Θ 8 的冲击力响应峰
轻量化结构的要求,可分别选用 Θ 8 或 3 个结果的力-时间曲线可以发现,
Θ 10 则发生
值后残余力最小,而 Θ 10 的残余力最大。同时,绿色的能量曲线也表明 Θ 8 吸收了最多的能量,
了显著的能量反弹现象。这进一步验证了该多目标优化结果的合理性,同时说明了所提出多目标设计
能够在提供坚固防护的同时实现冲击能量的吸收和耗散。此外,图 12(b)~(d) 中的蓝色和红色曲线对比
了有限元仿真和 ResANN 模型预测的冲击响应,结果表明两者在多种工况下吻合良好,验证了模型的可
靠性。
051441-13

