Page 66 - 《软件学报》2025年第8期

P. 66

王榕等: 基于记忆策略的元解释学习 3489

表 9 和表 10 提供了对于象棋任务的内存使用分析, 比较了原始 MIL 系统 Metagol、Metagol A 与它们的剪枝
I
版本 Metagol F 和 Metagol AI_ 的性能. 结果表明, 剪枝版本在显著减少推理次数上取得了成功. 具体来说, Metagol F
F
平均推理次数减少了大约 15.88%, 而 Metagol AI_ 的减少约为 12.77%, 相较于它们各自的基础系统. 剪枝后的
F
MIL 系统在 Prolog 默认堆栈限制内实现了更少的原子数量和减少的子句垃圾收集 (CGC).

表 9 在象棋策略任务中 Metagol 和 Metagol F 的内存消耗比较

Metagol Metagol F
Example
Inferences Atoms CGC Inferences Atoms CGC
1 5.79×10 6 6 428.00 11.00 5.07×10 6 6 258.67 6.00
2 8.14×10 6 6 430.00 14.00 6.38×10 6 6 260.00 10.00
3 8.98×10 6 6 429.33 15.00 7.76×10 6 6 429.33 13.00

表 10 在象棋策略任务中 Metagol A 和 I Metagol AI_ 的内存消耗比较
F

Metagol AI Metagol AI_F
Example
Inferences Atoms CGC Inferences Atoms CGC
1 3.85×10 6 6 429.10 12.40 3.46×10 6 6 420.33 11.00
2 1.22×10 7 6 429.80 15.10 1.10×10 7 6 425.00 14.00
3 8.84×10 6 6 430.00 15.60 7.95×10 6 6 426.67 14.50
4 2.34×10 7 6 429.78 15.11 2.10×10 7 6 427.00 14.00
5 4.46×10 7 6 429.89 15.33 3.41×10 7 6 428.67 14.00

5.4 删除列表尾元素
droplasts, 它能从给定列表的每个子列表中删除最后一个元素. 在此
删除列表尾元素的目标是学习一个程序
实验中, 我们随机生成了 5 个不同大小的训练集, 范围为 1–5, 并将时间限制设为 600 s.
由于一阶程序的表达能力有限, 一阶 MIL 系统 (Metagol 和 Metagol F ) 在此任务中均失败. 图 8 显示了两个高
阶 MIL 系统 Metagol A 和 I Metagol AI_ 的结果. 再一次, Metagol AI_ 成功提高了学习效率. 同时, 高阶系统的平均学
F
F
习时间被缩短了大约 1/4, 并且它们学习到了相同的程序. 在最佳情况下, Metagol AI_ 的学习时间约为 Metagol AI
F
的 63.79%.

0.22
Metagol AI
0.20
Metagol AI_F
0.18
Average learning time (s) 0.14
0.16
0.12
0.10
0.08
0.06
0.04
0.02
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
The number of examples
图 8 删除列表尾元素任务中高阶 MIL 系统 Metagol A 和 I Metagol AI_ 的平均学习时间
F

表 11 对比了 Metagol A 和 I Metagol AI_ 在解决删除列表尾元素问题上的内存成本. 值得注意的是, 尽管全局堆
F
栈约束相同, Metagol AI_ 在减少推理和优化垃圾收集方面表现出了显著改进. 这种效率指向了 Metagol AI_ 在内
F
F
存管理和计算优化方面的优越性能, 突显了其在处理复杂任务时的更高资源效率. 表 11 展示了 Metagol A 和
I

61 62 63 64 65 66 67 68 69 70 71