Page 65 - 《软件学报》2025年第8期

P. 65

3488 软件学报 2025 年第 36 卷第 8 期

表 7 和表 8 提供了一阶 MIL 系统 Metagol、Metagol F 以及高阶 MIL 系统 Metagol AI 、Metagol AI_ 在执行机器
F
人服务员任务期间内存消耗的对比分析. 分析表明, 优化版本 Metagol F 和 Metagol AI_ 在推理次数上显著减少, 从
F
而提高了计算效率. 对于一阶系统, Metagol F 相较于 Metagol 实现了约 44.18% 的平均推理次数减少. 同样, 在高阶
系统中, Metagol AI_ 相较于 Metagol A 实现了约 42.80% 的平均推理次数减少. 这些显著的改进突显了优化系统中
F
I
剪枝技术的有效性, 展示了其在处理具有更高计算效率、较低原子数和较少子句垃圾收集 (CGC) 能力的任务方
面的优势, 且此改进在 Prolog 默认 256 MB 堆栈限制下得以实现.

表 7 在机器人服务员任务中, 一阶 MIL 系统表 8 在机器人服务员任务中, 高阶 MIL 系统
Metagol 与 Metagol F 之间的内存成本比较 Metagol A 与 I Metagol AI_ 之间的内存成本比较
F

Metagol Metagol F Metagol AI Metagol AI_F
Example Example
Inferences Atoms CGC Inferences Atoms CGC Inferences Atoms CGC Inferences Atoms CGC
9
9
9
1 1.64×10 6 373.33 7.25 1.10×10 6 360.33 6.50 1 1.81×10 6 444.29 8.29 1.07×10 6 350.67 7.00
9
9
9
9
9
2 3.22×10 6 359.67 7.67 1.60×10 6 340.33 6.50 2 2.74×10 6 444.67 8.67 1.89×10 6 340.33 7.50
9
9
9
3 4.49×10 6 331.33 8.33 2.13×10 6 320.33 7.00 3 4.54×10 6 445.00 9.00 2.23×10 6 320.33 8.33
9
9
9
4 3.42×10 6 388.33 9.33 2.30×10 6 370.67 8.00 4 4.89×10 6 444.67 10.00 2.90×10 6 370.67 9.00
9
9
9
9
9
9
5 4.45×10 6 388.33 9.00 2.12×10 6 375.67 8.50 5 4.65×10 6 445.00 10.00 2.30×10 6 375.33 8.50
5.3 象棋策略
本实验的设置与文献 [21] 相同. 此学习任务旨在学习一个简单的国际象棋策略, 即维持一道黑卒的防线以实
现升变. 在初始状态下, 卒子被放置在不同的横行上, 而在最终状态下, 它们位于第 8 行, 这里忽略了白方的干扰.
我们随机生成了 5 组不同大小的训练集, 大小范围为 1–5, 设定时间限制为 600 s, 然后使用上述 4 个系统学习这
个国际象棋策略. 经过 10 次实验后, 我们得到了结果.
图 7 展示了 4 个 MIL 系统在国际象棋策略任务上的结果. 很明显, 改进的 MIL 系统相较于原始的 MIL 系
统可以显著减少学习时间. 除了在样例数为 4 和 5 时的一阶系统外, 算法 1 的效果没有显现, 因为它们都是超时
情况.

45 6
Metagol Metagol AI
40 Metagol F Metagol AI_F
5
35
4 3
30
Average learning time (s) 25 Average learning time (s) 2 1
20
15
0
10
−1
5
0 −2
1.0 1.5 2.0 2.5 3.0 1 2 3 4 5
The number of examples The number of examples
(a) 一阶 (b) 高阶
图 7 象棋策略任务中一阶和高阶 MIL 系统的平均学习时间

60 61 62 63 64 65 66 67 68 69 70