Page 64 - 《软件学报》2025年第8期

P. 64

王榕等: 基于记忆策略的元解释学习 3487

的默认堆栈限制 (256 MB) 下, Metagol F 需要更少的垃圾收集操作来回收未使用的内存. 即便在青蛙与荷叶问题
中, Metagol F 的推理次数相比 Metagol 也大大减少了, 大约减少了 98.65%.

表 6 青蛙与荷叶问题中 Metagol 与 Metagol F 的性能与内存消耗对比

Metagol Metagol F
No.
Inferences Atoms CGC Inferences Atoms CGC
1 4.62×10 5 6 164 3 4.62×10 5 6 164 3
2 3.53×10 6 6 165 5 3.90×10 5 5 989 3
3 2.90×10 8 6 166 5 7.82×10 6 5 990 4
4 8.19×10 10 6 167 6 1.10×10 9 5 991 5

5.2 机器人服务员

机器人服务员的任务是根据杯子上的标签将茶或咖啡倒入桌子上的空杯中. 我们用 robot(A,B) 表示每个例
子, 其中 A 和 B 分别表示机器人的初始状态和杯子的最终状态. 实验的输入设置包括背景知识、元规则集和例子集.
与文献 [21] 中的实验类似, 高阶系统 Metagol A 和 I Metagol AI_ 的背景知识包含两个部分, 即编译的背景知识
F
和解释的背景知识. 而一阶系统 Metagol 和 Metagol F 的背景知识仅包含编译的背景知识. 同时, 除了在一阶系统中
使用的一阶元规则外, 高阶系统中的元规则集还包含高阶元规则.
我们随机生成 5 个不同规模的训练集, 大小从 1–5 不等, 并将时间限制设为 600 s. 在 4 个系统上重复进行 10
次实验后, 我们得到每个系统的平均学习时间.
图 6 展示了一阶和高阶 MIL 系统的学习结果. x 轴表示实例的数量. 在图 6(a) 中, y 轴表示一阶 MIL 系统 Metagol
和 Metagol F 的平均学习时间. 在图 6(b) 中, y 轴表示 Metagol A 和 I Metagol AI_ 的平均学习时间. 原始系统 (Metagol
F
和 Metagol AI ) 和修改系统 (Metagol F 和 Metagol AI_F ) 的平均学习时间分别以红色和蓝色显示. 结果表明 Metagol F
比 Metagol 学习速度更快, Metagol AI_ 比 F Metagol A 学习速度显著更快. 在最佳情况下, Metagol F 的学习时间约为
I
Metagol 的 47.1%. 在最佳情况下, Metagol AI_ 的学习时间约为的 30.26%.
F

600 220
Metagol Metagol AI
Metagol F Metagol AI_F
200
500
180

400 160
Average learning time (s) 300 Average learning time (s) 140

120
200
100
100
80

0 60
1 2 3 4 5 1 2 3 4 5
The number of examples The number of examples
(a) 一阶 (b) 高阶
图 6 机器人服务员任务中一阶和高阶 MIL 系统的平均学习时间

59 60 61 62 63 64 65 66 67 68 69