Page 64 - 《软件学报》2025年第8期
P. 64

王榕 等: 基于记忆策略的元解释学习                                                              3487


                 的默认堆栈限制      (256 MB) 下, Metagol F 需要更少的垃圾收集操作来回收未使用的内存. 即便在青蛙与荷叶问题
                 中, Metagol F 的推理次数相比   Metagol 也大大减少了, 大约减少了      98.65%.

                                  表 6 青蛙与荷叶问题中        Metagol 与  Metagol F 的性能与内存消耗对比

                                               Metagol                       Metagol F
                             No.
                                     Inferences  Atoms     CGC      Inferences  Atoms    CGC
                             1       4.62×10 5   6 164      3       4.62×10 5   6 164      3
                             2       3.53×10 6   6 165      5       3.90×10 5   5 989      3
                             3       2.90×10 8   6 166      5       7.82×10 6   5 990      4
                             4      8.19×10 10   6 167      6       1.10×10 9   5 991      5

                 5.2   机器人服务员

                    机器人服务员的任务是根据杯子上的标签将茶或咖啡倒入桌子上的空杯中. 我们用                             robot(A,B) 表示每个例
                 子, 其中  A  和  B  分别表示机器人的初始状态和杯子的最终状态. 实验的输入设置包括背景知识、元规则集和例子集.
                    与文献   [21] 中的实验类似, 高阶系统      Metagol A 和 I  Metagol AI_ 的背景知识包含两个部分, 即编译的背景知识
                                                                    F
                 和解释的背景知识. 而一阶系统          Metagol 和  Metagol F 的背景知识仅包含编译的背景知识. 同时, 除了在一阶系统中
                 使用的一阶元规则外, 高阶系统中的元规则集还包含高阶元规则.
                    我们随机生成      5  个不同规模的训练集, 大小从       1–5  不等, 并将时间限制设为      600 s. 在  4  个系统上重复进行  10
                 次实验后, 我们得到每个系统的平均学习时间.
                    图  6 展示了一阶和高阶     MIL  系统的学习结果.    x 轴表示实例的数量. 在图      6(a) 中,  y 轴表示一阶  MIL  系统  Metagol
                 和  Metagol F 的平均学习时间. 在图   6(b) 中,  y 轴表示  Metagol A 和 I  Metagol AI_ 的平均学习时间. 原始系统  (Metagol
                                                                           F
                 和  Metagol AI ) 和修改系统  (Metagol F 和  Metagol AI_F ) 的平均学习时间分别以红色和蓝色显示. 结果表明     Metagol F
                 比  Metagol 学习速度更快, Metagol AI_ 比 F  Metagol A 学习速度显著更快. 在最佳情况下, Metagol F 的学习时间约为
                                                        I
                 Metagol 的  47.1%. 在最佳情况下, Metagol AI_ 的学习时间约为的    30.26%.
                                                   F

                                600                              220
                                                     Metagol                       Metagol AI
                                                     Metagol F                     Metagol AI_F
                                                                 200
                                500
                                                                 180

                                400                              160
                               Average learning time (s)  300  Average learning time (s)  140




                                                                 120
                                200
                                                                 100
                                100
                                                                 80


                                  0                              60
                                   1     2     3    4     5         1    2     3     4    5
                                        The number of examples          The number of examples
                                             (a) 一阶                          (b) 高阶
                                   图 6 机器人服务员任务中一阶和高阶             MIL  系统的平均学习时间
   59   60   61   62   63   64   65   66   67   68   69