Page 335 - 《软件学报》2025年第4期
P. 335

陈铂垒 等: 面向具身人工智能的物体目标导航综述                                                        1741


                    (7) 视图定位精度    (view location accuracy, V.Loc.): 探索任务结束时, 具身智能体在工作空间中定位到指定视
                 图的成功率.
                    (8) 导航准确率    (navigation accuracy, Nav.): 导航准确率采用路径长度加权成功率       (success weighted by path
                 length, SPL) 来衡量. 这个标准在衡量成功率的同时, 还衡量导航至目标的效率:

                                                        1  ∑ N    l i
                                                   SPL =     S i                                     (17)
                                                        N   i  max(p i ,l i )
                            i
                    设   l i  为第   次任务中从具身智能体的起始位置到目标的最短路径距离,               p i  为本次任务中具身智能体实际走过
                               S i  是第  i 次任务中成功的二进制指标, 若任务成功为         1, 任务失败为      N  为验证任务总数.
                 的路径长度. 假设                                                         0.
                    (9) 重建准确率   (reconstruction accuracy, Recon.): 探索任务结束时, 具身智能体构建的地图的准确率, 计算为:

                                                                TP
                                                    Precision =     ,
                                                              TP+ FP
                 其中, 将重建的地图中占据情况重建正确的设置为“正阳性” (true positive, TP), 重建错误的设置为“假阳性” (false
                 negative, FP).

                                                                d T i
                 4.2.2    物体目标导航评价指标
                    在每一次物体目标导航任务中, 当具身智能体执行停止动作后, 如果具身智能体距最近的目标类别物体实例
                 的距离在某个阈值       d s  内则认为单次物体目标导航任务是成功的. 衡量物体目标导航算法性能优劣的首要标准是
                 成功率, 成功率指成功的任务数量占所有物体目标导航任务的比例, 计算方式如公式                          (18) 所示:

                                                                   n
                                                    SuccessRate(SR) =                                (18)
                                                                   N
                 其中,    n 为成功的任务次数,    N  为全部的导航任务数量.
                    同时, 为了更全面的评价物体目标导航算法的性能优劣, 从导航效率、导航准确率等多个方面设置标准对物
                 体目标导航算法的性能进行评价.
                    (1) 路径长度加权成功率       SPL: 定义与公式   (17) 相同.
                    (2) 距离成功的距离     (distance to success, DTS). 任务结束时具身智能体距离成功阈值边界的距离. 计算方法如下:

                                                  DTS = max(||x T −G|| 2 −d s ,0)                    (19)
                             是任务结束时具身智能体距离目标位置的              L2      d s  是成功阈值.
                 其中,    ||x T −G|| 2                            距离,
                    (3) 目标进度   (goal progress). 具身智能体每次运动后与目标类别物体缩减的距离.
                    (4) 轨迹相似性    (normalized dynamic time warping, nDTW). 衡量具身智能体的真实路径与专家路径之间的相
                 似度, 惩罚偏离专家路径的偏差动作.
                    (5) 导航误差   (navigation error, NE). 具身智能体最终位置与目标位置之间的平均距离, 单位为           m.
                    (6) 路径长度软加权成功率        (soft success weighted by path length, SoftSPL). SoftSPL  与  SPL  直接将失败任务计
                 算为  0  不同, SoftSPL  衡量了具身智能体停止位置与目标位置之间的距离              (即使任务失败).

                                                            (     )
                                                      1  ∑ N          l i
                                              SoftSPL =     1−  d T i                                (20)
                                                      N   i=1  d init i  max(p i ,l i )
                 其中,    d init i   指具身智能体的初始位置与目标位置的测地距离,          指具身智能体的最终位置与目标位置的测地距离.
                    (7) 路径长度加权进度      (progress weighted by path length, PPL). 该评价标准多用于多物体目标导航任务中, 衡
                 量了具身智能体寻找多个目标物体时的导航效率.

                                                                 (  )
                                                    PPL = s·d/max p,d                                (21)
                                                            l
                                                          ∑
                                                       d =    d i−1,i d  为具身智能体开始位置到所有目标物体的总测
                 其中,    s 指具身智能体成功找到的目标物体数量,                      ,
                                                            i=1
                                        i
                                                            l
                 地距离,   d i−1,i  为第   i−1 个和第   个目标之间的测地距离,    为找到的目标物体数量,      p 为具身智能体总路径长度.
                    路径加权成功率在成功率的基础上进一步评价了算法导航的效率, SoftSPL                      在  SPL  的基础上提出了更宽松的
                 评价标准, 导航结束时到目标物体的距离             (DTS) 和导航误差   (NE) 则评价了导航算法的准确率, 轨迹相似性则评价
   330   331   332   333   334   335   336   337   338   339   340