Page 339 - 《软件学报》2025年第4期
P. 339

陈铂垒 等: 面向具身人工智能的物体目标导航综述                                                        1745


                 据是匹配的, 占用预期奖励在重建精度准确率方面达到了相对较高的性能指标. S-ANS                         [127] 通过引入归纳偏差, 从
                                                                                           2
                 模型结构设计方面对        ANS  进行了改进, 其性能的提升主要体现在探索面积方面, 达到了                  84.4 m 的探索面积. 最
                 近, UPEN  [128] 通过学习一组前向预测模型并将它们的预测分歧作为鼓励探索新状态的内在动机, 在探索面积、探
                 索率、IoU  和地图准确率方面都达到了最先进的水平.

                                    表 7 Gibson  数据集和  HM3D  数据集上的    ObjectNav  性能比较

                  数据集   模型结构        方法       视觉数据      视觉模块        策略类型      年份   SR (%)↑  SPL (%)↑  DTS (m)↓
                                  DD-PPO [103]  RGBD    ResNet     有限数据集     2020  15.0    10.7    3.24
                         端到端       ZSON [53]   RGB      ResNet50  视觉语言模型     2022  31.3    12.0    -
                                   Li等人 [35]  RGBD       CNN       有限数据集     2023  82.8    48.7    -
                                        [45]                  [130]
                                  SemExp      RGBD   Mask R-CNN    有限数据集     2020  54.4    19.9   1.723
                  Gibson
                                   PONI [20]  RGBD   Mask R-CNN [130]  有限数据集  2022  73.6   41.0    1.25
                         模块化    Al-Halah等人 [109]  RGB   ResNet9    增强数据集     2022  33.0    23.6    -
                                  Min等人 [23]  RGBD    DeepLabv2 [134]  有限数据集  2022  60.0   31.2    1.89
                                                      [130]
                                        [22]                [129]
                                  3D-aware    RGBD     RedNet      有限数据集     2023  74.5    42.1    1.16
                                  DD-PPO [103]  RGBD    ResNet     有限数据集     2020  26.0    12.0    -
                                 Habitat-Web [14]  RGBD  ResNet18  有限数据集     2022  55.0    22.0    -
                         端到端      OVRL [[108]  RGBD     ResNet50   增强数据集     2022  60.0    27.0    -
                  HM3D           ProcTHOR [47]  RGB      CNN       增强数据集     2022  54.0    32.0    -
                                  PIRLNav [15]  RGB     ResNet50   有限数据集     2023  62.2    28.7    -
                                  PEANUT [41]  RGBD    PSPNet [132]  有限数据集   2023  64.0    33.0    -
                         模块化
                                   ESC [113]  RGBD      GLIP [133]  视觉语言模型   2023  44.0    25.2    -


                                         表 8 AI2-THOR  数据集上的    ObjectNav  性能比较

                                                                              所有步数         步数大于等于5
                  模型结构       方法     视觉数据       视觉模块        策略类型      年份
                                                                          SR (%)↑  SPL (%)↑  SR (%)↑  SPL (%)↑
                           SAVN [39]  RGB      ResNet18    元强化学习     2019  40.9    16.2    28.7    23.5
                           Li等人 [104]  RGB        -        元强化学习     2020  27.7    11.5    20.6    8.0
                          ORG+TPN [36]  RGB  Faster R-CNN [135]  有限数据集  2020  69.3  39.4   60.7    38.6
                           Ye等人 [31]  RGBD     ResNet18    有限数据集     2021  74.0    46.0     -      -
                          Mayo等人 [34]  RGB     ResNet18    有限数据集     2021  46.2    17.9    32.6    16.0
                            NIE [105]  RGBD  Mask R-CNN [130]  有限数据集  2021  80.0   31.3     -      -
                  端到端       HOZ [32]  RGB      ResNet18    有限数据集     2021  70.6    40.0    62.8    39.2
                           Li等人 [49]  RGB         -        元强化学习     2022  71.0    19.6    62.0    24.2
                            OMT [66]  RGB      ResNet50    有限数据集     2022  71.1    26.7     -      -
                          TransNav [48]  RGB  Faster R-CNN [135]  元强化学习  2022  76.2  46.4  68.3    40.2
                           GMAN [40]  RGB      ResNet18    元强化学习     2022  48.8    25.1     -      -
                           L-sTDE [38]  RGB  Mask R-CNN    有限数据集     2023  75.1    41.5     -      -
                            HiNL [37]  RGB      ResNet     有限数据集     2023  80.1    49.8    74.6    47.6
                                 [42]
                          MJOLNIR     RGB      ResNet18    有限数据集     2020  65.3    21.1    50.0    20.9
                                [65]
                           VTNET      RGB      ResNet18    有限数据集     2021  72.2    44.9    63.4    44.0
                           DOA [107]  RGB      DERT [136]  有限数据集     2021  74.3    40.3    67.9    40.4
                  模块化     Dang等人 [112]  RGB    ResNet18    有限数据集     2023  82.4    48.9    76.2    49.3
                            ESC [113]  RGBD    GLIP [133]  视觉语言模型    2023  38.1    22.2     -      -
                          Dang等人 [16]  RGB     ResNet18    有限数据集     2023  83.1    50.2    77.0    50.9
                           SHRL [116]  RGB     DERT [136]  有限数据集     2023  78.3    41.8    70.6    0.42
   334   335   336   337   338   339   340   341   342   343   344