Page 339 - 《软件学报》2025年第4期
P. 339
陈铂垒 等: 面向具身人工智能的物体目标导航综述 1745
据是匹配的, 占用预期奖励在重建精度准确率方面达到了相对较高的性能指标. S-ANS [127] 通过引入归纳偏差, 从
2
模型结构设计方面对 ANS 进行了改进, 其性能的提升主要体现在探索面积方面, 达到了 84.4 m 的探索面积. 最
近, UPEN [128] 通过学习一组前向预测模型并将它们的预测分歧作为鼓励探索新状态的内在动机, 在探索面积、探
索率、IoU 和地图准确率方面都达到了最先进的水平.
表 7 Gibson 数据集和 HM3D 数据集上的 ObjectNav 性能比较
数据集 模型结构 方法 视觉数据 视觉模块 策略类型 年份 SR (%)↑ SPL (%)↑ DTS (m)↓
DD-PPO [103] RGBD ResNet 有限数据集 2020 15.0 10.7 3.24
端到端 ZSON [53] RGB ResNet50 视觉语言模型 2022 31.3 12.0 -
Li等人 [35] RGBD CNN 有限数据集 2023 82.8 48.7 -
[45] [130]
SemExp RGBD Mask R-CNN 有限数据集 2020 54.4 19.9 1.723
Gibson
PONI [20] RGBD Mask R-CNN [130] 有限数据集 2022 73.6 41.0 1.25
模块化 Al-Halah等人 [109] RGB ResNet9 增强数据集 2022 33.0 23.6 -
Min等人 [23] RGBD DeepLabv2 [134] 有限数据集 2022 60.0 31.2 1.89
[130]
[22] [129]
3D-aware RGBD RedNet 有限数据集 2023 74.5 42.1 1.16
DD-PPO [103] RGBD ResNet 有限数据集 2020 26.0 12.0 -
Habitat-Web [14] RGBD ResNet18 有限数据集 2022 55.0 22.0 -
端到端 OVRL [[108] RGBD ResNet50 增强数据集 2022 60.0 27.0 -
HM3D ProcTHOR [47] RGB CNN 增强数据集 2022 54.0 32.0 -
PIRLNav [15] RGB ResNet50 有限数据集 2023 62.2 28.7 -
PEANUT [41] RGBD PSPNet [132] 有限数据集 2023 64.0 33.0 -
模块化
ESC [113] RGBD GLIP [133] 视觉语言模型 2023 44.0 25.2 -
表 8 AI2-THOR 数据集上的 ObjectNav 性能比较
所有步数 步数大于等于5
模型结构 方法 视觉数据 视觉模块 策略类型 年份
SR (%)↑ SPL (%)↑ SR (%)↑ SPL (%)↑
SAVN [39] RGB ResNet18 元强化学习 2019 40.9 16.2 28.7 23.5
Li等人 [104] RGB - 元强化学习 2020 27.7 11.5 20.6 8.0
ORG+TPN [36] RGB Faster R-CNN [135] 有限数据集 2020 69.3 39.4 60.7 38.6
Ye等人 [31] RGBD ResNet18 有限数据集 2021 74.0 46.0 - -
Mayo等人 [34] RGB ResNet18 有限数据集 2021 46.2 17.9 32.6 16.0
NIE [105] RGBD Mask R-CNN [130] 有限数据集 2021 80.0 31.3 - -
端到端 HOZ [32] RGB ResNet18 有限数据集 2021 70.6 40.0 62.8 39.2
Li等人 [49] RGB - 元强化学习 2022 71.0 19.6 62.0 24.2
OMT [66] RGB ResNet50 有限数据集 2022 71.1 26.7 - -
TransNav [48] RGB Faster R-CNN [135] 元强化学习 2022 76.2 46.4 68.3 40.2
GMAN [40] RGB ResNet18 元强化学习 2022 48.8 25.1 - -
L-sTDE [38] RGB Mask R-CNN 有限数据集 2023 75.1 41.5 - -
HiNL [37] RGB ResNet 有限数据集 2023 80.1 49.8 74.6 47.6
[42]
MJOLNIR RGB ResNet18 有限数据集 2020 65.3 21.1 50.0 20.9
[65]
VTNET RGB ResNet18 有限数据集 2021 72.2 44.9 63.4 44.0
DOA [107] RGB DERT [136] 有限数据集 2021 74.3 40.3 67.9 40.4
模块化 Dang等人 [112] RGB ResNet18 有限数据集 2023 82.4 48.9 76.2 49.3
ESC [113] RGBD GLIP [133] 视觉语言模型 2023 38.1 22.2 - -
Dang等人 [16] RGB ResNet18 有限数据集 2023 83.1 50.2 77.0 50.9
SHRL [116] RGB DERT [136] 有限数据集 2023 78.3 41.8 70.6 0.42