Page 263 - 《软件学报》2025年第5期
P. 263
杨红红 等: 基于平行多尺度时空图卷积网络的三维人体姿态估计算法 2163
Smoking
图 6 本文方法与对比方法在 Human3.6M 测试集上的可视化结果 (续)
3.5 本文方法的局限性及失败实验结果分析
虽然本文所提出的 PMST-GNet 在三维人体姿态估计中获得较好的实验效果, 但是, 本文所设计的网络模型依
然遵循两阶段的 2D-3D 姿态估计的框架, 其性能高度依赖于 2D 姿态估计器的准确性, 其次, 本文所提出的模型是
一种基于单目图像单视角的 2D-3D 姿态估计模型, 其不能很好地解决姿态估计中遮挡问题和深度模糊性问题造
成的影响, 因此, 如何引入多假设估计理论和扩散模型消除上述 3 个因素对基于单目图像的 2D-3D 姿态估计的影
响是本文下一步工作的重点 [34] . 在此, 为了更好地说明 2D 姿态估计器产生的误差、遮挡问题及深度模糊性问题
对本文实验的影响, 以 Human3.6M 中 SittingDown, Photo 和 WalkDog 为例, 列举了一些本文模型失败的案例, 如
图 7 所示, 其中, 图 7 中用绿线突出显示上述 3 种原因.
Input Ours Ground truth
SittingDown
(a) 2D姿态估计误差
Photo
(b) 自遮挡问题
WalkDog
(c) 深度模糊性问题
图 7 本文模型在 Human3.6M 上的失败示例
4 结 论
本文提出了一种基于平行时空多尺度卷积网络模型 (PMST-GNet) 的三维人体姿态估计算法. PMST-GNet 模