当前位置: X-MOL 学术arXiv.cs.CV › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
通过使用具有扩展卷积的基于注意力的神经网络,从视频中增强的3D人体姿势估计
arXiv - CS - Computer Vision and Pattern Recognition Pub Date : 2021-03-04 , DOI: arxiv-2103.03170
Ruixu Liu, Ju Shen, He Wang, Chen Chen, Sen-ching Cheung, Vijayan K. Asari

注意机制为学习具有增强的隐式时间一致性的空间模型提供了顺序预测框架。在这项工作中,我们展示了一种系统设计(从2D到3D),其中介绍了如何将常规网络和其他形式的约束条件并入注意框架中,以学习姿势估计任务的远程依赖性。本文的贡献在于,以任意视频序列的灵活性和可扩展性作为输入,为端到端姿势估计的基于注意力的模型的设计和训练提供了一种系统的方法。我们通过扩张卷积的多尺度结构适应时间感受野来实现这一点。此外,所提出的体系结构可以容易地适应因果模型,从而实现实时性能。任何现成的2D姿态估计系统(例如Mocap库)都可以以即席方式轻松集成。通过将Human3.6M数据集上的每个关节位置误差的平均值减小到33.4 mm,我们的方法达到了最先进的性能,并且优于现有方法。



"点击查看英文标题和摘要"

更新日期:2021-03-05
down
wechat
bug