通过使用具有扩展卷积的基于注意力的神经网络，从视频中增强的3D人体姿势估计,arXiv - CS - Computer Vision and Pattern Recognition - X-MOL

当前位置： X-MOL 学术 › arXiv.cs.CV › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

通过使用具有扩展卷积的基于注意力的神经网络，从视频中增强的3D人体姿势估计
arXiv - CS - Computer Vision and Pattern Recognition Pub Date : 2021-03-04 , DOI: arxiv-2103.03170
Ruixu Liu, Ju Shen, He Wang, Chen Chen, Sen-ching Cheung, Vijayan K. Asari

注意机制为学习具有增强的隐式时间一致性的空间模型提供了顺序预测框架。在这项工作中，我们展示了一种系统设计（从2D到3D），其中介绍了如何将常规网络和其他形式的约束条件并入注意框架中，以学习姿势估计任务的远程依赖性。本文的贡献在于，以任意视频序列的灵活性和可扩展性作为输入，为端到端姿势估计的基于注意力的模型的设计和训练提供了一种系统的方法。我们通过扩张卷积的多尺度结构适应时间感受野来实现这一点。此外，所提出的体系结构可以容易地适应因果模型，从而实现实时性能。任何现成的2D姿态估计系统（例如Mocap库）都可以以即席方式轻松集成。通过将Human3.6M数据集上的每个关节位置误差的平均值减小到33.4 mm，我们的方法达到了最先进的性能，并且优于现有方法。

"点击查看英文标题和摘要"

更新日期：2021-03-05

点击分享查看原文

点击收藏

阅读更多本刊最新论文

全部期刊列表>>

阿拉丁

口腔微生物

英语语言编辑翻译加编辑

开学季购书享好礼新

有奖问卷征集新

材料学领域约200份+SCI期刊

定位全球科研英才

中国图象图形学学会合作刊

东北石油大学合作期刊

动物源性食品遗传学与育种

专业英语编辑服务

左智伟--多次发布

深圳湾

加州大学

多次发布---上海中医药

南科大

新泽西

罗格斯

上海交大

重庆大学

ACS材料视界

客服邮箱：service@x-mol.com
官方微信：X-molTeam2
邮编：100098
地址：北京市海淀区知春路56号中航科技大厦

bug