当前位置: X-MOL 学术SIAM J. Imaging Sci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Towards Statistically Provable Geometric 3D Human Pose Recovery
SIAM Journal on Imaging Sciences ( IF 2.1 ) Pub Date : 2021-02-22 , DOI: 10.1137/19m1299955
Jianqiao Wangni , Dahua Lin , Ji Liu , Kostas Daniilidis , Jianbo Shi

SIAM Journal on Imaging Sciences, Volume 14, Issue 1, Page 246-270, January 2021.
Recovering three-dimensional (3D) structures such as object poses from limited two-dimensional (2D) information is an important research problem in computer vision, graphics, and robotics. The estimation of object pose from single images or multiple casual images could be ill-conditioned math problems. There is a popular family of algorithms of geometric sparse representation for 3D pose recovery (GSR-3D) that pretrains an overcomplete dictionary of 3D basis poses $B$, and then matches the detected 2D object pose $Y$ by jointly estimating the transformation $R$, projection $\Pi,$ and combination coefficients $c$, assuming $Y \approx \Pi \sum_i c_i R B_i$. In this paper, we make the first step of analyzing to which extent could we solve this ill-conditioned problem, and of understanding how the recovery error is affected by fundamental factors, e.g., dictionary size, observation noise, and running time. As these factors are implicit in objective functions, we analyze with the help of various sparse regularizers and a multistage optimizer, and prove that the recovery error $\mathcal L(l)$ decays w.r.t. the number of stages $l$ with a high probability, $Prob\left(\mathcal L(l) < \rho^{l-1} \mathcal L(0) + \delta \right) \geq 1- \epsilon$, where the constants $0< \rho <1, 0<\delta, 0<\epsilon \ll 1$ are related to the aforementioned factors. To the best of our knowledge, this is the first theoretical analysis in this line of research. Experiments are conducted to support our improvement upon previous regularization within the same framework. This will further characterize the trade-off between speed and accuracy towards real-time geometric inference in applications.


中文翻译:

迈向统计上可行的3D几何人体姿势恢复

SIAM影像科学杂志,第14卷,第1期,第246-270页,2021年1月。
从有限的二维(2D)信息中恢复诸如对象姿态之类的三维(3D)结构是计算机视觉,图形和机器人技术中的重要研究问题。从单个图像或多个休闲图像估计对象姿态可能是病态的数学问题。有一种流行的用于3D姿态恢复的几何稀疏表示算法(GSR-3D)系列,该算法预训练3D基础姿态的超完备字典$ B $,然后通过共同估计变换$来匹配检测到的2D对象姿态$ Y $。假设$ Y \ approx \ Pi \ sum_i c_i R B_i $,则R $,投影$ \ Pi,$和组合系数$ c $。在本文中,我们迈出第一步,分析可以在多大程度上解决这个病态问题,并了解恢复误差如何受到基本因素的影响,例如。例如,字典大小,观察噪声和运行时间。由于这些因素在目标函数中是隐含的,因此我们将在各种稀疏正则化程序和多级优化器的帮助下进行分析,并证明恢复误差$ \ mathcal L(l)$随着级数$ l $的降低而衰减,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1 ,0 <\ delta,0 <\ eps \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。字典大小,观察噪声和运行时间。由于这些因素在目标函数中是隐含的,因此我们借助各种稀疏正则化器和多级优化器进行分析,并证明恢复误差$ \ mathcal L(l)$随着级数$ l $的降低而衰减。 ,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1 ,0 <\ delta,0 <\ eps \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。字典大小,观察噪声和运行时间。由于这些因素在目标函数中是隐含的,因此我们借助各种稀疏正则化器和多级优化器进行分析,并证明恢复误差$ \ mathcal L(l)$随着级数$ l $的降低而衰减。 ,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1 ,0 <\ delta,0 <\ eps \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。观察噪音和运行时间。由于这些因素在目标函数中是隐含的,因此我们借助各种稀疏正则化器和多级优化器进行分析,并证明恢复误差$ \ mathcal L(l)$随着级数$ l $的降低而衰减。 ,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1 ,0 <\ delta,0 <\ eps \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。观察噪音和运行时间。由于这些因素在目标函数中是隐含的,因此我们借助各种稀疏正则化器和多级优化器进行分析,并证明恢复误差$ \ mathcal L(l)$随着级数$ l $的降低而衰减。 ,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1 ,0 <\ delta,0 <\ eps \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。由于这些因素在目标函数中是隐含的,因此我们借助各种稀疏正则化器和多级优化器进行分析,并证明恢复误差$ \ mathcal L(l)$随着级数$ l $的降低而衰减。 ,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1 ,0 <\ delta,0 <\ eps \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。由于这些因素在目标函数中是隐含的,因此我们借助各种稀疏正则化器和多级优化器进行分析,并证明恢复误差$ \ mathcal L(l)$随着级数$ l $的降低而衰减。 ,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1 ,0 <\ delta,0 <\ eps \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。我们借助各种稀疏正则化器和多级优化器进行分析,并证明恢复错误$ \ mathcal L(l)$会以高概率$ Prob \ left(\ mathcal L (l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1,0 <\ delta,0 <\ epsilon \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。我们借助各种稀疏正则化器和多级优化器进行分析,并证明恢复错误$ \ mathcal L(l)$会以高概率$ Prob \ left(\ mathcal L (l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常量$ 0 <\ rho <1,0 <\ delta,0 <\ epsilon \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。t。极有可能的阶段数$ l $,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常数$ 0 <\ rho <1,0 <\ delta,0 <\ epsilon \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。t。极高的阶段数$ l $,$ Prob \ left(\ mathcal L(l)<\ rho ^ {l-1} \ mathcal L(0)+ \ delta \ right)\ geq 1- \ epsilon $,其中常数$ 0 <\ rho <1,0 <\ delta,0 <\ epsilon \ ll 1 $与上述因素有关。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。据我们所知,这是该研究领域中的第一个理论分析。进行实验以支持我们在相同框架内对先前的正则化进行改进。这将进一步表征速度和精度之间的权衡,以实现应用程序中的实时几何推理。
更新日期:2021-04-01
down
wechat
bug