当前位置: X-MOL 学术Int. J. Pattern Recognit. Artif. Intell. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A New Method for Mapping Active Joint Locations of Skeletons to Pre-Shape Space for Action Recognition
International Journal of Pattern Recognition and Artificial Intelligence ( IF 0.9 ) Pub Date : 2020-09-29 , DOI: 10.1142/s0218001421500099
Guang Li 1, 2 , Kai Liu 1 , Chongyang Ding 1 , Wenwen Ding 3 , Evgeny Belyaev 4 , Fei Cheng 1
Affiliation  

Being a class of effective feature descriptors for action recognition, action representations based on skeleton sequences have yielded excellent recognition results. Most methods used to construct these action representations are based on the information from all the joint positions in actions. Unfortunately, some joints in the actions do not improve the accuracy of action recognition, and may even cause unnecessary inter-class errors. In this study, the authors propose a new method for action recognition by selecting active joints which are closely related to the movement of the body as the first step. Further, a skeleton is characterized as a set of its active-joint positions, and the set can be mapped to a point on pre-shape space to filter out the scale and translation variability. Then, a skeleton sequence (an action) can be regarded as points on the space. Because the timing-sequence relationship between skeletons is very valuable for action recognition, a tensor-based linear dynamical system (tLDS) is employed to model the temporal information of the action. To avoid using a finite-order sequence to estimate the infinite-order feature descriptor of a tLDS, the descriptor is mapped to a point on an infinite Grassmannian composed of the extended observability subspaces. The action is classified using sparse coding and dictionary learning (SCDL) on the infinite Grassmannian. Experimental results demonstrate that the recognition accuracies of the proposed method outperform state-of-the-art ones on four different action datasets.

中文翻译:

一种将骨骼的活动关节位置映射到预形状空间以进行动作识别的新方法

作为一类有效的动作识别特征描述符,基于骨架序列的动作表示已经产生了很好的识别效果。大多数用于构建这些动作表示的方法都是基于动作中所有关节位置的信息。不幸的是,动作中的一些关节并没有提高动作识别的准确性,甚至可能导致不必要的类间错误。在这项研究中,作者提出了一种新的动作识别方法,首先选择与身体运动密切相关的活动关节作为第一步。此外,骨架被表征为其活动关节位置的集合,并且该集合可以映射到预形状空间上的一个点以过滤掉比例和平移可变性。然后,一个骨架序列(一个动作)可以看作是空间上的点。由于骨骼之间的时序关系对于动作识别非常有价值,因此采用基于张量的线性动力学系统(tLDS)对动作的时间信息进行建模。为了避免使用有限阶序列来估计 tLDS 的无限阶特征描述符,描述符被映射到由扩展可观察性子空间组成的无限格拉斯曼矩阵上的一个点。使用稀疏编码和字典学习 (SCDL) 在无限格拉斯曼矩阵上对动作进行分类。实验结果表明,在四个不同的动作数据集上,所提出方法的识别精度优于最先进的方法。由于骨骼之间的时序关系对于动作识别非常有价值,因此采用基于张量的线性动力学系统(tLDS)对动作的时间信息进行建模。为了避免使用有限阶序列来估计 tLDS 的无限阶特征描述符,描述符被映射到由扩展可观察性子空间组成的无限格拉斯曼矩阵上的一个点。使用稀疏编码和字典学习 (SCDL) 在无限格拉斯曼矩阵上对动作进行分类。实验结果表明,在四个不同的动作数据集上,所提出方法的识别精度优于最先进的方法。由于骨骼之间的时序关系对于动作识别非常有价值,因此采用基于张量的线性动力学系统(tLDS)对动作的时间信息进行建模。为了避免使用有限阶序列来估计 tLDS 的无限阶特征描述符,描述符被映射到由扩展可观察性子空间组成的无限格拉斯曼矩阵上的一个点。使用稀疏编码和字典学习 (SCDL) 在无限格拉斯曼矩阵上对动作进行分类。实验结果表明,在四个不同的动作数据集上,所提出方法的识别精度优于最先进的方法。为了避免使用有限阶序列来估计 tLDS 的无限阶特征描述符,描述符被映射到由扩展可观察性子空间组成的无限格拉斯曼矩阵上的一个点。使用稀疏编码和字典学习 (SCDL) 在无限格拉斯曼矩阵上对动作进行分类。实验结果表明,在四个不同的动作数据集上,所提出方法的识别精度优于最先进的方法。为了避免使用有限阶序列来估计 tLDS 的无限阶特征描述符,描述符被映射到由扩展可观察性子空间组成的无限格拉斯曼矩阵上的一个点。使用稀疏编码和字典学习 (SCDL) 在无限格拉斯曼矩阵上对动作进行分类。实验结果表明,在四个不同的动作数据集上,所提出方法的识别精度优于最先进的方法。
更新日期:2020-09-29
down
wechat
bug