当前位置: X-MOL 学术Pattern Anal. Applic. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Evaluation of different chrominance models in the detection and reconstruction of faces and hands using the growing neural gas network.
Pattern Analysis and Applications ( IF 3.7 ) Pub Date : 2019-04-08 , DOI: 10.1007/s10044-019-00819-x
Anastassia Angelopoulou 1 , Jose Garcia-Rodriguez 2 , Sergio Orts-Escolano 2 , Epaminondas Kapetanios 1 , Xing Liang 1 , Bencie Woll 3 , Alexandra Psarrou 1
Affiliation  

Physical traits such as the shape of the hand and face can be used for human recognition and identification in video surveillance systems and in biometric authentication smart card systems, as well as in personal health care. However, the accuracy of such systems suffers from illumination changes, unpredictability, and variability in appearance (e.g. occluded faces or hands, cluttered backgrounds, etc.). This work evaluates different statistical and chrominance models in different environments with increasingly cluttered backgrounds where changes in lighting are common and with no occlusions applied, in order to get a reliable neural network reconstruction of faces and hands, without taking into account the structural and temporal kinematics of the hands. First a statistical model is used for skin colour segmentation to roughly locate hands and faces. Then a neural network is used to reconstruct in 3D the hands and faces. For the filtering and the reconstruction we have used the growing neural gas algorithm which can preserve the topology of an object without restarting the learning process. Experiments conducted on our own database but also on four benchmark databases (Stirling’s, Alicante, Essex, and Stegmann’s) and on deaf individuals from normal 2D videos are freely available on the BSL signbank dataset. Results demonstrate the validity of our system to solve problems of face and hand segmentation and reconstruction under different environmental conditions.

中文翻译:

使用不断增长的神经气体网络在人脸和手的检测和重建中评估不同的色度模型。

手和脸的形状等物理特征可用于视频监控系统和生物特征认证智能卡系统以及个人保健中的人类识别和识别。然而,此类系统的准确性受到照明变化、不可预测性和外观可变性(例如被遮挡的面部或手部、杂乱的背景等)的影响。这项工作在不考虑结构和时间运动学的情况下,评估不同环境中的不同统计和色度模型,背景越来越杂乱,光照变化很常见,没有应用遮挡,以获得面部和手部的可靠神经网络重建的手。首先使用统计模型进行肤色分割,以粗略定位手和脸。然后使用神经网络在 3D 中重建手和脸。对于过滤和重建,我们使用了增长的神经气体算法,该算法可以保留对象的拓扑,而无需重新启动学习过程。在我们自己的数据库以及四个基准数据库(Stirling's、Alicante、Essex 和 Stegmann's)上进行的实验以及来自正常 2D 视频的聋人的实验可在 BSL signbank 数据集上免费获得。结果证明了我们的系统在不同环境条件下解决人脸和手部分割和重建问题的有效性。对于过滤和重建,我们使用了增长的神经气体算法,该算法可以保留对象的拓扑,而无需重新启动学习过程。在我们自己的数据库以及四个基准数据库(Stirling's、Alicante、Essex 和 Stegmann's)上进行的实验以及来自正常 2D 视频的聋人的实验可在 BSL signbank 数据集上免费获得。结果证明了我们的系统在不同环境条件下解决人脸和手部分割和重建问题的有效性。对于过滤和重建,我们使用了增长的神经气体算法,该算法可以保留对象的拓扑,而无需重新启动学习过程。在我们自己的数据库以及四个基准数据库(Stirling's、Alicante、Essex 和 Stegmann's)上进行的实验以及来自正常 2D 视频的聋人的实验可在 BSL signbank 数据集上免费获得。结果证明了我们的系统在不同环境条件下解决人脸和手部分割和重建问题的有效性。和 Stegmann 的)和来自正常 2D 视频的聋人在 BSL 标志库数据集上免费提供。结果证明了我们的系统在不同环境条件下解决人脸和手部分割和重建问题的有效性。和 Stegmann 的)和来自正常 2D 视频的聋人在 BSL 标志库数据集上免费提供。结果证明了我们的系统在不同环境条件下解决人脸和手部分割和重建问题的有效性。
更新日期:2019-04-08
down
wechat
bug