当前位置: X-MOL 学术Vis. Comput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Language-invariant novel feature descriptors for handwritten numeral recognition
The Visual Computer ( IF 3.0 ) Pub Date : 2020-08-04 , DOI: 10.1007/s00371-020-01938-x
Soulib Ghosh , Agneet Chatterjee , Pawan Kumar Singh , Showmik Bhowmik , Ram Sarkar

Numeral recognition is treated as a benchmark research problem as this is a basic module for designing a comprehensive optical character recognition system. In this context, unconstrained handwritten numeral recognition is still considered as an open research problem. Most of the feature descriptors found in the literature for the said problem, work well for numeral images written in a particular language. To encounter this shortcoming, in this paper, we have proposed two shape-based feature descriptors, namely Point-Light Source-based Shadow (PLSS) and Histogram of Oriented Pixel Positions (HOPP). We have evaluated the proposed feature descriptors on 10 (9 offline and 1 online) publicly available standard handwritten numeral image datasets written in eight different languages. Besides, to prove the usefulness of the descriptors in real-life scenario, we have considered numeral string images also. We have also shown how the proposed feature descriptors are invariant toward broken, noisy and rotated numeral images. Experimental outcomes soundly prove that the proposed feature descriptors have the ability to estimate the shape of a numeral image almost accurately irrespective of the language in which it is written. Comparison of the proposed feature descriptors with other shape-based as well as texture-based features shows that PLSS and HOPP produce the results which are analogous to state of the art. The code of the proposed feature descriptors can be found at—https://github.com/ghoshsoulib/Numeral-Recognition.

中文翻译:

用于手写数字识别的语言不变新特征描述符

数字识别被视为基准研究问题,因为这是设计综合光学字符识别系统的基本模块。在这种情况下,无约束手写数字识别仍然被认为是一个开放的研究问题。在上述问题的文献中发现的大多数特征描述符,对于用特定语言编写的数字图像都适用。为了克服这个缺点,在本文中,我们提出了两种基于形状的特征描述符,即基于点光源的阴影(PLSS)和定向像素位置直方图(HOPP)。我们已经在以八种不同语言编写的 10 个(9 个离线和 1 个在线)公开可用的标准手写数字图像数据集上评估了提议的特征描述符。除了,为了证明描述符在现实生活场景中的有用性,我们还考虑了数字字符串图像。我们还展示了所提出的特征描述符如何对破碎、嘈杂和旋转的数字图像保持不变。实验结果有力地证明了所提出的特征描述符能够几乎准确地估计数字图像的形状,而不管它是用什么语言编写的。所提出的特征描述符与其他基于形状和基于纹理的特征的比较表明,PLSS 和 HOPP 产生的结果类似于现有技术。可以在 https://github.com/ghoshsoulib/Numeral-Recognition 找到建议的特征描述符的代码。我们还展示了所提出的特征描述符如何对破碎、嘈杂和旋转的数字图像保持不变。实验结果有力地证明了所提出的特征描述符能够几乎准确地估计数字图像的形状,而不管它是用什么语言编写的。所提出的特征描述符与其他基于形状和基于纹理的特征的比较表明,PLSS 和 HOPP 产生的结果类似于现有技术。可以在 https://github.com/ghoshsoulib/Numeral-Recognition 找到建议的特征描述符的代码。我们还展示了所提出的特征描述符如何对破碎、嘈杂和旋转的数字图像保持不变。实验结果有力地证明了所提出的特征描述符能够几乎准确地估计数字图像的形状,而不管它是用什么语言编写的。所提出的特征描述符与其他基于形状和基于纹理的特征的比较表明,PLSS 和 HOPP 产生的结果类似于现有技术。可以在 https://github.com/ghoshsoulib/Numeral-Recognition 找到建议的特征描述符的代码。实验结果有力地证明了所提出的特征描述符能够几乎准确地估计数字图像的形状,而不管它是用什么语言编写的。所提出的特征描述符与其他基于形状和基于纹理的特征的比较表明,PLSS 和 HOPP 产生的结果类似于现有技术。可以在 https://github.com/ghoshsoulib/Numeral-Recognition 找到建议的特征描述符的代码。实验结果有力地证明了所提出的特征描述符能够几乎准确地估计数字图像的形状,而不管它是用什么语言编写的。所提出的特征描述符与其他基于形状和基于纹理的特征的比较表明,PLSS 和 HOPP 产生的结果类似于现有技术。可以在 https://github.com/ghoshsoulib/Numeral-Recognition 找到建议的特征描述符的代码。
更新日期:2020-08-04
down
wechat
bug