Devanagari Handwritten Character Recognition using fine-tuned Deep Convolutional Neural Network on trivial dataset,Sādhanā

当前位置： X-MOL 学术 › Sādhanā › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

Devanagari Handwritten Character Recognition using fine-tuned Deep Convolutional Neural Network on trivial dataset
Sādhanā ( IF 1.4 ) Pub Date : 2020-09-23 , DOI: 10.1007/s12046-020-01484-1
Shalaka Prasad Deore , Albert Pravin

In order to rapidly build an automatic and precise system for image recognition and categorization, deep learning is a vital technology. Handwritten character classification also gaining more attention due to its major contribution in automation and specially to develop applications for helping visually impaired people. Here, the proposed work highlighting on fine-tuning approach and analysis of state-of-the-art Deep Convolutional Neural Network (DCNN) designed for Devanagari Handwritten characters classification. A new Devanagari handwritten characters dataset is generated which is publicly available. Datasets consist of total 5800 isolated images of 58 unique character classes: 12 vowels, 36 consonants and 10 numerals. In addition to this database, a two-stage VGG16 deep learning model is implemented to recognize those characters using two advanced adaptive gradient methods. A two-stage approach of deep learning is developed to enhance overall success of the proposed Devanagari Handwritten Character Recognition System (DHCRS). The first model achieves 94.84% testing accuracy with training loss of 0.18 on new dataset. Moreover, the second fine-tuned model requires very fewer trainable parameters and notably less training time to achieve state-of-the-art performance on a very small dataset. It achieves 96.55% testing accuracy with training loss of 0.12. We also tested the proposed model on four different benchmark datasets of isolated characters as well as digits of Indic scripts. For all the datasets tested, we achieved the promising results.

中文翻译：

在微不足道的数据集上使用微调的深度卷积神经网络进行梵文手写字符识别

为了快速构建用于图像识别和分类的自动且精确的系统，深度学习是一项至关重要的技术。手写字符分类由于其在自动化方面的重要贡献，尤其是在开发用于帮助视力障碍者的应用程序方面，也引起了更多关注。在这里，拟议的工作着重于微调方法和为梵文手写字符分类设计的最新深度卷积神经网络（DCNN）的分析。生成了一个新的梵文手写字符数据集，该数据集可公开获得。数据集包含58个独特字符类别的总共5800个孤立图像：12个元音，36个辅音和10个数字。除了这个数据库，实施了两阶段的VGG16深度学习模型，以使用两种高级自适应梯度方法识别这些字符。开发了一种两阶段的深度学习方法，以增强建议的Devanagari手写字符识别系统（DHCRS）的总体成功率。第一个模型在新数据集上达到94.84％的测试准确度，训练损失为0.18。此外，第二个经过微调的模型需要非常少的可训练参数，并且需要极少的训练时间才能在非常小的数据集上实现最新的性能。它达到96.55％的测试精度，训练损失为0.12。我们还对孤立字符以及印度文字的数字的四个不同基准数据集测试了该模型。对于所有测试的数据集，我们都取得了可喜的结果。开发了一种两阶段的深度学习方法，以增强建议的Devanagari手写字符识别系统（DHCRS）的总体成功率。第一个模型在新数据集上达到94.84％的测试准确度，训练损失为0.18。此外，第二个经过微调的模型需要非常少的可训练参数，并且需要极少的训练时间才能在非常小的数据集上实现最新的性能。它达到96.55％的测试精度，训练损失为0.12。我们还对孤立字符以及印度文字的数字的四个不同基准数据集测试了该模型。对于所有测试的数据集，我们都取得了可喜的结果。开发了一种两阶段的深度学习方法，以增强建议的Devanagari手写字符识别系统（DHCRS）的总体成功率。第一个模型在新数据集上达到94.84％的测试准确度，训练损失为0.18。此外，第二个经过微调的模型需要非常少的可训练参数，并且需要极少的训练时间才能在非常小的数据集上实现最新的性能。它达到96.55％的测试精度，训练损失为0.12。我们还对孤立字符以及印度文字的数字的四个不同基准数据集测试了该模型。对于所有测试的数据集，我们都取得了可喜的结果。新数据集的测试精度为84％，训练损失为0.18。此外，第二个经过微调的模型需要非常少的可训练参数，并且需要极少的训练时间才能在非常小的数据集上实现最新的性能。它达到96.55％的测试精度，训练损失为0.12。我们还对孤立字符以及印度文字的数字的四个不同基准数据集测试了该模型。对于所有测试的数据集，我们都取得了可喜的结果。新数据集的测试精度为84％，训练损失为0.18。此外，第二个经过微调的模型需要非常少的可训练参数，并且需要极少的训练时间才能在非常小的数据集上实现最新的性能。它达到96.55％的测试精度，训练损失为0.12。我们还对孤立字符以及印度文字的数字的四个不同基准数据集测试了该模型。对于所有测试的数据集，我们都取得了可喜的结果。我们还对孤立字符以及印度文字的数字的四个不同基准数据集测试了该模型。对于所有测试的数据集，我们都取得了可喜的结果。我们还对孤立字符以及印度文字的数字的四个不同基准数据集测试了该模型。对于所有测试的数据集，我们都取得了可喜的结果。

更新日期：2020-09-23

点击分享查看原文

点击收藏

阅读更多本刊最新论文