当前位置: X-MOL 学术Complexity › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
使用具有规则激活功能的深度神经网络进行基准普什图语手写字符数据集和普什图语对象字符识别(OCR)
Complexity ( IF 1.7 ) Pub Date : 2021-03-05 , DOI: 10.1155/2021/6669672
Imran Uddin 1 , Dzati A. Ramli 2 , Abdullah Khan 1 , Javed Iqbal Bangash 1 , Nosheen Fayyaz 3 , Asfandyar Khan 1 , Mahwish Kundi 4
Affiliation  

在机器学习领域,使用了不同的技术来训练机器并执行不同的任务,例如计算机视觉,数据分析,自然语言处理和语音识别。计算机视觉是应用机器学习和深度学习技术的主要分支之一。光学字符识别(OCR)是机器识别语言字符的能力。普什图语是世界上最古老的历史语言之一,在阿富汗和巴基斯坦使用。OCR应用程序已针对多种草书语言(如乌尔都语,中文和日语)进行了开发,但是在识别普什图语方面所做的工作很少。在手写字符识别方面,由于每个手写字符的形状都受作者的手部动力学的影响,因此OCR识别字符变得更加困难。与其他语言相比,缺乏普什图语手写字符数据研究的原因是因为没有可用于实验目的的基准数据集。这项研究的重点是创建这样的数据集,然后出于评估目的,对机器进行了培训,以正确识别看不见的普什图语手写字符。为了实现这一目标,创建了一个包含43000张图像的数据集。训练并测试了三种具有反向传播算法的前馈神经网络模型,这些模型使用不同的整流线性单位(ReLU)层配置(具有1-ReLU层的模型1,具有2-ReLU层的模型2和具有3-ReLU层的模型3)进行了测试。该数据集。仿真显示,模型1在看不见的数据上的准确度高达87.6%,而模型2的准确度分别为81.60%和3%。同样,模型1的损失(交叉熵)最低,训练和测试为0.15和3.17,其次模型2的训练和测试为0.7和4.2,而模型3的损失(交叉熵)为最后一个,损失值为6.4和3.69。模型1的精度,召回率和f度量值均优于模型2和模型3。根据结果,发现模型1(具有1个ReLU激活层)是最有效的。两种模式在识别帕什托手写字符的准确性方面。模型1的损失(交叉熵)最低,在训练和测试上分别为0.15和3.17,其次是模型2,在训练和测试上分别为0.7和4.2,而模型3则是最后一个,损失值为6.4和3.69。模型1的精度,召回率和f度量值均优于模型2和模型3。根据结果,发现模型1(具有1个ReLU激活层)是最有效的。两种模式在识别帕什托手写字符的准确性方面。模型1的损失(交叉熵)最低,在训练和测试上分别为0.15和3.17,其次是模型2,在训练和测试中分别为0.7和4.2,而模型3在损失和数值上分别为6.4和3.69。模型1的精度,召回率和f度量值均优于模型2和模型3。根据结果,发现模型1(具有1个ReLU激活层)是最有效的。两种模式在识别帕什托手写字符的准确性方面。



"点击查看英文标题和摘要"

更新日期:2021-03-05
down
wechat
bug