当前位置: X-MOL 学术Neural Process Lett. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Fukunaga–Koontz Convolutional Network with Applications on Character Classification
Neural Processing Letters ( IF 3.1 ) Pub Date : 2020-05-21 , DOI: 10.1007/s11063-020-10244-5
Bernardo B. Gatto , Eulanda M. dos Santos , Kazuhiro Fukui , Waldir S. S. Júnior , Kenny V. dos Santos

Several convolutional neural network architectures have been proposed for handwritten character recognition. However, most of the conventional architectures demand large scale training data and long training time to obtain satisfactory results. These requirements prevent the use of these methods in a broader range of applications. As an alternative to cope with these problems, we present a new convolutional network for handwritten character recognition based on the Fukunaga–Koontz transform (FKT). Our approach lies in the assumption that Fukunaga–Koontz convolutional kernels can be efficiently learned from subspaces and directly employed to produce high discriminant features in a shallow network architecture. When representing image classes by subspaces, the within-class separability is reduced, since the subspaces form clusters in a low-dimensional space. To increase the between-class separability, we compute a discriminative space from the training subspaces using FKT. By learning convolutional kernels from subspaces, it is possible to extract representative and discriminative features from an image with only a few parameters. Another contribution of the proposed network is the use of pooling layers, which further improves its performance. The proposed method, called Fukunaga–Koontz Network (FKNet), is suitable for solving practical problems, especially when training and processing times are constraints. Four publicly available handwritten character datasets are employed to evaluate the advantages of FKNet. In addition, we demonstrate the flexibility of the proposed method by experiments on LFW dataset.

中文翻译:

Fukunaga–Koontz卷积网络及其在字符分类中的应用

已经提出了几种卷积神经网络体系结构来手写字符识别。然而,大多数常规架构需要大规模的训练数据和较长的训练时间才能获得令人满意的结果。这些要求阻止了这些方法在更广泛的应用中的使用。作为解决这些问题的替代方法,我们提出了一种基于Fukunaga-Koontz变换(FKT)的新卷积网络,用于手写字符识别。我们的方法基于这样一个假设,即可以从子空间有效地学习Fukunaga-Koontz卷积核,并将其直接用于在浅层网络体系结构中产生高判别特征。当用子空间表示图像类别时,类别内的可分离性降低了,因为子空间在低维空间中形成簇。为了增加类之间的可分离性,我们使用FKT从训练子空间中计算出一个判别空间。通过从子空间中学习卷积核,仅需几个参数就可以从图像中提取代表性和区分性特征。提议的网络的另一个贡献是使用池化层,这进一步提高了其性能。所提出的方法称为Fukunaga-Koontz网络(FKNet),适用于解决实际问题,尤其是在培训和处理时间受限制的情况下。使用四个公开可用的手写字符数据集来评估FKNet的优势。此外,我们通过在LFW数据集上进行实验证明了该方法的灵活性。为了增加类之间的可分离性,我们使用FKT从训练子空间中计算出一个判别空间。通过从子空间学习卷积核,仅需几个参数就可以从图像中提取代表性特征和判别特征。提议的网络的另一个贡献是使用池化层,这进一步提高了其性能。所提出的方法称为Fukunaga-Koontz网络(FKNet),适用于解决实际问题,尤其是在培训和处理时间受限制的情况下。使用四个公开可用的手写字符数据集来评估FKNet的优势。此外,我们通过在LFW数据集上进行实验证明了该方法的灵活性。为了增加类之间的可分离性,我们使用FKT从训练子空间中计算出一个判别空间。通过从子空间学习卷积核,仅需几个参数就可以从图像中提取代表性特征和判别特征。拟议网络的另一个贡献是使用池化层,这进一步提高了其性能。所提出的方法称为Fukunaga-Koontz网络(FKNet),适用于解决实际问题,尤其是在培训和处理时间受限制的情况下。使用四个公开可用的手写字符数据集来评估FKNet的优势。另外,我们通过在LFW数据集上进行实验证明了该方法的灵活性。通过从子空间学习卷积核,仅需几个参数就可以从图像中提取代表性特征和判别特征。拟议网络的另一个贡献是使用池化层,这进一步提高了其性能。所提出的方法称为Fukunaga-Koontz网络(FKNet),适用于解决实际问题,尤其是在培训和处理时间受限制的情况下。使用四个公开可用的手写字符数据集来评估FKNet的优势。另外,我们通过在LFW数据集上进行实验证明了该方法的灵活性。通过从子空间学习卷积核,仅需几个参数就可以从图像中提取代表性特征和判别特征。拟议网络的另一个贡献是使用池化层,这进一步提高了其性能。所提出的方法称为Fukunaga-Koontz网络(FKNet),适用于解决实际问题,尤其是在培训和处理时间受限制的情况下。使用四个公开可用的手写字符数据集来评估FKNet的优势。另外,我们通过在LFW数据集上进行实验证明了该方法的灵活性。拟议网络的另一个贡献是使用池化层,这进一步提高了其性能。所提出的方法称为Fukunaga-Koontz网络(FKNet),适用于解决实际问题,尤其是在培训和处理时间受限制的情况下。使用四个公开可用的手写字符数据集来评估FKNet的优势。另外,我们通过在LFW数据集上进行实验证明了该方法的灵活性。提议的网络的另一个贡献是使用池化层,这进一步提高了其性能。所提出的方法称为Fukunaga-Koontz网络(FKNet),适用于解决实际问题,尤其是在培训和处理时间受限制的情况下。使用四个公开可用的手写字符数据集来评估FKNet的优势。另外,我们通过在LFW数据集上进行实验证明了该方法的灵活性。
更新日期:2020-05-21
down
wechat
bug