当前位置: X-MOL 学术Appl. Sci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Deep Convolutional Neural Networks Object Detector for Real-Time Waste Identification
Applied Sciences ( IF 2.838 ) Pub Date : 2020-10-19 , DOI: 10.3390/app10207301
Daniel Octavian Melinte , Ana-Maria Travediu , Dan N. Dumitriu

This paper presents an extensive research carried out for enhancing the performances of convolutional neural network (CNN) object detectors applied to municipal waste identification. In order to obtain an accurate and fast CNN architecture, several types of Single Shot Detectors (SSD) and Regional Proposal Networks (RPN) have been fine-tuned on the TrashNet database. The network with the best performances is executed on one autonomous robot system, which is able to collect detected waste from the ground based on the CNN feedback. For this type of application, a precise identification of municipal waste objects is very important. In order to develop a straightforward pipeline for waste detection, the paper focuses on boosting the performance of pre-trained CNN Object Detectors, in terms of precision, generalization, and detection speed, using different loss optimization methods, database augmentation, and asynchronous threading at inference time. The pipeline consists of data augmentation at the training time followed by CNN feature extraction and box predictor modules for localization and classification at different feature map sizes. The trained model is generated for inference afterwards. The experiments revealed better performances than all other Object Detectors trained on TrashNet or other garbage datasets with a precision of 97.63% accuracy for SSD and 95.76% accuracy for Faster R-CNN, respectively. In order to find the optimal higher and lower bounds of our learning rate where the network is actually learning, we trained our model for several epochs, updating the learning rate after each epoch, starting from 1 × 10−10 and decreasing it until reaching 1 × 10−1.

中文翻译:

深度卷积神经网络目标检测器用于实时废物识别

本文提出了广泛的研究,以提高用于城市垃圾识别的卷积神经网络(CNN)对象检测器的性能。为了获得准确,快速的CNN架构,已经在TrashNet数据库中微调了几种类型的单发检测器(SSD)和区域提议网络(RPN)。性能最佳的网络是在一个自主机器人系统上执行的,该系统能够基于CNN反馈从地面收集检测到的废物。对于此类应用,精确识别市政废物非常重要。为了开发用于废物检测的简单管道,本文着重于提高准确性,泛化性和检测速度方面的预训练CNN对象检测器性能,在推断时使用不同的损失优化方法,数据库扩充和异步线程。该管道包括训练时的数据增强,CNN特征提取和框预测器模块,用于在不同特征图尺寸下进行本地化和分类。训练后的模型将生成,以便随后进行推理。实验显示,与所有其他在TrashNet或其他垃圾数据集上训练的对象检测器相比,SSD的精度为97.63%,Faster R-CNN的精度为95.76%。为了找到网络实际正在学习的学习速率的最佳上下限,我们对模型进行了几个时期的训练,每个时期之后从1×10开始更新学习速率 和异步线程在推断时间。管道包括训练时的数据增强,CNN特征提取和框预测器模块,用于在不同特征图大小下进行定位和分类。训练后的模型将生成,以便随后进行推理。实验表明,与在TrashNet或其他垃圾数据集上训练的所有其他对象检测器相比,SSD的精度为97.63%,Faster R-CNN的精度为95.76%。为了找到网络实际正在学习的最佳学习速率上下限,我们对模型进行了几个时期的训练,在每个时期之后从1×10开始更新学习率 和异步线程在推断时间。管道包括训练时的数据增强,CNN特征提取和框预测器模块,用于在不同特征图大小下进行定位和分类。训练后的模型将生成,以便随后进行推理。实验显示,与所有其他在TrashNet或其他垃圾数据集上训练的对象检测器相比,SSD的精度为97.63%,Faster R-CNN的精度为95.76%。为了找到网络实际正在学习的学习速率的最佳上下限,我们对模型进行了几个时期的训练,每个时期之后从1×10开始更新学习速率 管道包括训练时的数据增强,CNN特征提取和框预测器模块,用于在不同特征图大小下进行定位和分类。训练后的模型将生成,以便随后进行推理。实验显示,与所有其他在TrashNet或其他垃圾数据集上训练的对象检测器相比,SSD的精度为97.63%,Faster R-CNN的精度为95.76%。为了找到网络实际正在学习的学习速率的最佳上下限,我们对模型进行了几个时期的训练,每个时期之后从1×10开始更新学习速率 管道包括训练时的数据增强,CNN特征提取和框预测器模块,用于在不同特征图大小下进行定位和分类。训练后的模型将生成,以便随后进行推理。实验显示,与所有其他在TrashNet或其他垃圾数据集上训练的对象检测器相比,SSD的精度为97.63%,Faster R-CNN的精度为95.76%。为了找到网络实际正在学习的学习速率的最佳上下限,我们对模型进行了几个时期的训练,每个时期之后从1×10开始更新学习速率 实验显示,与所有其他在TrashNet或其他垃圾数据集上训练的对象检测器相比,SSD的精度为97.63%,Faster R-CNN的精度为95.76%。为了找到网络实际正在学习的学习速率的最佳上下限,我们对模型进行了几个时期的训练,每个时期之后从1×10开始更新学习速率 实验显示,与所有其他在TrashNet或其他垃圾数据集上训练的对象检测器相比,SSD的精度为97.63%,Faster R-CNN的精度为95.76%。为了找到网络实际正在学习的学习速率的最佳上下限,我们对模型进行了几个时期的训练,每个时期之后从1×10开始更新学习速率-10并减小直到达到1×10 -1
更新日期:2020-10-19
down
wechat
bug