MDFN: Multi-Scale Deep Feature Learning Network for Object Detection,Pattern Recognition

当前位置： X-MOL 学术 › Pattern Recogn. › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

MDFN: Multi-Scale Deep Feature Learning Network for Object Detection
Pattern Recognition ( IF 7.5 ) Pub Date : 2020-04-01 , DOI: 10.1016/j.patcog.2019.107149
Wenchi Ma , Yuanwei Wu , Feng Cen , Guanghui Wang

Abstract This paper proposes an innovative object detector by leveraging deep features learned in high-level layers. Compared with features produced in earlier layers, the deep features are better at expressing semantic and contextual information. The proposed deep feature learning scheme shifts the focus from concrete features with details to abstract ones with semantic information. It considers not only individual objects and local contexts but also their relationships by building a multi-scale deep feature learning network (MDFN). MDFN efficiently detects the objects by introducing information square and cubic inception modules into the high-level layers, which employs parameter-sharing to enhance the computational efficiency. MDFN provides a multi-scale object detector by integrating multi-box, multi-scale and multi-level technologies. Although MDFN employs a simple framework with a relatively small base network (VGG-16), it achieves better or competitive detection results than those with a macro hierarchical structure that is either very deep or very wide for stronger ability of feature extraction. The proposed technique is evaluated extensively on KITTI, PASCAL VOC, and COCO datasets, which achieves the best results on KITTI and leading performance on PASCAL VOC and COCO. This study reveals that deep features provide prominent semantic information and a variety of contextual contents, which contribute to its superior performance in detecting small or occluded objects. In addition, the MDFN model is computationally efficient, making a good trade-off between the accuracy and speed.

中文翻译：

MDFN：用于对象检测的多尺度深度特征学习网络

摘要本文提出了一种创新的目标检测器，它利用在高级层中学习到的深层特征。与较早层产生的特征相比，深层特征更擅长表达语义和上下文信息。所提出的深度特征学习方案将重点从具有细节的具体特征转移到具有语义信息的抽象特征。它通过构建多尺度深度特征学习网络 (MDFN) 不仅考虑单个对象和本地上下文，还考虑它们之间的关系。MDFN通过将信息平方和立方初始模块引入高层层来有效地检测对象，它采用参数共享来提高计算效率。MDFN通过集成多盒、多尺度和多层次技术提供多尺度物体检测器。尽管MDFN采用了一个具有相对较小基础网络（VGG-16）的简单框架，但它比具有非常深或非常宽的宏观层次结构的具有更强特征提取能力的那些获得了更好或有竞争力的检测结果。所提出的技术在 KITTI、PASCAL VOC 和 COCO 数据集上进行了广泛的评估，在 KITTI 上取得了最佳结果，在 PASCAL VOC 和 COCO 上取得了领先的性能。这项研究表明，深度特征提供了突出的语义信息和各种上下文内容，这有助于其在检测小物体或被遮挡物体方面的卓越性能。此外，MDFN 模型计算效率高，在精度和速度之间取得了很好的平衡。它比具有非常深或非常宽的宏观层次结构的那些具有更强的特征提取能力的检测结果更好或具有竞争力。所提出的技术在 KITTI、PASCAL VOC 和 COCO 数据集上进行了广泛的评估，在 KITTI 上取得了最佳结果，在 PASCAL VOC 和 COCO 上取得了领先的性能。这项研究表明，深度特征提供了突出的语义信息和各种上下文内容，这有助于其在检测小物体或被遮挡物体方面的卓越性能。此外，MDFN 模型计算效率高，在精度和速度之间取得了很好的平衡。它比具有非常深或非常宽的宏观层次结构的那些具有更强的特征提取能力的检测结果更好或具有竞争力。所提出的技术在 KITTI、PASCAL VOC 和 COCO 数据集上进行了广泛的评估，在 KITTI 上取得了最佳结果，在 PASCAL VOC 和 COCO 上取得了领先的性能。这项研究表明，深度特征提供了突出的语义信息和各种上下文内容，这有助于其在检测小物体或被遮挡物体方面的卓越性能。此外，MDFN 模型计算效率高，在精度和速度之间取得了很好的平衡。所提出的技术在 KITTI、PASCAL VOC 和 COCO 数据集上进行了广泛的评估，在 KITTI 上取得了最佳结果，在 PASCAL VOC 和 COCO 上取得了领先的性能。这项研究表明，深度特征提供了突出的语义信息和各种上下文内容，这有助于其在检测小物体或被遮挡物体方面的卓越性能。此外，MDFN 模型计算效率高，在精度和速度之间取得了很好的平衡。所提出的技术在 KITTI、PASCAL VOC 和 COCO 数据集上进行了广泛的评估，在 KITTI 上取得了最佳结果，在 PASCAL VOC 和 COCO 上取得了领先的性能。这项研究表明，深度特征提供了突出的语义信息和各种上下文内容，这有助于其在检测小物体或被遮挡物体方面的卓越性能。此外，MDFN 模型计算效率高，在精度和速度之间取得了很好的平衡。

更新日期：2020-04-01

点击分享查看原文

点击收藏

公开下载

阅读更多本刊最新论文本刊介绍/投稿指南11