3D Cascade RCNN: High Quality Object Detection in Point Clouds,IEEE Transactions on Image Processing

当前位置： X-MOL 学术 › IEEE Trans. Image Process. › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

3D Cascade RCNN: High Quality Object Detection in Point Clouds
IEEE Transactions on Image Processing ( IF 10.8 ) Pub Date : 2022-08-30 , DOI: 10.1109/tip.2022.3201469
Qi Cai ₁ , Yingwei Pan ₂ , Ting Yao ₂ , Tao Mei ₂

Affiliation

Recent progress on 2D object detection has featured Cascade RCNN, which capitalizes on a sequence of cascade detectors to progressively improve proposal quality, towards high-quality object detection. However, there has not been evidence in support of building such cascade structures for 3D object detection, a challenging detection scenario with highly sparse LiDAR point clouds. In this work, we present a simple yet effective cascade architecture, named 3D Cascade RCNN, that allocates multiple detectors based on the voxelized point clouds in a cascade paradigm, pursuing higher quality 3D object detector progressively. Furthermore, we quantitatively define the sparsity level of the points within 3D bounding box of each object as the point completeness score, which is exploited as the task weight for each proposal to guide the learning of each stage detector. The spirit behind is to assign higher weights for high-quality proposals with relatively complete point distribution, while down-weight the proposals with extremely sparse points that often incur noise during training. This design of completeness-aware re-weighting elegantly upgrades the cascade paradigm to be better applicable for the sparse input data, without increasing any FLOP budgets. Through extensive experiments on both the KITTI dataset and Waymo Open Dataset, we validate the superiority of our proposed 3D Cascade RCNN, when comparing to state-of-the-art 3D object detection techniques. The source code is publicly available at https://github.com/caiqi/Cascasde-3D .

中文翻译：

3D Cascade RCNN：点云中的高质量目标检测

2D 对象检测的最新进展以 Cascade RCNN 为特色，它利用一系列级联检测器来逐步提高提案质量，以实现高质量的对象检测。然而，没有证据支持为 3D 对象检测构建这种级联结构，这是一个具有高度稀疏 LiDAR 点云的具有挑战性的检测场景。在这项工作中，我们提出了一种简单而有效的级联架构，称为 3D Cascade RCNN，它基于级联范式中的体素化点云分配多个检测器，逐步追求更高质量的 3D 对象检测器。此外，我们将每个对象的 3D 边界框内的点的稀疏程度定量定义为点完整性分数，它被用作每个提议的任务权重，以指导每个阶段检测器的学习。其背后的精神是为具有相对完整点分布的高质量提案分配更高的权重，而对具有极稀疏点且在训练期间经常会产生噪声的提案分配较低的权重。这种完整性感知重新加权设计优雅地升级了级联范例，以更好地适用于稀疏输入数据，而不会增加任何 FLOP 预算。通过对 KITTI 数据集和 Waymo 开放数据集的广泛实验，我们验证了我们提出的 3D Cascade RCNN 与最先进的 3D 对象检测技术相比的优越性。源代码可在以下位置公开获得其背后的精神是为具有相对完整点分布的高质量提案分配更高的权重，而对具有极稀疏点且在训练期间经常会产生噪声的提案分配较低的权重。这种完整性感知重新加权设计优雅地升级了级联范例，以更好地适用于稀疏输入数据，而不会增加任何 FLOP 预算。通过对 KITTI 数据集和 Waymo 开放数据集的广泛实验，我们验证了我们提出的 3D Cascade RCNN 与最先进的 3D 对象检测技术相比的优越性。源代码可在以下位置公开获得其背后的精神是为具有相对完整点分布的高质量提案分配更高的权重，而对具有极稀疏点且在训练期间经常会产生噪声的提案分配较低的权重。这种完整性感知重新加权设计优雅地升级了级联范例，以更好地适用于稀疏输入数据，而不会增加任何 FLOP 预算。通过对 KITTI 数据集和 Waymo 开放数据集的广泛实验，我们验证了我们提出的 3D Cascade RCNN 与最先进的 3D 对象检测技术相比的优越性。源代码可在以下位置公开获得这种完整性感知重新加权设计优雅地升级了级联范例，以更好地适用于稀疏输入数据，而不会增加任何 FLOP 预算。通过对 KITTI 数据集和 Waymo 开放数据集的广泛实验，我们验证了我们提出的 3D Cascade RCNN 与最先进的 3D 对象检测技术相比的优越性。源代码可在以下位置公开获得这种完整性感知重新加权设计优雅地升级了级联范例，以更好地适用于稀疏输入数据，而不会增加任何 FLOP 预算。通过对 KITTI 数据集和 Waymo 开放数据集的广泛实验，我们验证了我们提出的 3D Cascade RCNN 与最先进的 3D 对象检测技术相比的优越性。源代码可在以下位置公开获得https://github.com/caiqi/Cascasde-3D .

更新日期：2022-09-03

点击分享查看原文

点击收藏

阅读更多本刊最新论文本刊介绍/投稿指南11