当前位置: X-MOL 学术IEEE Trans. Pattern Anal. Mach. Intell. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
AGO-Net: Association-Guided 3D Point Cloud Object Detection Network.
IEEE Transactions on Pattern Analysis and Machine Intelligence ( IF 23.6 ) Pub Date : 2022-10-04 , DOI: 10.1109/tpami.2021.3104172
Liang Du , Xiaoqing Ye , Xiao Tan , Edward Johns , Bo Chen , Errui Ding , Xiangyang Xue , Jianfeng Feng

The human brain can effortlessly recognize and localize objects, whereas current 3D object detection methods based on LiDAR point clouds still report inferior performance for detecting occluded and distant objects: The point cloud appearance varies greatly due to occlusion, and has inherent variance in point densities along the distance to sensors. Therefore, designing feature representations robust to such point clouds is critical. Inspired by human associative recognition, we propose a novel 3D detection framework that associates intact features for objects via domain adaptation. We bridge the gap between the perceptual domain, where features are derived from real scenes with sub-optimal representations, and the conceptual domain, where features are extracted from augmented scenes that consist of non-occlusion objects with rich detailed information. A feasible method is investigated to construct conceptual scenes without external datasets. We further introduce an attention-based re-weighting module that adaptively strengthens the feature adaptation of more informative regions. The network's feature enhancement ability is exploited without introducing extra cost during inference, which is plug-and-play in various 3D detection frameworks. We achieve new state-of-the-art performance on the KITTI 3D detection benchmark in both accuracy and speed. Experiments on nuScenes and Waymo datasets also validate the versatility of our method.

中文翻译:

AGO-Net:关联引导的 3D 点云对象检测网络。

人脑可以毫不费力地识别和定位物体,而当前基于 LiDAR 点云的 3D 物体检测方法在检测被遮挡和远处物体方面仍然表现不佳:点云外观因遮挡而变化很大,并且点密度沿着到传感器的距离。因此,设计对此类点云具有鲁棒性的特征表示至关重要。受人类联想识别的启发,我们提出了一种新颖的 3D 检测框架,该框架通过域适应关联对象的完整特征。我们弥合了感知域和概念域之间的鸿沟,感知域的特征来自具有次优表示的真实场景,其中特征是从由具有丰富详细信息的非遮挡对象组成的增强场景中提取的。研究了一种在没有外部数据集的情况下构建概念场景的可行方法。我们进一步引入了一个基于注意力的重新加权模块,该模块自适应地加强更多信息区域的特征适应。利用网络的特征增强能力,在推理过程中不会引入额外的成本,这在各种 3D 检测框架中都是即插即用的。我们在 KITTI 3D 检测基准测试中的准确性和速度方面都达到了最新的水平。在 nuScenes 和 Waymo 数据集上的实验也验证了我们方法的通用性。我们进一步引入了一个基于注意力的重新加权模块,该模块自适应地加强更多信息区域的特征适应。利用网络的特征增强能力,在推理过程中不会引入额外的成本,这在各种 3D 检测框架中都是即插即用的。我们在 KITTI 3D 检测基准测试中的准确性和速度方面都达到了最新的水平。在 nuScenes 和 Waymo 数据集上的实验也验证了我们方法的通用性。我们进一步引入了一个基于注意力的重新加权模块,该模块自适应地加强更多信息区域的特征适应。利用网络的特征增强能力,在推理过程中不会引入额外的成本,这在各种 3D 检测框架中都是即插即用的。我们在 KITTI 3D 检测基准测试中的准确性和速度方面都达到了最新的水平。在 nuScenes 和 Waymo 数据集上的实验也验证了我们方法的通用性。我们在 KITTI 3D 检测基准测试中的准确性和速度方面都达到了最新的水平。在 nuScenes 和 Waymo 数据集上的实验也验证了我们方法的通用性。我们在 KITTI 3D 检测基准测试中的准确性和速度方面都达到了最新的水平。在 nuScenes 和 Waymo 数据集上的实验也验证了我们方法的通用性。
更新日期:2021-08-11
down
wechat
bug