当前位置: X-MOL 学术Int. J. Comput. Vis. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Scale-Free Registrations in 3D: 7 Degrees of Freedom with Fourier Mellin SOFT Transforms
International Journal of Computer Vision ( IF 19.5 ) Pub Date : 2018-02-23 , DOI: 10.1007/s11263-018-1067-5
Heiko Bülow , Andreas Birk

Fourier Mellin SOFT (FMS) as a novel method for global registration of 3D data is presented. It determines the seven degrees of freedom (7-DoF) transformation, i.e., the 6-DoF rigid motion parameters plus 1-DoF scale, between two scans, i.e., two noisy, only partially overlapping views on objects or scenes. It is based on a sequence of the 3D Fourier transform, the Mellin transform and the SO(3) Fourier transform. This combination represents a non-trivial complete 3D extension of the well known Fourier-Mellin registration for 2D images. It is accordingly based on decoupling rotation and scale from translation. First, rotation—which is the main challenge for the extension to 3D data - is tackled with a SO(3) Fourier Transform (SOFT) based on Spherical Harmonics. In a second step, scale is determined via a 3D Mellin transform. Finally, translation is calculated by Phase-Matching. Experiments are presented with simulated data sets for ground truth comparisons and with real world data including object recognition and localization in Magnetic Resonance Tomography (MRT) data, registration of 2.5D RGBD scans from a Microsoft Kinect with a scale-free 3D model generated by Multi-View Vision, and 3D mapping by registration of a sequence of consecutive scans from a low-cost actuated Laser Range Finder. The results show that the method is fast and that it can robustly handle partial overlap, interfering structures, and noise. It is also shown that the method is a very interesting option for 6-DoF registration, i.e., when scale is known.

中文翻译:

3D 中的无标度配准:具有傅立叶梅林 SOFT 变换的 7 个自由度

介绍了傅​​立叶梅林软件 (FMS) 作为 3D 数据全局配准的新方法。它确定两个扫描之间的七个自由度 (7-DoF) 变换,即 6-DoF 刚性运动参数加上 1-DoF 比例,即两个有噪声的、仅部分重叠的对象或场景视图。它基于 3D 傅里叶变换、梅林变换和 SO(3) 傅里叶变换的序列。这种组合代表了众所周知的用于 2D 图像的傅立叶-梅林配准的非平凡的完整 3D 扩展。因此,它基于将旋转和缩放与平移解耦。首先,旋转——这是扩展到 3D 数据的主要挑战——通过基于球谐函数的 SO(3) 傅立叶变换 (SOFT) 来解决。第二步,通过 3D Mellin 变换确定比例。最后,平移是通过相位匹配计算的。实验使用模拟数据集进行地面实况比较和真实世界数据,包括磁共振断层扫描 (MRT) 数据中的对象识别和定位、Microsoft Kinect 的 2.5D RGBD 扫描与 Multi 生成的无标度 3D 模型的配准- 通过对来自低成本驱动的激光测距仪的一系列连续扫描进行配准来查看视觉和 3D 映射。结果表明,该方法速度快,并且可以稳健地处理部分重叠、干扰结构和噪声。还表明,该方法是 6-DoF 配准的一个非常有趣的选择,即当尺度已知时。实验使用模拟数据集进行地面实况比较和真实世界数据,包括磁共振断层扫描 (MRT) 数据中的对象识别和定位、Microsoft Kinect 的 2.5D RGBD 扫描与 Multi 生成的无标度 3D 模型的配准- 通过对来自低成本驱动的激光测距仪的一系列连续扫描进行配准来查看视觉和 3D 映射。结果表明,该方法速度快,并且可以稳健地处理部分重叠、干扰结构和噪声。还表明,该方法是 6-DoF 配准的一个非常有趣的选择,即当尺度已知时。实验使用模拟数据集进行地面实况比较和真实世界数据,包括磁共振断层扫描 (MRT) 数据中的对象识别和定位、Microsoft Kinect 的 2.5D RGBD 扫描与 Multi 生成的无标度 3D 模型的配准- 通过对来自低成本驱动的激光测距仪的一系列连续扫描进行配准来查看视觉和 3D 映射。结果表明,该方法速度快,并且可以稳健地处理部分重叠、干扰结构和噪声。还表明,该方法是 6-DoF 配准的一个非常有趣的选择,即当尺度已知时。和 3D 映射,通过注册来自低成本驱动的激光测距仪的一系列连续扫描。结果表明,该方法速度快,并且可以稳健地处理部分重叠、干扰结构和噪声。还表明,该方法是 6-DoF 配准的一个非常有趣的选择,即当尺度已知时。和 3D 映射,通过注册来自低成本驱动的激光测距仪的一系列连续扫描。结果表明,该方法速度快,并且可以稳健地处理部分重叠、干扰结构和噪声。还表明,该方法是 6-DoF 配准的一个非常有趣的选择,即当尺度已知时。
更新日期:2018-02-23
down
wechat
bug