当前位置: X-MOL 学术Inform. Sci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Global context based automatic road segmentation via dilated convolutional neural network
Information Sciences Pub Date : 2020-05-18 , DOI: 10.1016/j.ins.2020.05.062
Meng Lan , Yipeng Zhang , Lefei Zhang , Bo Du

Road segmentation from remote sensing images is a critical task in many applications. In recent years, various approaches, particularly deep learning-based methods, have been proposed for accurate road segmentation. However, most existing road segmentation methods always obtain unsatisfactory results (e.g., heterogeneous pixels) due to the complex backgrounds and view occlusions of buildings and trees around a road; consequently, road segmentation remains a challenging problem. In this study, we propose a novel global context based dilated convolutional neural network (GC-DCNN) to address the aforementioned problem. The structure of GC-DCNN is similar to that of UNet. In particular, building the encoder of GC-DCNN with three residual dilated blocks is suggested to further enlarge the effective receptive field and learn additional discriminative features. Thereafter, a pyramid pooling module is used to capture the multiscale global context features and fuse them to achieve stronger feature representation. The decoder network upsamples the fused features to the same size as the input image, combining the high-resolution features with the contracting path of the encoder network. Moreover, the dice coefficient loss is adopted as the loss function. This function differs from those in most previous studies but is more suitable for road segmentation. Extensive experimental results on two benchmark datasets compared with several baseline models demonstrate the superiority of the proposed GC-DCNN algorithm.



中文翻译:

基于全局上下文的膨胀卷积神经网络自动道路分割

在许多应用中,从遥感图像进行道路分割是一项关键任务。近年来,已经提出了各种方法,特别是基于深度学习的方法来进行精确的道路分割。然而,由于复杂的背景以及道路周围建筑物和树木的遮挡,大多数现有的道路分割方法始终无法获得令人满意的结果(例如,异类像素)。因此,道路分割仍然是一个具有挑战性的问题。在这项研究中,我们提出了一种新颖的基于全局上下文的扩张卷积神经网络(GC-DCNN),以解决上述问题。GC-DCNN的结构类似于UNet。尤其是,建议使用三个剩余的扩张块构建GC-DCNN编码器,以进一步扩大有效接收范围并了解其他判别特征。此后,金字塔池模块用于捕获多尺度全局上下文特征并将其融合以实现更强的特征表示。解码器网络将融合的特征上采样到与输入图像相同的大小,并将高分辨率特征与编码器网络的收缩路径结合在一起。此外,骰子系数损失被用作损失函数。此功能不同于大多数以前的研究,但更适合于道路分割。与两个基准模型相比,在两个基准数据集上的大量实验结果证明了所提出的GC-DCNN算法的优越性。金字塔池模块用于捕获多尺度全局上下文特征并将其融合以实现更强的特征表示。解码器网络将融合的特征上采样到与输入图像相同的大小,并将高分辨率特征与编码器网络的收缩路径结合在一起。此外,骰子系数损失被用作损失函数。此功能不同于大多数以前的研究,但更适合于道路分割。与两个基准模型相比,在两个基准数据集上的大量实验结果证明了所提出的GC-DCNN算法的优越性。金字塔池模块用于捕获多尺度全局上下文特征并将其融合以实现更强的特征表示。解码器网络将融合的特征上采样到与输入图像相同的大小,并将高分辨率特征与编码器网络的收缩路径结合在一起。此外,骰子系数损失被用作损失函数。此功能与以前的大多数研究不同,但更适合于道路分割。与两个基准模型相比,在两个基准数据集上的大量实验结果证明了所提出的GC-DCNN算法的优越性。解码器网络将融合的特征上采样到与输入图像相同的大小,并将高分辨率特征与编码器网络的收缩路径结合在一起。此外,骰子系数损失被用作损失函数。此功能与以前的大多数研究不同,但更适合于道路分割。与两个基准模型相比,在两个基准数据集上的大量实验结果证明了所提出的GC-DCNN算法的优越性。解码器网络将融合后的特征上采样到与输入图像相同的大小,并将高分辨率特征与编码器网络的收缩路径结合在一起。此外,骰子系数损失被用作损失函数。此功能与以前的大多数研究不同,但更适合于道路分割。与两个基准模型相比,在两个基准数据集上的大量实验结果证明了所提出的GC-DCNN算法的优越性。

更新日期:2020-05-18
down
wechat
bug