当前位置: X-MOL 学术Comput. Aided Civ. Infrastruct. Eng. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A sigmoid-optimized encoder–decoder network for crack segmentation with copy-edit-paste transfer learning
Computer-Aided Civil and Infrastructure Engineering ( IF 8.5 ) Pub Date : 2022-04-12 , DOI: 10.1111/mice.12844
Firdes Çelik 1 , Markus König 1
Affiliation  

The automatic recognition of cracks is an essential requirement for the cost-efficient maintenance of concrete structures, such as bridges, buildings, and roads. It should allow the localization and the determination of the crack type and the evaluation of the crack severity by providing information on the shape, orientation, and crack area and width. The first step in this direction is the automatized segmentation of cracks. This paper provides a concrete crack data set (370 images) and proposes two solutions that achieve the best results on two different crack data sets. Our first solution concerns the segmentation architecture. We provide an encoder–decoder-based network with a particular interconnection of layers between the encoder and decoder parts that outperforms several other methods. In addition, this network is enhanced by squeeze-and-excitation blocks equipped with a modified sigmoid activation function. We introduce a stretch coefficient into the sigmoid function and declare it a trainable parameter, allowing more differentiated calibration of the feature map during network training. Our second solution concerns kernel initialization by transfer learning (TL). We propose the Copy-Edit-Paste Transfer Learning (CEP TL). By copying, geometric editing, and pasting crack masks onto new concrete background images, we generate thousands of semisynthetic images used to pretrain the network. This CEP TL method increases model performance with significant differences. For data set A (ours), we achieve F1-scores 76.06 ± 0.06% without CEP TL and 92.32 ± 0.82% with CEP TL. For data set B (DeepCrack data set), we achieve F1-scores 88.56 ± 0.01% without CEP TL and 90.59 ± 0.80% with CEP TL.

中文翻译:

一种 sigmoid 优化的编码器-解码器网络,用于复制-编辑-粘贴迁移学习的裂纹分割

裂缝的自动识别是混凝土结构(如桥梁、建筑物和道路)的经济高效维护的基本要求。它应该允许通过提供有关形状、方向、裂纹面积和宽度的信息来定位和确定裂纹类型以及评估裂纹严重程度。朝着这个方向迈出的第一步是裂缝的自动分割。本文提供了一个具体的裂纹数据集(370 张图像),并提出了两种解决方案,可以在两个不同的裂纹数据集上取得最佳结果。我们的第一个解决方案涉及分割架构。我们提供了一个基于编码器-解码器的网络,在编码器和解码器部分之间具有特定的层互连,其性能优于其他几种方法。此外,该网络通过配备修改后的 sigmoid 激活函数的挤压和激发块得到增强。我们在 sigmoid 函数中引入了一个拉伸系数,并将其声明为可训练参数,从而在网络训练期间允许对特征图进行更多差异化校准。我们的第二个解决方案涉及通过迁移学习 (TL) 进行内核初始化。我们提出了复制-编辑-粘贴迁移学习(CEP TL)。通过复制、几何编辑和将裂纹掩码粘贴到新的具体背景图像上,我们生成了数千张用于预训练网络的半合成图像。这种 CEP TL 方法以显着差异提高了模型性能。对于数据集 A(我们的),我们实现了 F 我们在 sigmoid 函数中引入了一个拉伸系数,并将其声明为可训练参数,从而在网络训练期间允许对特征图进行更多差异化校准。我们的第二个解决方案涉及通过迁移学习 (TL) 进行内核初始化。我们提出了复制-编辑-粘贴迁移学习(CEP TL)。通过复制、几何编辑和将裂纹掩码粘贴到新的具体背景图像上,我们生成了数千张用于预训练网络的半合成图像。这种 CEP TL 方法以显着差异提高了模型性能。对于数据集 A(我们的),我们实现了 F 我们在 sigmoid 函数中引入了一个拉伸系数,并将其声明为可训练参数,从而在网络训练期间允许对特征图进行更多差异化校准。我们的第二个解决方案涉及通过迁移学习 (TL) 进行内核初始化。我们提出了复制-编辑-粘贴迁移学习(CEP TL)。通过复制、几何编辑和将裂纹掩码粘贴到新的具体背景图像上,我们生成了数千张用于预训练网络的半合成图像。这种 CEP TL 方法以显着差异提高了模型性能。对于数据集 A(我们的),我们实现了 F 几何编辑,并将裂纹掩码粘贴到新的具体背景图像上,我们生成了数千张用于预训练网络的半合成图像。这种 CEP TL 方法以显着差异提高了模型性能。对于数据集 A(我们的),我们实现了 F 几何编辑,并将裂纹掩码粘贴到新的具体背景图像上,我们生成了数千张用于预训练网络的半合成图像。这种 CEP TL 方法以显着差异提高了模型性能。对于数据集 A(我们的),我们实现了 F1 - 没有 CEP TL 的得分为 76.06 ± 0.06%,有 CEP TL 的得分为 92.32 ± 0.82%。对于数据集 B(DeepCrack 数据集),我们在没有 CEP TL 的情况下达到 F 1分数 88.56 ± 0.01%,在使用 CEP TL 的情况下达到 90.59 ± 0.80%。
更新日期:2022-04-12
down
wechat
bug