当前位置: X-MOL 学术Autom. Constr. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Removal of occluding construction workers in job site image data using U-Net based context encoders
Automation in Construction ( IF 9.6 ) Pub Date : 2020-11-01 , DOI: 10.1016/j.autcon.2020.103332
Ohay Angah , Albert Y. Chen

Abstract In the field of Architecture, Engineering, Construction, and Facility Management (AEC/FM), job site surveying is critical for tasks such as construction progress monitoring and quality assurance and quality control. Moving obstacles often occlude the sight of view, and sometimes block the view of interest. However, images are often collected for documentation and analysis of the building under construction or operation. The occluding objects, such as the construction workers, compromise the collected image data. On the other hand, the capability of the Context Encoders model took the pioneering step providing the opportunity of image inpainting. This research applies Context Encoders to remove redundant objects in images and inpaints the background context. The original Context Encoders model, a deep learning model, requires a large training dataset for a decent image inpainting. In the model, the region in need of context inpainting is constrained to be a predefined area, fixed in size and position in the image. In this work, we adapted a deep learning architecture, U-Net, for a direct image-to-image translation for context inpainting, and thus relaxing the fixed size and position constraints in the original Context Encoders model. Simultaneously in a single framework, the proposed model not only erases redundant objects but also inpaints the missing content in the pixel scale, based on surrounding semantic clues. Employing the U-Net yields encouraging results for cases in operating buildings and those under construction.

中文翻译:

使用基于 U-Net 的上下文编码器去除施工现场图像数据中的建筑工人遮挡

摘要 在建筑、工程、施工和设施管理 (AEC/FM) 领域,工地勘测对于施工进度监控以及质量保证和质量控制等任务至关重要。移动的障碍物往往会遮挡视线,有时也会挡住感兴趣的视线。但是,通常会收集图像以对在建或运营中的建筑物进行记录和分析。建筑工人等遮挡对象会破坏收集的图像数据。另一方面,上下文编码器模型的能力迈出了开创性的一步,提供了图像修复的机会。本研究应用上下文编码器去除图像中的冗余对象并修复背景上下文。原始的 Context Encoders 模型,一种深度学习模型,需要一个大型训练数据集来进行体面的图像修复。在模型中,需要上下文修复的区域被限制为一个预定义的区域,在图像中的大小和位置是固定的。在这项工作中,我们采用了深度学习架构 U-Net,用于上下文修复的直接图像到图像转换,从而放松原始上下文编码器模型中的固定大小和位置约束。同时在单个框架中,所提出的模型不仅可以擦除冗余对象,还可以根据周围的语义线索修复像素尺度中缺失的内容。使用 U-Net 可以为运营中的建筑和在建建筑中的案例带来令人鼓舞的结果。固定在图像中的大小和位置。在这项工作中,我们采用了深度学习架构 U-Net,用于上下文修复的直接图像到图像转换,从而放松原始上下文编码器模型中的固定大小和位置约束。同时在单个框架中,所提出的模型不仅可以擦除冗余对象,还可以根据周围的语义线索修复像素尺度中缺失的内容。使用 U-Net 可以为运营中的建筑和在建建筑中的案例带来令人鼓舞的结果。固定在图像中的大小和位置。在这项工作中,我们采用了深度学习架构 U-Net,用于上下文修复的直接图像到图像转换,从而放松原始上下文编码器模型中的固定大小和位置约束。同时在单个框架中,所提出的模型不仅可以擦除冗余对象,还可以根据周围的语义线索修复像素尺度中缺失的内容。使用 U-Net 可以为运营中的建筑和在建建筑中的案例带来令人鼓舞的结果。同时在单个框架中,所提出的模型不仅可以擦除冗余对象,还可以根据周围的语义线索修复像素尺度中缺失的内容。使用 U-Net 可以为运营中的建筑和在建建筑中的案例带来令人鼓舞的结果。同时在单个框架中,所提出的模型不仅可以擦除冗余对象,还可以根据周围的语义线索修复像素尺度中缺失的内容。使用 U-Net 可以为运营中的建筑和在建建筑中的案例带来令人鼓舞的结果。
更新日期:2020-11-01
down
wechat
bug