当前位置: X-MOL 学术ISPRS Int. J. Geo-Inf. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Object Semantic Segmentation in Point Clouds—Comparison of a Deep Learning and a Knowledge-Based Method
ISPRS International Journal of Geo-Information ( IF 2.8 ) Pub Date : 2021-04-10 , DOI: 10.3390/ijgi10040256
Jean-Jacques Ponciano , Moritz Roetner , Alexander Reiterer , Frank Boochs

Through the power of new sensing technologies, we are increasingly digitizing the real world. However, instruments produce unstructured data, mainly in the form of point clouds for 3D data and images for 2D data. Nevertheless, many applications (such as navigation, survey, infrastructure analysis) need structured data containing objects and their geometry. Various computer vision approaches have thus been developed to structure the data and identify objects therein. They can be separated into model-driven, data-driven, and knowledge-based approaches. Model-driven approaches mainly use the information on the objects contained in the data and are thus limited to objects and context. Among data-driven approaches, we increasingly find deep learning strategies because of their autonomy in detecting objects. They identify reliable patterns in the data and connect these to the object of interest. Deep learning approaches have to learn these patterns in a training stage. Knowledge-based approaches use characteristic knowledge from different domains allowing the detection and classification of objects. The knowledge must be formalized and substitutes the training for deep learning. Semantic web technologies allow the management of such human knowledge. Deep learning and knowledge-based approaches have already shown good results for semantic segmentation in various examples. The common goal but the different strategies of the two approaches engaged our interest in doing a comparison to get an idea of their strengths and weaknesses. To fill this knowledge gap, we applied two implementations of such approaches to a mobile mapping point cloud. The detected object categories are car, bush, tree, ground, streetlight and building. The deep learning approach uses a convolutional neural network, whereas the knowledge-based approach uses standard semantic web technologies such as SPARQL and OWL2to guide the data processing and the subsequent classification as well. The LiDAR point cloud used was acquired by a mobile mapping system in an urban environment and presents various complex scenes, allowing us to show the advantages and disadvantages of these two types of approaches. The deep learning and knowledge-based approaches produce a semantic segmentation with an average F1 score of 0.66 and 0.78, respectively. Further details are given by analyzing individual object categories allowing us to characterize specific properties of both types of approaches.

中文翻译:

点云中的对象语义分割—深度学习和基于知识的方法的比较

通过新的传感技术的力量,我们正在使现实世界数字化。但是,仪器会生成非结构化数据,主要是针对3D数据的点云和针对2D数据的图像。尽管如此,许多应用程序(例如导航,勘测,基础结构分析)仍需要包含对象及其几何形状的结构化数据。因此,已经开发出各种计算机视觉方法来构造数据并识别其中的对象。它们可以分为模型驱动,数据驱动和基于知识的方法。模型驱动的方法主要使用有关数据中包含的对象的信息,因此仅限于对象和上下文。在数据驱动的方法中,由于深度学习策略具有自主检测对象的能力,因此我们越来越多地发现它们。它们确定数据中的可靠模式,并将这些模式连接到感兴趣的对象。深度学习方法必须在训练阶段学习这些模式。基于知识的方法使用来自不同领域的特征知识,从而可以检测和分类对象。知识必须形式化,并代替深度学习的培训。语义网络技术可以管理此类人类知识。深度学习和基于知识的方法已经在各种示例中显示出了用于语义分割的良好结果。我们的共同目标是两种方法的不同策略,这使我们有兴趣进行比较,以了解它们的优缺点。为了填补这一知识空白,我们将这种方法的两种实现方式应用于移动映射点云。检测到的对象类别为汽车,灌木丛,树木,地面,路灯和建筑物。深度学习方法使用卷积神经网络,而基于知识的方法使用标准语义Web技术(例如SPARQL和OWL2)来指导数据处理和后续分类。所使用的LiDAR点云是通过城市环境中的移动制图系统获取的,并呈现出各种复杂的场景,从而使我们能够展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析单个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。地面,路灯和建筑物。深度学习方法使用卷积神经网络,而基于知识的方法使用标准语义Web技术(例如SPARQL和OWL2)来指导数据处理和后续分类。所使用的LiDAR点云是通过城市环境中的移动制图系统获取的,并呈现出各种复杂的场景,从而使我们能够展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析单个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。地面,路灯和建筑物。深度学习方法使用卷积神经网络,而基于知识的方法使用标准语义Web技术(例如SPARQL和OWL2)来指导数据处理和后续分类。所使用的LiDAR点云是通过城市环境中的移动制图系统获取的,并呈现出各种复杂的场景,从而使我们能够展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析单个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。深度学习方法使用卷积神经网络,而基于知识的方法使用标准语义Web技术(例如SPARQL和OWL2)来指导数据处理和后续分类。所使用的LiDAR点云是通过城市环境中的移动制图系统获取的,并呈现出各种复杂的场景,从而使我们能够展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析各个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。深度学习方法使用卷积神经网络,而基于知识的方法使用标准语义Web技术(例如SPARQL和OWL2)来指导数据处理和后续分类。所使用的LiDAR点云是通过城市环境中的移动制图系统获取的,并呈现出各种复杂的场景,从而使我们能够展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析单个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。基于知识的方法则使用标准语义Web技术(例如SPARQL和OWL2)来指导数据处理和后续分类。所使用的LiDAR点云是通过城市环境中的移动制图系统获取的,并呈现出各种复杂的场景,从而使我们能够展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析单个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。基于知识的方法则使用标准语义Web技术(例如SPARQL和OWL2)来指导数据处理和后续分类。所使用的LiDAR点云是通过城市环境中的移动制图系统获取的,并呈现出各种复杂的场景,从而使我们能够展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析单个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。让我们展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析单个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。让我们展示这两种方法的优缺点。深度学习和基于知识的方法产生的语义分割的平均F1分数分别为0.66和0.78。通过分析单个对象类别,可以提供更多详细信息,从而使我们能够表征两种方法的特定属性。
更新日期:2021-04-11
down
wechat
bug