当前位置: X-MOL 学术Earth Syst. Sci. Data › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
AI4Boundaries: an open AI-ready dataset to map field boundaries with Sentinel-2 and aerial photography
Earth System Science Data ( IF 11.4 ) Pub Date : 2022-09-13 , DOI: 10.5194/essd-2022-298
Raphaël d'Andrimont , Martin Claverie , Pieter Kempeneers , Davide Muraro , Momchil Yordanov , Devis Peressutti , Matej Batič , François Waldner

Abstract. Field boundaries are at the core of many agricultural applications and are a key enabler for operational monitoring of agricultural production to support food security. Recent scientific progress in deep learning methods has highlighted the capacity to extract field boundaries from satellite and aerial images with a clear improvement from object-based image analysis (e.g., multiresolution segmentation) or conventional filters (e.g., Sobel filters). However, these methods need labels to be trained on. So far, no standard data set exists to easily and robustly benchmark models and progress the state of the art. The absence of such benchmark data further impedes proper comparison against existing methods. Besides, there is no consensus on which evaluation metrics should be reported (both at the pixel and field levels). As a result, it is currently impossible to compare and benchmark new and existing methods. To fill these gaps, we introduce AI4Boundaries, a data set of images and labels readily usable to train and compare models on the task of field boundary detection. AI4Boundaries includes two specific data sets: (i) a 10-m Sentinel-2 monthly composites for large-scale analyses in retrospect, (ii) a 1-m orthophoto data set for regional-scale analyses such as the automatic extraction of Geospatial Aid Application (GSAA). All labels have been sourced from GSAA data that have been made openly available (Austria, Catalonia, France, Luxembourg, the Netherlands, Slovenia, and Sweden) for 2019 representing 14.8 M parcels covering 376 km2. Data were selected following a stratified random sampling drawn based on two landscape fragmentation metrics, the perimeter/area ratio and the area covered by parcels, thus taking into account the diversity of the agricultural landscapes. The resulting “AI4Boundaries” dataset consists of 7,831 samples of 256 by 256 pixels for the 10-m Sentinel-2 dataset and of 512 by 512 pixels for the 1-m aerial orthophoto. Both datasets are provided with the corresponding vector ground-truth parcel delineation (2.5 M parcels covering 47,105 km2) and with a raster version already pre-processed and ready to use. Besides providing this open dataset to foster computer vision developments of parcel delineation methods, we discuss perspectives and limitations of the dataset for various types of applications in the agriculture domain and consider possible further improvements.

中文翻译:

AI4Boundaries:一个开放的 AI 就绪数据集,用于使用 Sentinel-2 和航空摄影绘制田地边界

摘要。田间边界是许多农业应用的核心,是农业生产运营监测以支持粮食安全的关键因素。深度学习方法的最新科学进展突出了从卫星和航空图像中提取场边界的能力,与基于对象的图像分析(例如,多分辨率分割)或传统过滤器(例如,Sobel 过滤器)相比有了明显的改进。但是,这些方法需要训练标签。到目前为止,还没有标准的数据集可以轻松、稳健地对模型进行基准测试并推进最先进的技术。缺乏此类基准数据进一步阻碍了与现有方法的适当比较。此外,对于应该报告哪些评估指标(在像素和字段级别)没有达成共识。因此,目前无法对新方法和现有方法进行比较和基准测试。为了填补这些空白,我们引入了 AI4Boundaries,这是一个图像和标签数据集,可随时用于训练和比较关于现场边界检测任务的模型。AI4Boundaries 包括两个特定的数据集:(i) 一个 10 米 Sentinel-2 月复合材料,用于回顾性的大规模分析,(ii) 一个 1 米的正射影像数据集,用于区域规模分析,例如地理空间援助的自动提取应用程序 (GSAA)。所有标签均来自已公开提供的 GSAA 数据(奥地利、加泰罗尼亚、法国、卢森堡、荷兰、斯洛文尼亚和瑞典),2019 年代表 1480 万个包裹,覆盖 376 公里 一组图像和标签的数据集,可用于训练和比较关于现场边界检测任务的模型。AI4Boundaries 包括两个特定的数据集:(i) 一个 10 米 Sentinel-2 月复合材料,用于回顾性的大规模分析,(ii) 一个 1 米的正射影像数据集,用于区域规模分析,例如地理空间援助的自动提取应用程序 (GSAA)。所有标签均来自已公开提供的 GSAA 数据(奥地利、加泰罗尼亚、法国、卢森堡、荷兰、斯洛文尼亚和瑞典),2019 年代表 1480 万个包裹,覆盖 376 公里 一组图像和标签的数据集,可用于训练和比较关于现场边界检测任务的模型。AI4Boundaries 包括两个特定的数据集:(i) 一个 10 米 Sentinel-2 月复合材料,用于回顾性的大规模分析,(ii) 一个 1 米的正射影像数据集,用于区域规模分析,例如地理空间援助的自动提取应用程序 (GSAA)。所有标签均来自已公开提供的 GSAA 数据(奥地利、加泰罗尼亚、法国、卢森堡、荷兰、斯洛文尼亚和瑞典),2019 年代表 1480 万个包裹,覆盖 376 公里 (ii) 用于区域尺度分析的 1 米正射影像数据集,例如地理空间辅助应用 (GSAA) 的自动提取。所有标签均来自已公开提供的 GSAA 数据(奥地利、加泰罗尼亚、法国、卢森堡、荷兰、斯洛文尼亚和瑞典),2019 年代表 1480 万个包裹,覆盖 376 公里 (ii) 用于区域尺度分析的 1 米正射影像数据集,例如地理空间辅助应用 (GSAA) 的自动提取。所有标签均来自已公开提供的 GSAA 数据(奥地利、加泰罗尼亚、法国、卢森堡、荷兰、斯洛文尼亚和瑞典),2019 年代表 1480 万个包裹,覆盖 376 公里2 . 数据是在基于两个景观碎片化指标、周长/面积比和地块覆盖面积的分层随机抽样后选择的,因此考虑了农业景观的多样性。生成的“AI4Boundaries”数据集由 7,831 个样本组成,10 米 Sentinel-2 数据集的 256 x 256 像素和 1 米航空正射影像的 512 x 512 像素。两个数据集都提供了相应的矢量地面真实地块描绘(250 万块地块,覆盖 47,105 km 2) 以及已经预处理并准备好使用的光栅版本。除了提供这个开放的数据集来促进地块描绘方法的计算机视觉发展之外,我们还讨论了数据集在农业领域各种类型应用中的观点和局限性,并考虑了可能的进一步改进。
更新日期:2022-09-13
down
wechat
bug