当前位置: X-MOL 学术Geoderma Reg. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Digital mapping of soil classes using spatial extrapolation with imbalanced data
Geoderma Regional ( IF 4.1 ) Pub Date : 2021-07-30 , DOI: 10.1016/j.geodrs.2021.e00422
Mehrnaz Neyestani 1 , Fereydoon Sarmadian 1 , Azam Jafari 2 , Ali Keshavarzi 1 , Amin Sharififar 1
Affiliation  

Digital mapping of soil classes using the extrapolation approach is timesaving, economically cheap, and helps collecting soil data from areas with difficult sampling. However, it has not been explored widely enough for digital mapping of soil classes. This study seeks to evaluate and compare several machine learning and regression algorithms for the extrapolation of soil sub-groups. Also the issue of imbalanced number of observations was addressed and oversampling technique was applied on the minority soil class to improve the models performance. The study area is located in central north Iran with 84 and 72 soil profiles sampled in the donor and recipient areas, respectively. A set of various environmental covariates including remotely sensed data, digital elevation model derivatives and geomorphology map were used as explanatory variables for predicting soil classes. Results showed that among eleven investigated models, C5.0 decision tree (DT), random forest (RF) and multinomial logistic regression (MNL) had the highest overall accuracy of 46%, 42% and 38%, respectively, for the extrapolation of soil classes. Also the Kappa statistic values for these models were 0.30, 0.24 and 0.22, respectively. Oversampling of the minority soil class led to an increase in overall accuracy for some of the models with the highest ones being DT = 53% and RF = 50%. Also, the Kappa value for DT and RF models increased to 0.39 and 0.35, respectively. In addition, oversampling of the minority soil class led to the prevention of losing this class in the final map.



中文翻译:

使用不平衡数据的空间外推法对土壤类别进行数字制图

使用外推法对土壤类别进行数字制图既省时又经济,并且有助于从采样困难的地区收集土壤数据。然而,对于土壤类别的数字制图,它还没有得到足够广泛的探索。本研究旨在评估和比较几种用于推断土壤亚组的机器学习和回归算法。还解决了观测数量不平衡的问题,并对少数土壤类别应用了过采样技术以提高模型性能。研究区位于伊朗北部中部,分别在捐助区和受援区采样了 84 个和 72 个土壤剖面。一组各种环境协变量,包括遥感数据,数字高程模型导数和地貌图被用作预测土壤类别的解释变量。结果表明,在 11 个调查模型中,C5.0 决策树 (DT)、随机森林 (RF) 和多项逻辑回归 (MNL) 的总体准确度最高,分别为 46%、42% 和 38%,用于外推土壤类。此外,这些模型的 Kappa 统计值分别为 0.30、0.24 和 0.22。少数土壤类别的过采样导致一些模型的整体精度提高,其中最高的模型是 DT = 53% 和 RF = 50%。此外,DT 和 RF 模型的 Kappa 值分别增加到 0.39 和 0.35。此外,少数土壤类的过采样导致防止在最终地图中丢失该类。结果表明,在 11 个调查模型中,C5.0 决策树 (DT)、随机森林 (RF) 和多项逻辑回归 (MNL) 的总体准确度最高,分别为 46%、42% 和 38%,用于外推土壤类。此外,这些模型的 Kappa 统计值分别为 0.30、0.24 和 0.22。少数土壤类别的过采样导致一些模型的整体精度提高,其中最高的模型是 DT = 53% 和 RF = 50%。此外,DT 和 RF 模型的 Kappa 值分别增加到 0.39 和 0.35。此外,少数土壤类的过采样导致防止在最终地图中丢失该类。结果表明,在 11 个调查模型中,C5.0 决策树 (DT)、随机森林 (RF) 和多项逻辑回归 (MNL) 的总体准确度最高,分别为 46%、42% 和 38%,用于外推土壤类。此外,这些模型的 Kappa 统计值分别为 0.30、0.24 和 0.22。少数土壤类别的过采样导致一些模型的整体精度提高,其中最高的模型是 DT = 53% 和 RF = 50%。此外,DT 和 RF 模型的 Kappa 值分别增加到 0.39 和 0.35。此外,少数土壤类的过采样导致防止在最终地图中丢失该类。分别用于土壤类别的外推。此外,这些模型的 Kappa 统计值分别为 0.30、0.24 和 0.22。少数土壤类别的过采样导致一些模型的整体精度提高,其中最高的模型是 DT = 53% 和 RF = 50%。此外,DT 和 RF 模型的 Kappa 值分别增加到 0.39 和 0.35。此外,少数土壤类的过采样导致防止在最终地图中丢失该类。分别用于土壤类别的外推。此外,这些模型的 Kappa 统计值分别为 0.30、0.24 和 0.22。少数土壤类别的过采样导致一些模型的整体精度提高,其中最高的模型是 DT = 53% 和 RF = 50%。此外,DT 和 RF 模型的 Kappa 值分别增加到 0.39 和 0.35。此外,少数土壤类的过采样导致防止在最终地图中丢失该类。分别。此外,少数土壤类的过采样导致防止在最终地图中丢失该类。分别。此外,少数土壤类的过采样导致防止在最终地图中丢失该类。

更新日期:2021-08-10
down
wechat
bug