当前位置: X-MOL 学术IEEE J. Sel. Top. Appl. Earth Obs. Remote Sens. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Hybrid Feature Method for Handling Redundant Features in a Sentinel-2 Multidate Image for Mapping Parthenium Weed
IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing ( IF 4.7 ) Pub Date : 2020-01-01 , DOI: 10.1109/jstars.2020.3001564
Zolo Kiala , Onisimo Mutanga , John Odindi , Serestina Viriri , Mbulisi Sibanda

Multidate images provide additional spectral information valuable for mapping plant species. However, correlated or redundant variables created from multiple image data and a large set of variables impede accurate and efficient landscape classification. Nevertheless, with the implementation of an appropriate feature selection method, the full potential of multidate images and subsequent increased classification accuracies may be achieved. Feature selection is a process of automatically selecting features in a dataset that contribute the most to the prediction of a target variable. It improves the classification process in terms of computation cost and predictive accuracy. Feature selection algorithms are typically classified into three groups: filters, wrappers, and embedded. Due to the inherent tradeoffs provided by different feature selection approaches, we hypothesize that a hybrid approach could optimize landscape delineation by leveraging on their complementary strengths. In this regard, we propose a new feature selection method that combines a filter ReliefF, a wrapper Support vector machines-backward (SVM-b), and the embedded random forest in mapping the noxious Parthenium weed using a Sentinel-2 multidate image. The new approach was compared to its three constituents based on the size of optimal feature subsets and classification accuracies. To make comparison and assessment of developed models from selected variables more valuable, the split between training and test datasets was implemented in three different ratios, namely, 3:1(Dataset 1), 1:1(Dataset 2); 1:3 (Dataset 3). The new approach was also evaluated against the multidate image without feature selection and a single-date image. Results showed that the new approach yielded the highest overall accuracies with the smallest optimal feature subsets. For instance, on Dataset 3, the OA was 86.6% with 22 optimal features, whereas it was 84.7% with 35 optimal features using SVM-b, which was the second most performing feature selection algorithm. The new approach yielded higher classification accuracies than the multidate image without feature selection and the single-date image. The findings of this study under-score the capability of hybrid methods to select fewer features from multidate images, with higher predictive accuracies than individual feature selection methods.

中文翻译:

一种处理 Sentinel-2 多日期图像中冗余特征的混合特征方法,用于映射 Parthenium Weed

多日期图像提供了对绘制植物物种有价值的额外光谱信息。然而,从多个图像数据和大量变量创建的相关或冗余变量阻碍了准确和有效的景观分类。然而,通过实施适当的特征选择方法,可以实现多日期图像的全部潜力和随后提高的分类精度。特征选择是在数据集中自动选择对目标变量预测贡献最大的特征的过程。它在计算成本和预测准确性方面改进了分类过程。特征选择算法通常分为三组:过滤器、包装器和嵌入。由于不同特征选择方法提供的固有权衡,我们假设混合方法可以通过利用它们的互补优势来优化景观描绘。在这方面,我们提出了一种新的特征选择方法,该方法结合了过滤器 ReliefF、包装支持向量机(SVM-b)和嵌入的随机森林,使用 Sentinel-2 多日期图像映射有害的 Parthenium 杂草。根据最佳特征子集的大小和分类精度,将新方法与其三个组成部分进行了比较。为了使选定变量的开发模型的比较和评估更有价值,训练和测试数据集之间的划分以三种不同的比率实施,即 3:1(数据集 1)、1:1(数据集 2);1:3(数据集 3)。新方法还针对没有特征选择的多日期图像和单日期图像进行了评估。结果表明,新方法以最小的最优特征子集产生了最高的整体精度。例如,在数据集 3 上,OA 为 86.6%,具有 22 个最佳特征,而使用 SVM-b 时,OA 为 84.7%,具有 35 个最佳特征,这是性能第二好的特征选择算法。与没有特征选择的多日期图像和单日期图像相比,新方法产生了更高的分类精度。这项研究的结果强调了混合方法从多日期图像中选择较少特征的能力,比单个特征选择方法具有更高的预测精度。结果表明,新方法以最小的最优特征子集产生了最高的整体精度。例如,在数据集 3 上,OA 为 86.6%,具有 22 个最佳特征,而使用 SVM-b 时,OA 为 84.7%,具有 35 个最佳特征,这是性能第二好的特征选择算法。与没有特征选择的多日期图像和单日期图像相比,新方法产生了更高的分类精度。这项研究的结果强调了混合方法从多日期图像中选择更少特征的能力,比单个特征选择方法具有更高的预测精度。结果表明,新方法以最小的最优特征子集产生了最高的整体精度。例如,在数据集 3 上,OA 为 86.6%,具有 22 个最佳特征,而使用 SVM-b 时,OA 为 84.7%,具有 35 个最佳特征,这是性能第二好的特征选择算法。与没有特征选择的多日期图像和单日期图像相比,新方法产生了更高的分类精度。这项研究的结果强调了混合方法从多日期图像中选择更少特征的能力,比单个特征选择方法具有更高的预测精度。7% 的 35 个最佳特征使用 SVM-b,这是性能第二好的特征选择算法。与没有特征选择的多日期图像和单日期图像相比,新方法产生了更高的分类精度。这项研究的结果强调了混合方法从多日期图像中选择更少特征的能力,比单个特征选择方法具有更高的预测精度。7% 的 35 个最佳特征使用 SVM-b,这是性能第二好的特征选择算法。与没有特征选择的多日期图像和单日期图像相比,新方法产生了更高的分类精度。这项研究的结果强调了混合方法从多日期图像中选择更少特征的能力,比单个特征选择方法具有更高的预测精度。
更新日期:2020-01-01
down
wechat
bug