当前位置: X-MOL 学术J. Chemometr. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Comparison of locally weighted PLS strategies for regression and discrimination on agronomic NIR data
Journal of Chemometrics ( IF 2.4 ) Pub Date : 2020-01-16 , DOI: 10.1002/cem.3209
Matthieu Lesnoff 1, 2, 3 , Maxime Metz 3, 4 , Jean‐Michel Roger 3, 4
Affiliation  

In multivariate calibrations, locally weighted partial least squared regression (LWPLSR) is an efficient prediction method when heterogeneity of data generates nonlinear relations (curvatures and clustering) between the response and the explicative variables. This is frequent in agronomic data sets that gather materials of different natures or origins. LWPLSR is a particular case of weighted PLSR (WPLSR; ie, a statistical weight different from the standard 1/n is given to each of the n calibration observations for calculating the PLS scores/loadings and the predictions). In LWPLSR, the weights depend from the dissimilarity (which has to be defined and calculated) to the new observation to predict. This article compares two strategies of LWPLSR: (a) “LW”: the usual strategy where, for each new observation to predict, a WPLSR is applied to the n calibration observations (ie, entire calibration set) vs (b) “KNN‐LW”: a number of k nearest neighbors to the observation to predict are preliminary selected in the training set and WPLSR is applied only to this selected KNN set. On three illustrating agronomic data sets (quantitative and discrimination predictions), both strategies overpassed the standard PLSR. LW and KNN‐LW had close prediction performances, but KNN‐LW was much faster in computation time. KNN‐LW strategy is therefore recommended for large data sets. The article also presents a new algorithm for WPLSR, on the basis of the “improved kernel #1” algorithm, which is competitor and in general faster to the already published weighted PLS nonlinear iterative partial least squares (NIPALS).

中文翻译:

对农艺 NIR 数据进行回归和判别的局部加权 PLS 策略的比较

在多元校准中,当数据的异质性在响应和解释变量之间产生非线性关系(曲率和聚类)时,局部加权偏最小二乘回归 (LWPLSR) 是一种有效的预测方法。这在收集不同性质或来源的材料的农艺数据集中很常见。LWPLSR 是加权 PLSR(WPLSR;即,对 n 个校准观测值中的每一个都赋予不同于标准 1/n 的统计权重,用于计算 PLS 分数/载荷和预测)的一种特殊情况。在 LWPLSR 中,权重取决于要预测的新观测值的不同(必须定义和计算)。本文比较了 LWPLSR 的两种策略:(a) “LW”:通常的策略,对于每个要预测的新观察,将 WPLSR 应用于 n 个校准观测值(即整个校准集) vs (b) “KNN-LW”:在训练集中初步选择要预测的观测值的 k 个最近邻,并且 WPLSR 仅应用于这个选定的 KNN 集。在三个说明农艺数据集(定量和辨别预测)上,这两种策略都超过了标准 PLSR。LW 和 KNN-LW 具有接近的预测性能,但 KNN-LW 在计算时间上要快得多。因此,建议将 KNN-LW 策略用于大型数据集。本文还介绍了一种基于“改进的内核 #1”算法的 WPLSR 新算法,该算法与已发布的加权 PLS 非线性迭代偏最小二乘法 (NIPALS) 相比,通常更快。在训练集中初步选择了要预测的观测值的 k 个最近邻,WPLSR 仅应用于这个选定的 KNN 集。在三个说明农艺数据集(定量和辨别预测)上,这两种策略都超过了标准 PLSR。LW 和 KNN-LW 具有接近的预测性能,但 KNN-LW 在计算时间上要快得多。因此,建议将 KNN-LW 策略用于大型数据集。本文还介绍了一种基于“改进的内核 #1”算法的 WPLSR 新算法,该算法与已发布的加权 PLS 非线性迭代偏最小二乘法 (NIPALS) 相比,通常更快。在训练集中初步选择了要预测的观测值的 k 个最近邻,WPLSR 仅应用于这个选定的 KNN 集。在三个说明农艺数据集(定量和辨别预测)上,这两种策略都超过了标准 PLSR。LW 和 KNN-LW 具有接近的预测性能,但 KNN-LW 在计算时间上要快得多。因此,建议将 KNN-LW 策略用于大型数据集。本文还介绍了一种基于“改进的内核 #1”算法的 WPLSR 新算法,该算法与已发布的加权 PLS 非线性迭代偏最小二乘法 (NIPALS) 相比,通常更快。在三个说明农艺数据集(定量和辨别预测)上,这两种策略都超过了标准 PLSR。LW 和 KNN-LW 具有接近的预测性能,但 KNN-LW 在计算时间上要快得多。因此,建议将 KNN-LW 策略用于大型数据集。本文还介绍了一种基于“改进的内核 #1”算法的 WPLSR 新算法,该算法与已发布的加权 PLS 非线性迭代偏最小二乘法 (NIPALS) 相比,通常更快。在三个说明农艺数据集(定量和辨别预测)上,这两种策略都超过了标准 PLSR。LW 和 KNN-LW 具有接近的预测性能,但 KNN-LW 在计算时间上要快得多。因此,建议将 KNN-LW 策略用于大型数据集。本文还介绍了一种基于“改进的内核 #1”算法的 WPLSR 新算法,该算法与已发布的加权 PLS 非线性迭代偏最小二乘法 (NIPALS) 相比,通常更快。
更新日期:2020-01-16
down
wechat
bug