当前位置: X-MOL 学术J. Chemometr. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Exploring the latent variable space of PLS2 by post‐transformation of the score matrix (ptLV)
Journal of Chemometrics ( IF 1.9 ) Pub Date : 2018-09-19 , DOI: 10.1002/cem.3079
Matteo Stocchero 1
Affiliation  

Projection to Latent Structures (PLS) regression is largely applied in chemometrics. The most used algorithm for performing PLS is probably PLS2. PLS2 solves the problem of redundancy and collinearity in complex data sets and produces a small set of latent variables that can be used to investigate complex phenomena. However, the presence of specific cluster structures or trends in the data can drive PLS2 towards wrong directions and a redundant number of latent variables is generated. To overcome this unexpected behaviour, OSC‐based methods were developed. The main idea was to use the concept of orthogonality to identified two different type of sources of structured variation which are modeled into two different subspaces: the non‐predictive subspace described by latent variables orthogonal to the Y‐response and the predictive subspace related to the Y‐response. OSC‐based methods work on the variable space producing suitable weight vectors to project the data. In this study, a new post‐transformation method, called post‐transformation of the Latent Variable space (ptLV), is introduced. The method generates a latent space isomorphic to that discovered by PLS2 where the non‐predictive data variation is separated from the predictive one. It works on the score space and can be applied also to kernel‐PLS2 (KPLS2). The relationships with post‐transformation of PLS2 (ptPLS2) are investigated and a real and two simulated data sets are used to illustrate how ptLV works in practice.

中文翻译:

通过分数矩阵 (ptLV) 的后变换探索 PLS2 的潜在变量空间

投影到潜在结构 (PLS) 回归主要应用于化学计量学。执行 PLS 最常用的算法可能是 PLS2。PLS2 解决了复杂数据集中的冗余和共线性问题,并生成了一小组可用于研究复杂现象的潜在变量。然而,数据中特定集群结构或趋势的存在可能会导致 PLS2 朝着错误的方向发展,并产生大量的潜在变量。为了克服这种意外行为,开发了基于 OSC 的方法。主要思想是使用正交性的概念来识别两种不同类型的结构化变异来源,它们被建模为两个不同的子空间:由与 Y 响应正交的潜在变量描述的非预测子空间和与 Y 响应相关的预测子空间。基于 OSC 的方法在可变空间上工作,产生合适的权重向量来投影数据。在这项研究中,引入了一种新的转换后方法,称为潜在变量空间的后转换(ptLV)。该方法生成与 PLS2 发现的潜在空间同构的潜在空间,其中非预测数据变化与预测数据变化分开。它适用于分数空间,也可以应用于 kernel-PLS2 (KPLS2)。研究了与 PLS2 (ptPLS2) 转换后的关系,并使用真实数据集和两个模拟数据集来说明 ptLV 在实践中的工作原理。基于 OSC 的方法在可变空间上工作,产生合适的权重向量来投影数据。在这项研究中,引入了一种新的转换后方法,称为潜在变量空间的后转换(ptLV)。该方法生成与 PLS2 发现的潜在空间同构的潜在空间,其中非预测数据变化与预测数据变化分开。它适用于分数空间,也可以应用于 kernel-PLS2 (KPLS2)。研究了与 PLS2 (ptPLS2) 转换后的关系,并使用真实数据集和两个模拟数据集来说明 ptLV 在实践中的工作原理。基于 OSC 的方法在可变空间上工作,产生合适的权重向量来投影数据。在这项研究中,引入了一种新的转换后方法,称为潜在变量空间的后转换(ptLV)。该方法生成与 PLS2 发现的潜在空间同构的潜在空间,其中非预测数据变化与预测数据变化分开。它适用于分数空间,也可以应用于 kernel-PLS2 (KPLS2)。研究了与 PLS2 (ptPLS2) 转换后的关系,并使用真实数据集和两个模拟数据集来说明 ptLV 在实践中的工作原理。该方法生成与 PLS2 发现的潜在空间同构的潜在空间,其中非预测数据变化与预测数据变化分开。它适用于分数空间,也可以应用于 kernel-PLS2 (KPLS2)。研究了与 PLS2 (ptPLS2) 转换后的关系,并使用真实数据集和两个模拟数据集来说明 ptLV 在实践中的工作原理。该方法生成与 PLS2 发现的潜在空间同构的潜在空间,其中非预测数据变化与预测数据变化分开。它适用于分数空间,也可以应用于 kernel-PLS2 (KPLS2)。研究了与 PLS2 (ptPLS2) 转换后的关系,并使用真实数据集和两个模拟数据集来说明 ptLV 在实践中的工作原理。
更新日期:2018-09-19
down
wechat
bug