当前位置: X-MOL 学术Appl. Spectrosc. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
EXPRESS: Exploration of Principal Component Analysis: Deriving PCA Visually Using Spectra
Applied Spectroscopy ( IF 3.5 ) Pub Date : 2021-01-22 , DOI: 10.1177/0003702820987847
J. Renwick Beattie 1 , Francis W. L. Esmonde-White 2
Affiliation  

Spectroscopy rapidly captures a large amount of data that is not directly interpretable. Principal Components Analysis (PCA) is widely used to simplify complex spectral datasets into comprehensible information by identifying recurring patterns in the data with minimal loss of information. The linear algebra underpinning PCA is not well understood by many applied analytical scientists and spectroscopists who use PCA. The meaning of features identified through PCA are often unclear.This manuscript traces the journey of the spectra themselves through the operations behind PCA, with each step illustrated by simulated spectra. PCA relies solely on the information within the spectra, consequently the mathematical model is dependent on the nature of the data itself. The direct links between model and spectra allow concrete spectroscopic explanation of PCA, such the scores representing âconcentrationâ or âweightsâ. The principal components (loadings) are by definition hidden, repeated and uncorrelated spectral shapes that linearly combine to generate the observed spectra. They can be visualized as subtraction spectra between extreme differences within the dataset. Each PC is shown to be a successive refinement of the estimated spectra, improving the fit between PC reconstructed data and the original data. Understanding the data-led development of a PCA model shows how to interpret application specific chemical meaning of the PCA loadings and how to analyze scores.A critical benefit of PCA is its simplicity and the succinctness of its description of a dataset, making it powerful and flexible.

中文翻译:

EXPRESS:探索主成分分析:使用光谱直观地推导 PCA

光谱学快速捕获大量无法直接解释的数据。主成分分析 (PCA) 被广泛用于通过识别数据中的重复模式以最小的信息损失将复杂的光谱数据集简化为可理解的信息。许多使用 PCA 的应用分析科学家和光谱学家并不十分了解支持 PCA 的线性代数。通过 PCA 识别的特征的含义通常不清楚。本手稿通过 PCA 背后的操作追踪光谱本身的旅程,每一步都用模拟光谱说明。PCA 仅依赖于光谱内的信息,因此数学模型取决于数据本身的性质。模型和光谱之间的直接联系允许对 PCA 进行具体的光谱解释,例如代表“浓度”或“权重”的分数。根据定义,主成分(载荷)是隐藏的、重复的和不相关的光谱形状,它们线性组合以生成观察到的光谱。它们可以被可视化为数据集中极端差异之间的减法光谱。每个 PC 都显示为对估计光谱的连续改进,改善了 PC 重建数据和原始数据之间的拟合。了解 PCA 模型的以数据为主导的开发展示了如何解释 PCA 载荷的应用特定化学含义以及如何分析分数。 PCA 的一个关键优势是其对数据集描述的简单性和简洁性,使其功能强大且灵活的。这样的分数代表“浓度”或“权重”。根据定义,主成分(载荷)是隐藏的、重复的和不相关的光谱形状,它们线性组合以生成观察到的光谱。它们可以被可视化为数据集中极端差异之间的减法光谱。每个 PC 都显示为对估计光谱的连续改进,改善了 PC 重建数据和原始数据之间的拟合。了解 PCA 模型的以数据为导向的开发显示了如何解释 PCA 载荷的应用特定化学含义以及如何分析分数。 PCA 的一个关键优势是其对数据集描述的简单性和简洁性,使其功能强大且灵活的。这样的分数代表“浓度”或“权重”。根据定义,主成分(载荷)是隐藏的、重复的和不相关的光谱形状,它们线性组合以生成观察到的光谱。它们可以被可视化为数据集中极端差异之间的减法光谱。每个 PC 都显示为对估计光谱的连续改进,改善了 PC 重建数据和原始数据之间的拟合。了解 PCA 模型的以数据为主导的开发展示了如何解释 PCA 载荷的应用特定化学含义以及如何分析分数。 PCA 的一个关键优势是其对数据集描述的简单性和简洁性,使其功能强大且灵活的。重复和不相关的光谱形状线性组合以生成观察到的光谱。它们可以被可视化为数据集中极端差异之间的减法光谱。每个 PC 都显示为对估计光谱的连续改进,改善了 PC 重建数据和原始数据之间的拟合。了解 PCA 模型的以数据为主导的开发展示了如何解释 PCA 载荷的应用特定化学含义以及如何分析分数。 PCA 的一个关键优势是其对数据集描述的简单性和简洁性,使其功能强大且灵活的。重复和不相关的光谱形状线性组合以生成观察到的光谱。它们可以被可视化为数据集中极端差异之间的减法光谱。每个 PC 都显示为对估计光谱的连续改进,改善了 PC 重建数据和原始数据之间的拟合。了解 PCA 模型的以数据为主导的开发展示了如何解释 PCA 载荷的应用特定化学含义以及如何分析分数。 PCA 的一个关键优势是其对数据集描述的简单性和简洁性,使其功能强大且灵活的。每个 PC 都显示为对估计光谱的连续改进,改善了 PC 重建数据和原始数据之间的拟合。了解 PCA 模型的以数据为主导的开发展示了如何解释 PCA 载荷的应用特定化学含义以及如何分析分数。 PCA 的一个关键优势是其对数据集描述的简单性和简洁性,使其功能强大且灵活的。每个 PC 都显示为对估计光谱的连续改进,改善了 PC 重建数据和原始数据之间的拟合。了解 PCA 模型的以数据为主导的开发展示了如何解释 PCA 载荷的应用特定化学含义以及如何分析分数。 PCA 的一个关键优势是其对数据集描述的简单性和简洁性,使其功能强大且灵活的。
更新日期:2021-01-22
down
wechat
bug