当前位置: X-MOL 学术Math. Geosci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Weighting of Parts in Compositional Data Analysis: Advances and Applications
Mathematical Geosciences ( IF 2.6 ) Pub Date : 2021-07-05 , DOI: 10.1007/s11004-021-09952-y
Karel Hron 1 , Renáta Talská 1 , Alessandra Menafoglio 2 , Javier Palarea-Albaladejo 3 , Peter Filzmoser 4 , Juan José Egozcue 5
Affiliation  

It often occurs in practice that it is sensible to give different weights to the variables involved in a multivariate data analysis—and the same holds for compositional data as multivariate observations carrying relative information. It can be convenient to apply weights to better accommodate differences in the quality of the measurements, the occurrence of zeros and missing values, or generally to highlight some specific features of compositional parts. The characterisation of compositional data as elements of a Bayes space, which is as a natural generalisation of the ordinary Aitchison geometry, enables the definition of a formal framework to implement weighting schemes for the parts of a composition. This is formally achieved by considering a reference measure in the Bayes space alternative to the common uniform measure via the well-known chain rule. Unweighted centred logratio (clr) coefficients and isometric logratio (ilr) coordinates then allow us to express compositions in real space equipped with (unweighted) Euclidean geometry. The resulting elements of real space generated by the clr coefficients or ilr coordinates are invariant to the scale of the original compositions, but the actual scale of the weights matters. In this work, these formal developments are presented and used to introduce a general approach for weighting parts in compositional data analysis. The practical use is demonstrated on simulated and real-world data sets in the context of the earth sciences.



中文翻译:

成分数据分析中零件的加权:进展与应用

在实践中经常发生的情况是,为多元数据分析中涉及的变量赋予不同的权重是明智的——这同样适用于组成数据作为携带相关信息的多元观察。应用权重可以方便地更好地适应测量质量的差异、零和缺失值的出现,或者通常突出组成部分的某些特定特征。将组合数据表征为贝叶斯空间的元素,这是普通 Aitchison 几何的自然概括,可以定义形式框架以实现组合各部分的加权方案。这是通过考虑贝叶斯空间中的参考度量来正式实现的,该参考度量可通过众所周知的链式规则替代通用统一度量。未加权的中心对数比 (clr) 系数和等距对数比 (ilr) 坐标使我们能够在配备(未加权)欧几里得几何的真实空间中表达构图。由 clr 系数或 ilr 坐标生成的真实空间的结果元素对于原始合成的比例是不变的,但权重的实际比例很重要。在这项工作中,这些正式的发展被提出并用于介绍在成分数据分析中加权部分的一般方法。在地球科学的背景下,在模拟和真实世界的数据集上展示了实际使用。未加权的中心对数比 (clr) 系数和等距对数比 (ilr) 坐标使我们能够在配备(未加权)欧几里得几何的真实空间中表达构图。由 clr 系数或 ilr 坐标生成的真实空间的结果元素对于原始合成的比例是不变的,但权重的实际比例很重要。在这项工作中,这些正式的发展被提出并用于介绍在成分数据分析中加权部分的一般方法。在地球科学的背景下,在模拟和真实世界的数据集上展示了实际使用。未加权的中心对数比 (clr) 系数和等距对数比 (ilr) 坐标使我们能够在配备(未加权)欧几里得几何的真实空间中表达构图。由 clr 系数或 ilr 坐标生成的真实空间的结果元素对于原始合成的比例是不变的,但权重的实际比例很重要。在这项工作中,这些正式的发展被提出并用于介绍在成分数据分析中加权部分的一般方法。在地球科学的背景下,在模拟和真实世界的数据集上展示了实际使用。由 clr 系数或 ilr 坐标生成的真实空间的结果元素对于原始合成的比例是不变的,但权重的实际比例很重要。在这项工作中,这些正式的发展被提出并用于介绍在成分数据分析中加权部分的一般方法。在地球科学的背景下,在模拟和真实世界的数据集上展示了实际使用。由 clr 系数或 ilr 坐标生成的真实空间的结果元素对于原始合成的比例是不变的,但权重的实际比例很重要。在这项工作中,这些正式的发展被提出并用于介绍在成分数据分析中加权部分的一般方法。在地球科学的背景下,在模拟和真实世界的数据集上展示了实际使用。

更新日期:2021-07-05
down
wechat
bug