当前位置: X-MOL 学术Adv. Data Anal. Classif. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Seemingly unrelated clusterwise linear regression
Advances in Data Analysis and Classification ( IF 1.6 ) Pub Date : 2019-08-12 , DOI: 10.1007/s11634-019-00369-4
Giuliano Galimberti , Gabriele Soffritti

Linear regression models based on finite Gaussian mixtures represent a flexible tool for the analysis of linear dependencies in multivariate data. They are suitable for dealing with correlated response variables when data come from a heterogeneous population composed of two or more sub-populations, each of which is characterised by a different linear regression model. Several types of finite mixtures of linear regression models have been specified by changing the assumptions on the parameters that differentiate the sub-populations and/or the vectors of regressors that affect the response variables. They are made more flexible in the class of models defined by mixtures of seemingly unrelated Gaussian linear regressions illustrated in this paper. With these models, the researcher is enabled to use a different vector of regressors for each dependent variable. The proposed class includes parsimonious models obtained by imposing suitable constraints on the variances and covariances of the response variables in the sub-populations. Details about the model identification and maximum likelihood estimation are given. The usefulness of these models is shown through the analysis of a real dataset. Regularity conditions for the model class are illustrated and a proof is provided that, when these conditions are met, the consistency of the maximum likelihood estimator under the examined models is ensured. In addition, the behaviour of this estimator in the presence of finite samples is numerically evaluated through the analysis of simulated datasets.

中文翻译:

看似无关的聚类线性回归

基于有限高斯混合的线性回归模型代表了一种用于分析多元数据中线性相关性的灵活工具。当数据来自由两个或多个子种群组成的异类种群时,它们适用于处理相关的响应变量,每个子种群的特征在于不同的线性回归模型。通过更改对影响响应变量的亚群和/或回归向量进行区分的参数的假设,已经指定了几种类型的线性回归模型的有限混合。在由本文说明的看似无关的高斯线性回归混合定义的模型类别中,它们变得更加灵活。使用这些模型,研究人员可以为每个因变量使用不同的回归向量。提议的类别包括通过对子种群中的响应变量的方差和协方差施加适当的约束而获得的简约模型。给出了有关模型识别和最大似然估计的详细信息。这些模型的有用性通过对真实数据集的分析得以展示。说明了模型类别的规则性条件,并提供了证明,当满足这些条件时,可确保检查模型下最大似然估计的一致性。此外,通过对模拟数据集进行分析,可以对存在有限样本的情况下该估计器的行为进行数值评估。提议的类别包括通过对子种群中的响应变量的方差和协方差施加适当的约束而获得的简约模型。给出了有关模型识别和最大似然估计的详细信息。这些模型的有用性通过对真实数据集的分析得以展示。说明了模型类别的规则性条件,并提供了证明,当满足这些条件时,可确保检查模型下最大似然估计的一致性。此外,通过对模拟数据集进行分析,可以对存在有限样本的情况下该估计器的行为进行数值评估。提议的类别包括通过对子种群中的响应变量的方差和协方差施加适当的约束而获得的简约模型。给出了有关模型识别和最大似然估计的详细信息。这些模型的有用性通过对真实数据集的分析得以展示。说明了模型类别的规则性条件,并提供了证明,当满足这些条件时,可确保检查模型下最大似然估计的一致性。此外,通过对模拟数据集进行分析,可以对存在有限样本的情况下该估计器的行为进行数值评估。给出了有关模型识别和最大似然估计的详细信息。这些模型的有用性通过对真实数据集的分析得以展示。说明了模型类别的规则性条件,并提供了证明,当满足这些条件时,可确保检查模型下最大似然估计的一致性。此外,通过对模拟数据集进行分析,可以对存在有限样本的情况下该估计器的行为进行数值评估。给出了有关模型识别和最大似然估计的详细信息。这些模型的有用性通过对真实数据集的分析得以展示。说明了模型类别的规则性条件,并提供了证明,当满足这些条件时,可确保检查模型下最大似然估计的一致性。此外,通过对模拟数据集进行分析,可以对存在有限样本的情况下该估计器的行为进行数值评估。
更新日期:2019-08-12
down
wechat
bug