当前位置: X-MOL 学术Comput. Stat. Data Anal. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
The LASSO on latent indices for regression modeling with ordinal categorical predictors
Computational Statistics & Data Analysis ( IF 1.5 ) Pub Date : 2020-09-01 , DOI: 10.1016/j.csda.2020.106951
Francis K.C. Hui , Samuel Müller , A.H. Welsh

Abstract Many applications of regression models involve ordinal categorical predictors. Two common approaches for handling ordinal predictors are to form a set of dummy variables, or employ a two stage approach where dimension reduction is first applied and then the response is regressed against the predicted latent indices. Both approaches have drawbacks, with the former running into a high-dimensional problem especially if interactions are considered, while the latter separates the prediction of the latent indices from the construction of the regression model. To overcome these challenges, a new approach called the LASSO on Latent Indices (LoLI) for handling ordinal predictors in regression is proposed, which involves jointly constructing latent indices for each or for groups of ordinal predictors and modeling the response directly as a function of these. LoLI borrows strength from the response to more accurately predict the latent indices, leading to better estimation of the corresponding effects. Furthermore, LoLI incorporates a LASSO type penalty to perform hierarchical selection, with interaction terms selected only if both parent main effects are included. Simulations show that LoLI can outperform the dummy variable and two stage approaches in selection and prediction performance. Applying LoLI to an Australian household-based panel identified three dimensions of psychosocial workplace quality (job demands, stress, and security) which affect an individual’s mental health in an additive and pairwise interactive manner.

中文翻译:

使用有序分类预测变量进行回归建模的潜在指数 LASSO

摘要 回归模型的许多应用都涉及有序分类预测变量。处理有序预测变量的两种常用方法是形成一组虚拟变量,或采用两阶段方法,其中首先应用降维,然后根据预测的潜在指数对响应进行回归。这两种方法都有缺点,前者会遇到高维问题,尤其是在考虑交互作用的情况下,而后者将潜在指数的预测与回归模型的构建分开。为了克服这些挑战,提出了一种称为 LASSO on Latent Indices (LoLI) 的新方法,用于处理回归中的序数预测变量,这涉及为每个或一组有序预测变量联合构建潜在指数,并将响应直接建模为这些的函数。LoLI 从响应中借用强度来更准确地预测潜在指数,从而更好地估计相应的影响。此外,LoLI 结合了 LASSO 类型惩罚来执行层次选择,只有在包含两个父主效应时才选择交互项。仿真表明,LoLI 在选择和预测性能方面可以优于虚拟变量和两阶段方法。将 LoLI 应用于澳大利亚家庭小组确定了心理社会工作场所质量(工作需求、压力和安全)的三个维度,这些维度以累加和成对交互的方式影响个人的心理健康。LoLI 从响应中借用强度来更准确地预测潜在指数,从而更好地估计相应的影响。此外,LoLI 结合了 LASSO 类型惩罚来执行层次选择,只有在包含两个父主效应时才选择交互项。仿真表明,LoLI 在选择和预测性能方面可以优于虚拟变量和两阶段方法。将 LoLI 应用于澳大利亚家庭小组确定了心理社会工作场所质量(工作需求、压力和安全)的三个维度,这些维度以累加和成对交互的方式影响个人的心理健康。LoLI 从响应中借用强度来更准确地预测潜在指数,从而更好地估计相应的影响。此外,LoLI 结合了 LASSO 类型惩罚来执行层次选择,只有在包含两个父主效应时才选择交互项。仿真表明,LoLI 在选择和预测性能方面可以优于虚拟变量和两阶段方法。将 LoLI 应用于澳大利亚家庭小组确定了心理社会工作场所质量(工作需求、压力和安全)的三个维度,这些维度以累加和成对交互的方式影响个人的心理健康。LoLI 结合了 LASSO 类型惩罚来执行层次选择,只有在包含两个父主效应时才选择交互项。仿真表明,LoLI 在选择和预测性能方面可以优于虚拟变量和两阶段方法。将 LoLI 应用于澳大利亚家庭小组确定了心理社会工作场所质量(工作需求、压力和安全)的三个维度,这些维度以累加和成对交互的方式影响个人的心理健康。LoLI 结合了 LASSO 类型惩罚来执行层次选择,只有在包含两个父主效应时才选择交互项。仿真表明,LoLI 在选择和预测性能方面可以优于虚拟变量和两阶段方法。将 LoLI 应用于澳大利亚家庭小组确定了心理社会工作场所质量(工作需求、压力和安全)的三个维度,这些维度以累加和成对交互的方式影响个人的心理健康。
更新日期:2020-09-01
down
wechat
bug