当前位置: X-MOL 学术Stat. Comput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A generalized likelihood-based Bayesian approach for scalable joint regression and covariance selection in high dimensions
Statistics and Computing ( IF 2.2 ) Pub Date : 2022-06-03 , DOI: 10.1007/s11222-022-10102-5
Srijata Samanta 1 , Kshitij Khare 1 , George Michailidis 1
Affiliation  

The paper addresses joint sparsity selection in the regression coefficient matrix and the error precision (inverse covariance) matrix for high-dimensional multivariate regression models in the Bayesian paradigm. The selected sparsity patterns are crucial to help understand the network of relationships between the predictor and response variables, as well as the conditional relationships among the latter. While Bayesian methods have the advantage of providing natural uncertainty quantification through posterior inclusion probabilities and credible intervals, current Bayesian approaches either restrict to specific sub-classes of sparsity patterns and/or are not scalable to settings with hundreds of responses and predictors. Bayesian approaches that only focus on estimating the posterior mode are scalable, but do not generate samples from the posterior distribution for uncertainty quantification. Using a bi-convex regression-based generalized likelihood and spike-and-slab priors, we develop an algorithm called joint regression network selector (JRNS) for joint regression and covariance selection, which (a) can accommodate general sparsity patterns, (b) provides posterior samples for uncertainty quantification, and (c) is scalable and orders of magnitude faster than the state-of-the-art Bayesian approaches providing uncertainty quantification. We demonstrate the statistical and computational efficacy of the proposed approach on synthetic data and through the analysis of selected cancer data sets. We also establish high-dimensional posterior consistency for one of the developed algorithms.



中文翻译:

一种基于广义似然的贝叶斯方法,用于高维可扩展联合回归和协方差选择

本文讨论了贝叶斯范式中高维多元回归模型的回归系数矩阵和误差精度(逆协方差)矩阵中的联合稀疏性选择。所选的稀疏模式对于帮助理解预测变量和响应变量之间的关系网络以及后者之间的条件关系至关重要。虽然贝叶斯方法具有通过后验包含概率和可信区间提供自然不确定性量化的优势,但当前的贝叶斯方法要么限于稀疏模式的特定子类,要么无法扩展到具有数百个响应和预测变量的设置。只专注于估计后验模式的贝叶斯方法是可扩展的,但不要从后验分布生成样本用于不确定性量化。使用基于双凸回归的广义似然和 spike-and-slab 先验,我们开发了一种称为联合回归网络选择器 (JRNS) 的算法,用于联合回归和协方差选择,(a) 可以适应一般稀疏模式,(b)提供用于不确定性量化的后验样本,并且 (c) 是可扩展的,并且比提供不确定性量化的最先进的贝叶斯方法快几个数量级。我们通过对选定的癌症数据集的分析,证明了所提出的方法对合成数据的统计和计算功效。我们还为其中一种开发的算法建立了高维后验一致性。使用基于双凸回归的广义似然和 spike-and-slab 先验,我们开发了一种称为联合回归网络选择器 (JRNS) 的算法,用于联合回归和协方差选择,(a) 可以适应一般稀疏模式,(b)提供用于不确定性量化的后验样本,并且 (c) 是可扩展的,并且比提供不确定性量化的最先进的贝叶斯方法快几个数量级。我们通过对选定的癌症数据集的分析,证明了所提出的方法对合成数据的统计和计算功效。我们还为其中一种开发的算法建立了高维后验一致性。使用基于双凸回归的广义似然和 spike-and-slab 先验,我们开发了一种称为联合回归网络选择器 (JRNS) 的算法,用于联合回归和协方差选择,(a) 可以适应一般稀疏模式,(b)提供用于不确定性量化的后验样本,并且 (c) 是可扩展的,并且比提供不确定性量化的最先进的贝叶斯方法快几个数量级。我们通过对选定的癌症数据集的分析,证明了所提出的方法对合成数据的统计和计算功效。我们还为其中一种开发的算法建立了高维后验一致性。我们开发了一种称为联合回归网络选择器 (JRNS) 的算法,用于联合回归和协方差选择,它 (a) 可以适应一般的稀疏模式,(b) 为不确定性量化提供后验样本,以及 (c) 可扩展且速度快几个数量级比提供不确定性量化的最先进的贝叶斯方法。我们通过对选定的癌症数据集的分析,证明了所提出的方法对合成数据的统计和计算功效。我们还为其中一种开发的算法建立了高维后验一致性。我们开发了一种称为联合回归网络选择器 (JRNS) 的算法,用于联合回归和协方差选择,它 (a) 可以适应一般的稀疏模式,(b) 为不确定性量化提供后验样本,并且 (c) 可扩展且速度快几个数量级比提供不确定性量化的最先进的贝叶斯方法。我们通过对选定的癌症数据集的分析,证明了所提出的方法对合成数据的统计和计算功效。我们还为其中一种开发的算法建立了高维后验一致性。(c) 具有可扩展性,并且比提供不确定性量化的最先进的贝叶斯方法快几个数量级。我们通过对选定的癌症数据集的分析,证明了所提出的方法对合成数据的统计和计算功效。我们还为其中一种开发的算法建立了高维后验一致性。(c) 具有可扩展性,并且比提供不确定性量化的最先进的贝叶斯方法快几个数量级。我们通过对选定的癌症数据集的分析,证明了所提出的方法对合成数据的统计和计算功效。我们还为其中一种开发的算法建立了高维后验一致性。

更新日期:2022-06-06
down
wechat
bug