当前位置: X-MOL 学术Stat. Comput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Bayesian nonparametric priors for hidden Markov random fields
Statistics and Computing ( IF 2.2 ) Pub Date : 2020-03-04 , DOI: 10.1007/s11222-020-09935-9
Hongliang Lü , Julyan Arbel , Florence Forbes

One of the central issues in statistics and machine learning is how to select an adequate model that can automatically adapt its complexity to the observed data. In the present paper, we focus on the issue of determining the structure of clustered data, both in terms of finding the appropriate number of clusters and of modeling the right dependence structure between the observations. Bayesian nonparametric (BNP) models, which do not impose an upper limit on the number of clusters, are appropriate to avoid the required guess on the number of clusters but have been mainly developed for independent data. In contrast, Markov random fields (MRF) have been extensively used to model dependencies in a tractable manner but usually reduce to finite cluster numbers when clustering tasks are addressed. Our main contribution is to propose a general scheme to design tractable BNP–MRF priors that combine both features: no commitment to an arbitrary number of clusters and a dependence modeling. A key ingredient in this construction is the availability of a stick-breaking representation which has the threefold advantage to allowing us to extend standard discrete MRFs to infinite state space, to design a tractable estimation algorithm using variational approximation and to derive theoretical properties on the predictive distribution and the number of clusters of the proposed model. This approach is illustrated on a challenging natural image segmentation task for which it shows good performance with respect to the literature.

中文翻译:

隐马尔可夫随机场的贝叶斯非参数先验

统计和机器学习的中心问题之一是如何选择合适的模型,以使其复杂性自动适应所观察到的数据。在本文中,我们将重点放在确定聚类数据的结构上,既要找到适当数量的聚类,又要对观察值之间的正确依赖性结构建模。不对簇数施加上限的贝叶斯非参数(BNP)模型适用于避免对簇数进行所需的猜测,但主要针对独立数据而开发。相反,马尔可夫随机场(MRF)已被广泛用于以一种易处理的方式对依赖关系进行建模,但在解决聚类任务时通常会减少为有限的聚类数。我们的主要贡献是提出一个综合方案来设计易于处理的BNP-MRF先验方案,该方案结合了以下两个特征:不承诺任意数量的聚类和依赖性模型。此构造中的关键要素是是否有不折不扣的表示形式,它具有三方面的优势,可以使我们将标准离散MRF扩展到无限状态空间,可以使用变分逼近来设计易于处理的估计算法,并可以得出关于预测的理论性质分布和建议模型的簇数。在具有挑战性的自然图像分割任务中说明了此方法,该方法相对于文献显示出良好的性能。不承诺任意数量的集群和依赖关系建模。此构造中的关键要素是是否有不折不扣的表示形式,它具有三方面的优势,可以使我们将标准离散MRF扩展到无限状态空间,可以使用变分逼近来设计易于处理的估计算法,并可以得出关于预测的理论性质分布和建议模型的簇数。在具有挑战性的自然图像分割任务中说明了此方法,该方法相对于文献显示出良好的性能。不承诺任意数量的集群和依赖关系建模。此构造中的关键要素是是否有不折不扣的表示形式,它具有三方面的优势,可以使我们将标准离散MRF扩展到无限状态空间,可以使用变分逼近来设计易于处理的估计算法,并可以得出关于预测的理论性质分布和建议模型的簇数。在具有挑战性的自然图像分割任务中说明了此方法,该方法相对于文献显示出良好的性能。设计一种使用变分逼近的易处理的估计算法,并推导该模型的预测分布和簇数的理论性质。在具有挑战性的自然图像分割任务中说明了此方法,该方法相对于文献显示出良好的性能。设计一种使用变分逼近的易处理的估计算法,并得出该模型的预测分布和簇数的理论性质。在具有挑战性的自然图像分割任务中说明了此方法,该方法相对于文献显示出良好的性能。
更新日期:2020-03-04
down
wechat
bug