当前位置:
X-MOL 学术
›
J. Comput. Graph. Stat.
›
论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Tree-based Semi-Varying Coefficient Model for the COM-Poisson Distribution
Journal of Computational and Graphical Statistics ( IF 2.4 ) Pub Date : 2020-05-15 , DOI: 10.1080/10618600.2020.1753530 Suneel Babu Chatla, Galit Shmueli
Journal of Computational and Graphical Statistics ( IF 2.4 ) Pub Date : 2020-05-15 , DOI: 10.1080/10618600.2020.1753530 Suneel Babu Chatla, Galit Shmueli
Abstract We propose a tree-based semi-varying coefficient model for the Conway–Maxwell–Poisson (CMP or COM-Poisson) distribution which is a two-parameter generalization of the Poisson distribution and is flexible enough to capture both under-dispersion and over-dispersion in count data. The advantage of tree-based methods is their scalability to high-dimensional data. We develop CMPMOB, an estimation procedure for a semi-varying coefficient model, using model-based recursive partitioning (MOB). The proposed framework is broader than the existing MOB framework as it allows node-invariant effects to be included in the model. To simplify the computational burden of the exhaustive search employed in the original MOB algorithm, a new split point estimation procedure is proposed by borrowing tools from change point estimation methodology. The proposed method uses only the estimated score functions without fitting models for each split point and, therefore, is computationally simpler. Since the tree-based methods only provide a piece-wise constant approximation to the underlying smooth function, we further propose the CMPBoost semi-varying coefficient model which uses the gradient boosting procedure for estimation. The usefulness of the proposed methods are illustrated using simulation studies and a real example from a bike sharing system in Washington, DC. Supplementary files for this article are available online.
中文翻译:
COM-泊松分布的一种基于树的半变化系数模型
摘要 我们为 Conway-Maxwell-Poisson(CMP 或 COM-Poisson)分布提出了一种基于树的半变系数模型,该模型是 Poisson 分布的双参数泛化,并且足够灵活以捕获欠分散和过分散。 - 计数数据的分散。基于树的方法的优势在于它们对高维数据的可扩展性。我们使用基于模型的递归分区 (MOB) 开发了 CMPMOB,这是一种半可变系数模型的估计程序。提议的框架比现有的 MOB 框架更广泛,因为它允许将节点不变效应包含在模型中。为了简化原始 MOB 算法中采用的穷举搜索的计算负担,通过借用变化点估计方法中的工具,提出了一种新的分割点估计程序。所提出的方法仅使用估计的得分函数,而不为每个分割点拟合模型,因此在计算上更简单。由于基于树的方法仅提供对底层平滑函数的分段常数近似,我们进一步提出了 CMPBoost 半变系数模型,该模型使用梯度提升程序进行估计。使用模拟研究和华盛顿特区自行车共享系统的真实示例说明了所提出方法的有用性。本文的补充文件可在线获取。我们进一步提出了 CMPBoost 半变系数模型,它使用梯度提升程序进行估计。使用模拟研究和华盛顿特区自行车共享系统的真实示例说明了所提出方法的有用性。本文的补充文件可在线获取。我们进一步提出了 CMPBoost 半变系数模型,它使用梯度提升程序进行估计。使用模拟研究和华盛顿特区自行车共享系统的真实示例说明了所提出方法的有用性。本文的补充文件可在线获取。
更新日期:2020-05-15
中文翻译:
COM-泊松分布的一种基于树的半变化系数模型
摘要 我们为 Conway-Maxwell-Poisson(CMP 或 COM-Poisson)分布提出了一种基于树的半变系数模型,该模型是 Poisson 分布的双参数泛化,并且足够灵活以捕获欠分散和过分散。 - 计数数据的分散。基于树的方法的优势在于它们对高维数据的可扩展性。我们使用基于模型的递归分区 (MOB) 开发了 CMPMOB,这是一种半可变系数模型的估计程序。提议的框架比现有的 MOB 框架更广泛,因为它允许将节点不变效应包含在模型中。为了简化原始 MOB 算法中采用的穷举搜索的计算负担,通过借用变化点估计方法中的工具,提出了一种新的分割点估计程序。所提出的方法仅使用估计的得分函数,而不为每个分割点拟合模型,因此在计算上更简单。由于基于树的方法仅提供对底层平滑函数的分段常数近似,我们进一步提出了 CMPBoost 半变系数模型,该模型使用梯度提升程序进行估计。使用模拟研究和华盛顿特区自行车共享系统的真实示例说明了所提出方法的有用性。本文的补充文件可在线获取。我们进一步提出了 CMPBoost 半变系数模型,它使用梯度提升程序进行估计。使用模拟研究和华盛顿特区自行车共享系统的真实示例说明了所提出方法的有用性。本文的补充文件可在线获取。我们进一步提出了 CMPBoost 半变系数模型,它使用梯度提升程序进行估计。使用模拟研究和华盛顿特区自行车共享系统的真实示例说明了所提出方法的有用性。本文的补充文件可在线获取。