当前位置: X-MOL 学术arXiv.stat.OT › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Complementary Goodness of Fit Procedure for Crash Frequency Models
arXiv - STAT - Other Statistics Pub Date : 2022-05-03 , DOI: arxiv-2205.01279
Mohammadreza Hashemi, Adrian Ricardo Archilla

This paper presents a new procedure for evaluating the goodness of fit of Generalized Linear Models (GLM) estimated with Roadway Departure (RwD) crash frequency data for the State of Hawaii on two-lane two-way (TLTW) state roads. The procedure is analyzed using ten years of RwD crash data (including all severity levels) and roadway characteristics (e.g., traffic, geometry, and inventory databases) that can be aggregated at the section level. The three estimation methods evaluated using the proposed procedure include: Negative Binomial (NB), Zero-Inflated Negative Binomial (ZINB), and Generalized Linear Mixed Model-Negative Binomial (GLMM-NB). The procedure shows that the three methodologies can provide very good fits in terms of the distributions of crashes within narrow ranges of the predicted mean frequency of crashes and in terms of observed vs. predicted average crash frequencies for those data segments. The proposed procedure complements other statistics such as Akaike Information Criterion, Bayesian Information Criterion, and Log-likelihood used for model selection. It is consistent with those statistics for models without random effects, but it diverges for GLMM-NB models. The procedure can aid model selection by providing a clear visualization of the fit of crash frequency models and allowing the computation of a pseudo R2 similar the one used in linear regression. It is recommended to evaluate its use for evaluating the trade-off between the number of random effects in GLMM-NB models and their goodness of fit using more appropriate datasets that do not lead to convergence problems.

中文翻译:

碰撞频率模型的互补拟合优度程序

本文提出了一种评估广义线性模型 (GLM) 拟合优度的新程序,该模型使用夏威夷州两车道双向 (TLTW) 国道上的道路偏离 (RwD) 碰撞频率数据估计。该过程使用十年的 RwD 碰撞数据(包括所有严重级别)和道路特征(例如,交通、几何和库存数据库)进行分析,这些数据可以在路段级别进行汇总。使用所提出的程序评估的三种估计方法包括:负二项式 (NB)、零膨胀负二项式 (ZINB) 和广义线性混合模型负二项式 (GLMM-NB)。该过程表明,这三种方法可以很好地拟合预测平均碰撞频率的狭窄范围内的碰撞分布,以及观察到的与实际发生率的关系。这些数据段的预测平均崩溃频率。建议的程序补充了其他统计数据,例如用于模型选择的 Akaike 信息准则、贝叶斯信息准则和对数似然。它与没有随机效应的模型的统计数据一致,但与 GLMM-NB 模型不同。该程序可以通过提供碰撞频率模型拟合的清晰可视化并允许计算类似于线性回归中使用的伪 R2 来帮助模型选择。建议使用不会导致收敛问题的更合适的数据集来评估其用于评估 GLMM-NB 模型中随机效应数量与其拟合优度之间的权衡。建议的程序补充了其他统计数据,例如用于模型选择的 Akaike 信息准则、贝叶斯信息准则和对数似然。它与没有随机效应的模型的统计数据一致,但与 GLMM-NB 模型不同。该程序可以通过提供碰撞频率模型拟合的清晰可视化并允许计算类似于线性回归中使用的伪 R2 来帮助模型选择。建议使用不会导致收敛问题的更合适的数据集来评估其用于评估 GLMM-NB 模型中随机效应数量与其拟合优度之间的权衡。建议的程序补充了其他统计数据,例如用于模型选择的 Akaike 信息准则、贝叶斯信息准则和对数似然。它与没有随机效应的模型的统计数据一致,但与 GLMM-NB 模型不同。该程序可以通过提供碰撞频率模型拟合的清晰可视化并允许计算类似于线性回归中使用的伪 R2 来帮助模型选择。建议使用不会导致收敛问题的更合适的数据集来评估其用于评估 GLMM-NB 模型中随机效应数量与其拟合优度之间的权衡。它与没有随机效应的模型的统计数据一致,但与 GLMM-NB 模型不同。该程序可以通过提供碰撞频率模型拟合的清晰可视化并允许计算类似于线性回归中使用的伪 R2 来帮助模型选择。建议使用不会导致收敛问题的更合适的数据集来评估其用于评估 GLMM-NB 模型中随机效应数量与其拟合优度之间的权衡。它与没有随机效应的模型的统计数据一致,但与 GLMM-NB 模型不同。该程序可以通过提供碰撞频率模型拟合的清晰可视化并允许计算类似于线性回归中使用的伪 R2 来帮助模型选择。建议使用不会导致收敛问题的更合适的数据集来评估其用于评估 GLMM-NB 模型中随机效应数量与其拟合优度之间的权衡。
更新日期:2022-05-04
down
wechat
bug