当前位置: X-MOL 学术BMC Infect. Dis. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Forecasting incidence of infectious diarrhea using random forest in Jiangsu Province, China.
BMC Infectious Diseases ( IF 3.7 ) Pub Date : 2020-03-14 , DOI: 10.1186/s12879-020-4930-2
Xinyu Fang 1, 2 , Wendong Liu 2 , Jing Ai 2 , Mike He 3 , Ying Wu 2 , Yingying Shi 2 , Wenqi Shen 2 , Changjun Bao 1, 2, 4
Affiliation  

BACKGROUND Infectious diarrhea can lead to a considerable global disease burden. Thus, the accurate prediction of an infectious diarrhea epidemic is crucial for public health authorities. This study was aimed at developing an optimal random forest (RF) model, considering meteorological factors used to predict an incidence of infectious diarrhea in Jiangsu Province, China. METHODS An RF model was developed and compared with classical autoregressive integrated moving average (ARIMA)/X models. Morbidity and meteorological data from 2012 to 2016 were used to construct the models and the data from 2017 were used for testing. RESULTS The RF model considered atmospheric pressure, precipitation, relative humidity, and their lagged terms, as well as 1-4 week lag morbidity and time variable as the predictors. Meanwhile, a univariate model ARIMA (1,0,1)(1,0,0)52 (AIC = - 575.92, BIC = - 558.14) and a multivariable model ARIMAX (1,0,1)(1,0,0)52 with 0-1 week lag precipitation (AIC = - 578.58, BIC = - 578.13) were developed as benchmarks. The RF model outperformed the ARIMA/X models with a mean absolute percentage error (MAPE) of approximately 20%. The performance of the ARIMAX model was comparable to that of the ARIMA model with a MAPE reaching approximately 30%. CONCLUSIONS The RF model fitted the dynamic nature of an infectious diarrhea epidemic well and delivered an ideal prediction accuracy. It comprehensively combined the synchronous and lagged effects of meteorological factors; it also integrated the autocorrelation and seasonality of the morbidity. The RF model can be used to predict the epidemic level and has a high potential for practical implementation.

中文翻译:

利用江苏省随机森林预测传染性腹泻的发生率。

背景技术传染性腹泻可导致相当大的全球疾病负担。因此,对传染性腹泻流行的准确预测对于公共卫生部门至关重要。这项研究旨在开发一种最佳的随机森林(RF)模型,其中考虑了用于预测江苏省传染性腹泻发病率的气象因素。方法开发了一个RF模型,并将其与经典自回归综合移动平均值(ARIMA)/ X模型进行了比较。使用2012年至2016年的发病率和气象数据构建模型,并使用2017年的数据进行测试。结果RF模型考虑了大气压力,降水,相对湿度及其滞后项,以及1-4周的滞后发病率和时间变量作为预测指标。同时,单变量模型ARIMA(1,0,1)(1,0,0)52(AIC =-575.92,BIC =-558.14)和具有0-1周滞后降水的多变量模型ARIMAX(1,0,1)(1,0,0)52(AIC =-578.58,BIC =-578.13)作为基准。RF模型优于ARIMA / X模型,平均绝对百分比误差(MAPE)约为20%。ARIMAX模型的性能与ARIMA模型的性能相当,MAPE达到约30%。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,并且在实际实施中具有很高的潜力。14)和具有0-1周滞后降水(AIC =-578.58,BIC =-578.13)的多变量模型ARIMAX(1,0,1)(1,0,0)52。RF模型优于ARIMA / X模型,平均绝对百分比误差(MAPE)约为20%。ARIMAX模型的性能与ARIMA模型的性能相当,MAPE达到约30%。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,并且在实际实施中具有很高的潜力。14)和具有0-1周滞后降水(AIC =-578.58,BIC =-578.13)的多变量模型ARIMAX(1,0,1)(1,0,0)52。RF模型优于ARIMA / X模型,平均绝对百分比误差(MAPE)约为20%。ARIMAX模型的性能与ARIMA模型的性能相当,MAPE达到约30%。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,并且在实际实施中具有很高的潜力。以0)52和0-1周的滞后降水(AIC =-578.58,BIC =-578.13)作为基准。RF模型优于ARIMA / X模型,平均绝对百分比误差(MAPE)约为20%。ARIMAX模型的性能与ARIMA模型的性能相当,MAPE达到约30%。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,在实际应用中具有很高的潜力。以0)52和0-1周的滞后降水(AIC =-578.58,BIC =-578.13)作为基准。RF模型优于ARIMA / X模型,平均绝对百分比误差(MAPE)约为20%。ARIMAX模型的性能与ARIMA模型的性能相当,MAPE达到约30%。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,并且在实际实施中具有很高的潜力。RF模型优于ARIMA / X模型,平均绝对百分比误差(MAPE)约为20%。ARIMAX模型的性能与ARIMA模型的性能相当,MAPE达到约30%。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,并且在实际实施中具有很高的潜力。RF模型优于ARIMA / X模型,平均绝对百分比误差(MAPE)约为20%。ARIMAX模型的性能与ARIMA模型的性能相当,MAPE达到约30%。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,并且在实际实施中具有很高的潜力。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,并且在实际实施中具有很高的潜力。结论RF模型拟合了传染性腹泻流行病的动态性质,并提供了理想的预测精度。它综合结合了气象因素的同步和滞后效应;它还整合了发病的自相关和季节性。RF模型可用于预测流行程度,并且在实际实施中具有很高的潜力。
更新日期:2020-03-16
down
wechat
bug