当前位置: X-MOL 学术BMC Public Health › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Identifying socio-demographic risk factors for suicide using data on an individual level
BMC Public Health ( IF 3.5 ) Pub Date : 2021-09-18 , DOI: 10.1186/s12889-021-11743-3
Guus Berkelmans 1 , Rob van der Mei 1, 2 , Sandjai Bhulai 2 , Renske Gilissen 3
Affiliation  

Suicide is a complex issue. Due to the relative rarity of the event, studies into risk factors are regularly limited by sample size or biased samples. The aims of the study were to find risk factors for suicide that are robust to intercorrelation, and which were based on a large and unbiased sample. Using a training set of 5854 suicides and 596,416 control cases, we fit a logistic regression model and then evaluate the performance on a test set of 1425 suicides and 594,893 control cases. The data used was micro-data of Statistics Netherlands (CBS) with data on each inhabitant of the Netherlands. Taking the effect of possible correlating risk factors into account, those with a higher risk for suicide are men, middle-aged people, people with low income, those living alone, the unemployed, and those with mental or physical health problems. People with a lower risk are the highly educated, those with a non-western immigration background, and those living with a partner. We confirmed previously known risk factors such as male gender, middle-age, and low income and found that they are risk factors that are robust to intercorrelation. We found that debt and urbanicity were mostly insignificant and found that the regional differences found in raw frequencies are mostly explained away after correction of correlating risk factors, indicating that these differences were primarily caused due to the differences in the demographic makeup of the regions. We found an AUC of 0.77, which is high for a model predicting suicide death and comparable to the performance of deep learning models but with the benefit of remaining explainable.

中文翻译:

使用个人层面的数据识别自杀的社会人口统计学风险因素

自杀是一个复杂的问题。由于该事件相对罕见,对风险因素的研究经常受到样本量或有偏见的样本的限制。该研究的目的是找到对相互关联性很强的自杀风险因素,这些因素是基于一个大而无偏见的样本。使用包含 5854 名自杀和 596,416 个对照案例的训练集,我们拟合逻辑回归模型,然后在包含 1425 个自杀和 594,893 个对照案例的测试集上评估性能。使用的数据是荷兰统计局 (CBS) 的微观数据,其中包含荷兰每个居民的数据。考虑到可能的相关风险因素的影响,男性、中年人、低收入者、独居者、失业者以及有精神或身体健康问题的人自杀风险较高。风险较低的人是受过高等教育的人、具有非西方移民背景的人以及与伴侣同住的人。我们确认了先前已知的风险因素,例如男性、中年和低收入,并发现它们是具有很强相关性的风险因素。我们发现债务和城市化大多不显着,并且发现原始频率中发现的地区差异在校正相关风险因素后大部分被解释掉,表明这些差异主要是由于地区人口构成的差异造成的。我们发现 AUC 为 0.77,这对于预测自杀死亡的模型来说很高,与深度学习模型的性能相当,但具有保持可解释性的优势。具有非西方移民背景的人,以及与伴侣同住的人。我们确认了先前已知的风险因素,例如男性、中年和低收入,并发现它们是具有很强相关性的风险因素。我们发现债务和城市化大多不显着,并且发现原始频率中发现的区域差异在校正相关风险因素后大部分被解释掉,表明这些差异主要是由于地区人口构成的差异造成的。我们发现 AUC 为 0.77,这对于预测自杀死亡的模型来说很高,与深度学习模型的性能相当,但具有保持可解释性的优势。具有非西方移民背景的人,以及与伴侣同住的人。我们确认了先前已知的风险因素,例如男性、中年和低收入,并发现它们是具有很强相关性的风险因素。我们发现债务和城市化大多不显着,并且发现原始频率中发现的区域差异在校正相关风险因素后大部分被解释掉,表明这些差异主要是由于地区人口构成的差异造成的。我们发现 AUC 为 0.77,这对于预测自杀死亡的模型来说很高,与深度学习模型的性能相当,但具有保持可解释性的优势。我们确认了先前已知的风险因素,例如男性、中年和低收入,并发现它们是具有很强相关性的风险因素。我们发现债务和城市化大多不显着,并且发现原始频率中发现的地区差异在校正相关风险因素后大部分被解释掉,表明这些差异主要是由于地区人口构成的差异造成的。我们发现 AUC 为 0.77,这对于预测自杀死亡的模型来说很高,与深度学习模型的性能相当,但具有保持可解释性的优势。我们确认了先前已知的风险因素,例如男性、中年和低收入,并发现它们是具有很强相关性的风险因素。我们发现债务和城市化大多不显着,并且发现原始频率中发现的地区差异在校正相关风险因素后大部分被解释掉,表明这些差异主要是由于地区人口构成的差异造成的。我们发现 AUC 为 0.77,这对于预测自杀死亡的模型来说很高,与深度学习模型的性能相当,但具有保持可解释性的优势。我们发现债务和城市化大多不显着,并且发现原始频率中发现的地区差异在校正相关风险因素后大部分被解释掉,表明这些差异主要是由于地区人口构成的差异造成的。我们发现 AUC 为 0.77,这对于预测自杀死亡的模型来说很高,与深度学习模型的性能相当,但具有保持可解释性的优势。我们发现债务和城市化大多不显着,并且发现原始频率中发现的地区差异在校正相关风险因素后大部分被解释掉,表明这些差异主要是由于地区人口构成的差异造成的。我们发现 AUC 为 0.77,这对于预测自杀死亡的模型来说很高,与深度学习模型的性能相当,但具有保持可解释性的优势。
更新日期:2021-09-19
down
wechat
bug