当前位置: X-MOL 学术Med. Biol. Eng. Comput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Estimation of Parkinson's disease severity using speech features and extreme gradient boosting.
Medical & Biological Engineering & Computing ( IF 2.6 ) Pub Date : 2020-09-10 , DOI: 10.1007/s11517-020-02250-5
Hunkar C Tunc 1, 2 , C Okan Sakar 1 , Hulya Apaydin 3 , Gorkem Serbes 4 , Aysegul Gunduz 3 , Melih Tutuncu 3 , Fikret Gurgen 5
Affiliation  

In recent years, there is an increasing interest in building e-health systems. The systems built to deliver the health services with the use of internet and communication technologies aim to reduce the costs arising from outpatient visits of patients. Some of the related recent studies propose machine learning–based telediagnosis and telemonitoring systems for Parkinson’s disease (PD). Motivated from the studies showing the potential of speech disorders in PD telemonitoring systems, in this study, we aim to estimate the severity of PD from voice recordings of the patients using motor Unified Parkinson’s Disease Rating Scale (UPDRS) as the evaluation metric. For this purpose, we apply various speech processing algorithms to the voice signals of the patients and then use these features as input to a two-stage estimation model. The first step is to apply a wrapper-based feature selection algorithm, called Boruta, and select the most informative speech features. The second step is to feed the selected set of features to a decision tree–based boosting algorithm, extreme gradient boosting, which has been recently applied successfully in many machine learning tasks due to its generalization ability and speed. The feature selection analysis showed that the vibration pattern of the vocal fold is an important indicator of PD severity. Besides, we also investigate the effectiveness of using age and years passed since diagnosis as covariates together with speech features. The lowest mean absolute error with 3.87 was obtained by combining these covariates and speech features with prediction level fusion.



中文翻译:

使用语音特征和极端梯度提升估计帕金森病的严重程度。

近年来,人们对建立电子卫生系统的兴趣日益浓厚。使用互联网和通信技术提供医疗服务的系统旨在降低患者门诊就诊的成本。最近的一些相关研究提出了基于机器学习的帕金森病 (PD) 远程诊断和远程监测系统。受研究表明 PD 远程监控系统中言语障碍的可能性,在本研究中,我们旨在使用运动统一帕金森病评定量表 (UPDRS) 作为评估指标,从患者的语音记录中估计 PD 的严重程度。为此,我们将各种语音处理算法应用于患者的语音信号,然后将这些特征用作两阶段估计模型的输入。第一步是应用基于包装器的特征选择算法,称为 Boruta,并选择信息量最大的语音特征。第二步是将选定的特征集提供给基于决策树的增强算法,即极端梯度增强算法,由于其泛化能力和速度,该算法最近已成功应用于许多机器学习任务。特征选择分析表明,声带的振动模式是PD严重程度的重要指标。此外,我们还研究了使用年龄和诊断后的年数作为协变量以及语音特征的有效性。通过将这些协变量和语音特征与预测级别融合相结合,获得了 3.87 的最低平均绝对误差。并选择信息量最大的语音特征。第二步是将选定的特征集提供给基于决策树的增强算法,即极端梯度增强算法,由于其泛化能力和速度,该算法最近已成功应用于许多机器学习任务。特征选择分析表明,声带的振动模式是PD严重程度的重要指标。此外,我们还研究了使用年龄和诊断后的年数作为协变量以及语音特征的有效性。通过将这些协变量和语音特征与预测级别融合相结合,获得了 3.87 的最低平均绝对误差。并选择信息量最大的语音特征。第二步是将选定的特征集提供给基于决策树的增强算法,即极端梯度增强算法,由于其泛化能力和速度,该算法最近已成功应用于许多机器学习任务。特征选择分析表明,声带的振动模式是PD严重程度的重要指标。此外,我们还研究了使用年龄和诊断后的年数作为协变量以及语音特征的有效性。通过将这些协变量和语音特征与预测级别融合相结合,获得了 3.87 的最低平均绝对误差。由于其泛化能力和速度,它最近已成功应用于许多机器学习任务。特征选择分析表明,声带的振动模式是PD严重程度的重要指标。此外,我们还研究了使用年龄和诊断后的年数作为协变量以及语音特征的有效性。通过将这些协变量和语音特征与预测级别融合相结合,获得了 3.87 的最低平均绝对误差。由于其泛化能力和速度,它最近已成功应用于许多机器学习任务。特征选择分析表明,声带的振动模式是PD严重程度的重要指标。此外,我们还研究了使用年龄和诊断后的年数作为协变量以及语音特征的有效性。通过将这些协变量和语音特征与预测级别融合相结合,获得了 3.87 的最低平均绝对误差。我们还研究了使用年龄和诊断后的年数作为协变量以及语音特征的有效性。通过将这些协变量和语音特征与预测级别融合相结合,获得了 3.87 的最低平均绝对误差。我们还研究了使用年龄和诊断后的年数作为协变量以及语音特征的有效性。通过将这些协变量和语音特征与预测级别融合相结合,获得了 3.87 的最低平均绝对误差。

更新日期:2020-09-11
down
wechat
bug