当前位置: X-MOL 学术Pattern Recogn. Lett. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Association between work-related features and coronary artery disease: A heterogeneous hybrid feature selection integrated with balancing approach
Pattern Recognition Letters ( IF 3.9 ) Pub Date : 2020-02-11 , DOI: 10.1016/j.patrec.2020.02.010
Elham Nasarian , Moloud Abdar , Mohammad Amin Fahami , Roohallah Alizadehsani , Sadiq Hussain , Mohammad Ehsan Basiri , Mariam Zomorodi-Moghadam , Xujuan Zhou , Paweł Pławiak , U. Rajendra Acharya , Ru-San Tan , Nizal Sarrafzadegan

Coronary artery disease (CAD) is a leading cause of death worldwide and is associated with high healthcare expenditure. Researchers are motivated to apply machine learning (ML) for quick and accurate detection of CAD. The performance of the automated systems depends on the quality of features used. Clinical CAD datasets contain different features with varying degrees of association with CAD. To extract such features, we developed a novel hybrid feature selection algorithm called heterogeneous hybrid feature selection (2HFS). In this work, we used Nasarian CAD dataset, in which work place and environmental features are also considered, in addition to other clinical features. Synthetic minority over-sampling technique (SMOTE) and Adaptive synthetic (ADASYN) are used to handle the imbalance in the dataset. Decision tree (DT), Gaussian Naive Bayes (GNB), Random Forest (RF), and XGBoost classifiers are used. 2HFS-selected features are then input into these classifier algorithms. Our results show that, the proposed feature selection method has yielded the classification accuracy of 81.23% with SMOTE and XGBoost classifier. We have also tested our approach with other well-known CAD datasets: Hungarian dataset, Long-beach-va dataset, and Z-Alizadeh Sani dataset. We have obtained 83.94%, 81.58% and 92.58% for Hungarian dataset, Long-beach-va dataset, and Z-Alizadeh Sani dataset, respectively. Hence, our experimental results confirm the effectiveness of our proposed feature selection algorithm as compared to the existing state-of-the-art techniques which yielded outstanding results for the development of automated CAD systems.



中文翻译:

与工作相关的特征与冠状动脉疾病之间的关联:结合平衡方法的异构混合特征选择

冠状动脉疾病(CAD)是全球范围内的主要死亡原因,并且与高昂的医疗保健支出有关。研究人员被激励运用机器学习(ML)来快速,准确地检测CAD。自动化系统的性能取决于所使用功能的质量。临床CAD数据集包含与CAD有不同程度关联的不同特征。为了提取这些特征,我们开发了一种新颖的混合特征选择算法,称为异构混合特征选择(2HFS)。在这项工作中,我们使用了Nasarian CAD数据集,除其他临床特征外,还考虑了工作地点和环境特征。合成少数样本过采样技术(SMOTE)和自适应合成(ADASYN)用于处理数据集中的不平衡。决策树(DT),使用高斯朴素贝叶斯(GNB),随机森林(RF)和XGBoost分类器。然后将2HFS选择的特征输入到这些分类器算法中。我们的结果表明,所提出的特征选择方法使用SMOTE和XGBoost分类器可以达到81.23%的分类精度。我们还用其他著名的CAD数据集测试了我们的方法:匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集。匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集分别获得83.94%,81.58%和92.58%。因此,与现有的现有技术相比,我们的实验结果证实了我们提出的特征选择算法的有效性,该技术为自动化CAD系统的开发产生了出色的结果。和XGBoost分类器。然后将2HFS选择的特征输入到这些分类器算法中。我们的结果表明,所提出的特征选择方法使用SMOTE和XGBoost分类器可以达到81.23%的分类精度。我们还用其他著名的CAD数据集测试了我们的方法:匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集。匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集分别获得83.94%,81.58%和92.58%。因此,与现有的现有技术相比,我们的实验结果证实了我们提出的特征选择算法的有效性,该技术为自动化CAD系统的开发产生了出色的结果。和XGBoost分类器。然后将2HFS选择的特征输入到这些分类器算法中。我们的结果表明,所提出的特征选择方法使用SMOTE和XGBoost分类器可以达到81.23%的分类精度。我们还用其他著名的CAD数据集测试了我们的方法:匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集。匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集分别获得83.94%,81.58%和92.58%。因此,与现有的现有技术相比,我们的实验结果证实了我们提出的特征选择算法的有效性,该技术为自动化CAD系统的开发产生了出色的结果。我们的结果表明,所提出的特征选择方法使用SMOTE和XGBoost分类器的分类精度达到了81.23%。我们还用其他著名的CAD数据集测试了我们的方法:匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集。匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集分别获得83.94%,81.58%和92.58%。因此,与现有的现有技术相比,我们的实验结果证实了我们提出的特征选择算法的有效性,该技术为自动化CAD系统的开发产生了出色的结果。我们的结果表明,所提出的特征选择方法使用SMOTE和XGBoost分类器可以达到81.23%的分类精度。我们还用其他著名的CAD数据集测试了我们的方法:匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集。匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集分别获得83.94%,81.58%和92.58%。因此,与现有的现有技术相比,我们的实验结果证实了我们提出的特征选择算法的有效性,该技术为自动化CAD系统的开发产生了出色的结果。匈牙利数据集,Longbeach-va数据集和Z-Alizadeh Sani数据集。匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集分别获得83.94%,81.58%和92.58%。因此,与现有的现有技术相比,我们的实验结果证实了我们提出的特征选择算法的有效性,该技术为自动化CAD系统的开发产生了出色的结果。匈牙利数据集,Longbeach-va数据集和Z-Alizadeh Sani数据集。匈牙利数据集,Long-beach-va数据集和Z-Alizadeh Sani数据集分别获得83.94%,81.58%和92.58%。因此,与现有的现有技术相比,我们的实验结果证实了我们提出的特征选择算法的有效性,该技术为自动化CAD系统的开发产生了出色的结果。

更新日期:2020-03-07
down
wechat
bug