当前位置: X-MOL 学术ACM Trans. Internet Technol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Hybrid Feature Selection Algorithm Based on a Discrete Artificial Bee Colony for Parkinson's Diagnosis
ACM Transactions on Internet Technology ( IF 3.9 ) Pub Date : 2020-07-07 , DOI: 10.1145/3397161
Haolun Li 1 , Chi-Man Pun 2 , Feng Xu 3 , Longsheng Pan 4 , Rui Zong 4 , Hao Gao 1 , Huimin Lu
Affiliation  

Parkinson's disease is a neurodegenerative disease that affects millions of people around the world and cannot be cured fundamentally. Automatic identification of early Parkinson's disease on feature data sets is one of the most challenging medical tasks today. Many features in these datasets are useless or suffering from problems like noise, which affect the learning process and increase the computational burden. To ensure the optimal classification performance, this article proposes a hybrid feature selection algorithm based on an improved discrete artificial bee colony algorithm to improve the efficiency of feature selection. The algorithm combines the advantages of filters and wrappers to eliminate most of the uncorrelated or noisy features and determine the optimal subset of features. In the filter, three different variable ranking methods are employed to pre-rank the candidate features, then the population of artificial bee colony is initialized based on the significance degree of the re-rank features. In the wrapper part, the artificial bee colony algorithm evaluates individuals (feature subsets) based on the classification accuracy of the classifier to achieve the optimal feature subset. In addition, for the first time, we introduce a strategy that can automatically select the best classifier in the search framework more quickly. By comparing with several publicly available datasets, the proposed method achieves better performance than other state-of-the-art algorithms and can extract fewer effective features.

中文翻译:

基于离散人工蜂群的帕金森诊断混合特征选择算法

帕金森病是一种影响全球数百万人的神经退行性疾病,无法从根本上治愈。在特征数据集上自动识别早期帕金森病是当今最具挑战性的医学任务之一。这些数据集中的许多特征是无用的或存在噪声等问题,这会影响学习过程并增加计算负担。为保证最佳的分类性能,本文提出一种基于改进的离散人工蜂群算法的混合特征选择算法,以提高特征选择的效率。该算法结合了过滤器和包装器的优点,以消除大部分不相关或嘈杂的特征,并确定特征的最佳子集。在过滤器中,采用三种不同的变量排序方法对候选特征进行预排序,然后根据重排序特征的显着程度初始化人工蜂群种群。在wrapper部分,人工蜂群算法根据分类器的分类精度对个体(特征子集)进行评估,以达到最优的特征子集。此外,我们首次引入了一种策略,可以更快地自动选择搜索框架中的最佳分类器。通过与几个公开可用的数据集进行比较,所提出的方法比其他最先进的算法具有更好的性能,并且可以提取更少的有效特征。然后根据重新排序特征的显着性程度初始化人工蜂群种群。在wrapper部分,人工蜂群算法根据分类器的分类精度对个体(特征子集)进行评估,以达到最优的特征子集。此外,我们首次引入了一种策略,可以更快地自动选择搜索框架中的最佳分类器。通过与几个公开可用的数据集进行比较,所提出的方法比其他最先进的算法具有更好的性能,并且可以提取更少的有效特征。然后根据重新排序特征的显着性程度初始化人工蜂群种群。在wrapper部分,人工蜂群算法根据分类器的分类精度对个体(特征子集)进行评估,以达到最优的特征子集。此外,我们首次引入了一种策略,可以更快地自动选择搜索框架中的最佳分类器。通过与几个公开可用的数据集进行比较,所提出的方法比其他最先进的算法具有更好的性能,并且可以提取更少的有效特征。人工蜂群算法根据分类器的分类精度对个体(特征子集)进行评估,以达到最优的特征子集。此外,我们首次引入了一种策略,可以更快地自动选择搜索框架中的最佳分类器。通过与几个公开可用的数据集进行比较,所提出的方法比其他最先进的算法具有更好的性能,并且可以提取更少的有效特征。人工蜂群算法根据分类器的分类精度对个体(特征子集)进行评估,以达到最优的特征子集。此外,我们首次引入了一种策略,可以更快地自动选择搜索框架中的最佳分类器。通过与几个公开可用的数据集进行比较,所提出的方法比其他最先进的算法具有更好的性能,并且可以提取更少的有效特征。
更新日期:2020-07-07
down
wechat
bug