Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
The diagnosis of ASD using multiple machine learning techniques
International Journal of Developmental Disabilities ( IF 2.170 ) Pub Date : 2021-06-10 , DOI: 10.1080/20473869.2021.1933730
Chandan Jyoti Kumar 1 , Priti Rekha Das 2
Affiliation  

Autism Spectrum Disorder (ASD) is a highly heterogeneous set of neurodevelopmental disorders with the global prevalence estimates of 2.20%, according to DSM5 criteria. With the advancements of technology and availability of huge amount of data, assistive tools for diagnosis of ASD are being developed using machine learning techniques. The present study examines the possibility of automating the Autism diagnostic tool using various machine learning techniques on a dataset of 701 samples that contains 10 fields from AQ-10-Adult and 10 from individual characteristics. It takes two scenarios into consideration. First one is ideal case, where there are no missing values in the test cases. In this case Artificial Neural Network (ANN), Support Vector Machine (SVM) and Random Forest (RF) classifiers are trained and tested on the pre-processed dataset. To reduce computational complexity Recursive Feature Elimination (RFE) based feature selection algorithm is applied. To deal with the real-world data, in the second case missing values are introduced in the test dataset for the fields’ ‘age’, ‘gender’, ‘jaundice’, ‘autism’, ‘used_app_before’ and their three combinations. Support Vector Machine, Random Forest, Decision Tree and Logistic Regression based RFE algorithm is introduced to handle this scenario. ANN, SVM and RF classifier based learning models are trained with all the cases. Twelve classification models were generated with RFE, out of which best performing models specific to missing value were evaluated using test cases and suggested for ASD Diagnosis.



中文翻译:

使用多种机器学习技术诊断 ASD

自闭症谱系障碍 (ASD) 是一组高度异质的神经发育障碍,根据 DSM5 标准,全球患病率估计为 2.20%。随着技术的进步和大量数据的可用性,正在使用机器学习技术开发用于诊断 ASD 的辅助工具。本研究检验了使用各种机器学习技术在包含 701 个样本的数据集上自动化自闭症诊断工具的可能性,该数据集包含来自 AQ-10-Adult 的 10 个字段和来自个人特征的 10 个字段。它考虑了两种情况。第一个是理想情况,测试用例中没有缺失值。在这种情况下,人工神经网络 (ANN)、支持向量机 (SVM) 和随机森林 (RF) 分类器在预处理数据集上进行训练和测试。为了降低计算复杂度,应用了基于递归特征消除 (RFE) 的特征选择算法。为了处理真实世界的数据,在第二种情况下,在测试数据集中为字段“年龄”、“性别”、“黄疸”、“自闭症”、“使用过的应用程序之前”及其三个组合引入了缺失值。支持向量机、随机森林、决策树和基于逻辑回归的 RFE 算法被引入来处理这种情况。基于 ANN、SVM 和 RF 分类器的学习模型接受了所有案例的训练。使用 RFE 生成了 12 个分类模型,其中针对缺失值的最佳性能模型使用测试用例进行了评估,并建议用于 ASD 诊断。为了处理真实世界的数据,在第二种情况下,在测试数据集中为字段“年龄”、“性别”、“黄疸”、“自闭症”、“使用过的应用程序之前”及其三个组合引入了缺失值。支持向量机、随机森林、决策树和基于逻辑回归的 RFE 算法被引入来处理这种情况。基于 ANN、SVM 和 RF 分类器的学习模型接受了所有案例的训练。使用 RFE 生成了 12 个分类模型,其中针对缺失值的最佳性能模型使用测试用例进行了评估,并建议用于 ASD 诊断。为了处理真实世界的数据,在第二种情况下,在测试数据集中为字段“年龄”、“性别”、“黄疸”、“自闭症”、“使用过的应用程序之前”及其三个组合引入了缺失值。支持向量机、随机森林、决策树和基于逻辑回归的 RFE 算法被引入来处理这种情况。基于 ANN、SVM 和 RF 分类器的学习模型接受了所有案例的训练。使用 RFE 生成了 12 个分类模型,其中针对缺失值的最佳性能模型使用测试用例进行了评估,并建议用于 ASD 诊断。引入基于决策树和逻辑回归的 RFE 算法来处理这种情况。基于 ANN、SVM 和 RF 分类器的学习模型接受了所有案例的训练。使用 RFE 生成了 12 个分类模型,其中针对缺失值的最佳性能模型使用测试用例进行了评估,并建议用于 ASD 诊断。引入基于决策树和逻辑回归的 RFE 算法来处理这种情况。基于 ANN、SVM 和 RF 分类器的学习模型接受了所有案例的训练。使用 RFE 生成了 12 个分类模型,其中针对缺失值的最佳性能模型使用测试用例进行了评估,并建议用于 ASD 诊断。

更新日期:2021-06-10
down
wechat
bug