当前位置: X-MOL 学术Entropy › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Machine Learning Based Automated Segmentation and Hybrid Feature Analysis for Diabetic Retinopathy Classification Using Fundus Image
Entropy ( IF 2.1 ) Pub Date : 2020-05-19 , DOI: 10.3390/e22050567
Aqib Ali , Salman Qadri , Wali Khan Mashwani , Wiyada Kumam , Poom Kumam , Samreen Naeem , Atila Goktas , Farrukh Jamal , Christophe Chesneau , Sania Anam , Muhammad Sulaiman

The object of this study was to demonstrate the ability of machine learning (ML) methods for the segmentation and classification of diabetic retinopathy (DR). Two-dimensional (2D) retinal fundus (RF) images were used. The datasets of DR—that is, the mild, moderate, non-proliferative, proliferative, and normal human eye ones—were acquired from 500 patients at Bahawal Victoria Hospital (BVH), Bahawalpur, Pakistan. Five hundred RF datasets (sized 256 × 256) for each DR stage and a total of 2500 (500 × 5) datasets of the five DR stages were acquired. This research introduces the novel clustering-based automated region growing framework. For texture analysis, four types of features—histogram (H), wavelet (W), co-occurrence matrix (COM) and run-length matrix (RLM)—were extracted, and various ML classifiers were employed, achieving 77.67%, 80%, 89.87%, and 96.33% classification accuracies, respectively. To improve classification accuracy, a fused hybrid-feature dataset was generated by applying the data fusion approach. From each image, 245 pieces of hybrid feature data (H, W, COM, and RLM) were observed, while 13 optimized features were selected after applying four different feature selection techniques, namely Fisher, correlation-based feature selection, mutual information, and probability of error plus average correlation. Five ML classifiers named sequential minimal optimization (SMO), logistic (Lg), multi-layer perceptron (MLP), logistic model tree (LMT), and simple logistic (SLg) were deployed on selected optimized features (using 10-fold cross-validation), and they showed considerably high classification accuracies of 98.53%, 99%, 99.66%, 99.73%, and 99.73%, respectively.

中文翻译:

基于机器学习的基于眼底图像的糖尿病视网膜病变分类的自动分割和混合特征分析

本研究的目的是展示机器学习 (ML) 方法对糖尿病视网膜病变 (DR) 进行分割和分类的能力。使用二维 (2D) 视网膜眼底 (RF) 图像。DR 的数据集——即轻度、中度、非增殖性、增殖性和正常人眼的数据集——来自巴基斯坦巴哈瓦尔布尔 Bahawal Victoria Hospital (BVH) 的 500 名患者。获得了每个 DR 阶段的 500 个 RF 数据集(大小为 256 × 256)和五个 DR 阶段的总共 2500 个(500 × 5)数据集。本研究介绍了新的基于聚类的自动区域增长框架。对于纹理分析,提取了直方图 (H)、小波 (W)、共生矩阵 (COM) 和游程矩阵 (RLM) 四种特征,并采用了各种 ML 分类器,分别达到 77.67%、80 %, 89.87%, 和 96.33% 的分类准确率。为了提高分类精度,通过应用数据融合方法生成融合的混合特征数据集。从每张图像中,观察到 245 条混合特征数据(H、W、COM 和 RLM),并在应用四种不同的特征选择技术后选择了 13 个优化特征,即 Fisher、基于相关的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。分别为 33% 的分类准确率。为了提高分类精度,通过应用数据融合方法生成融合的混合特征数据集。从每张图像中,观察到 245 条混合特征数据(H、W、COM 和 RLM),并在应用四种不同的特征选择技术后选择了 13 个优化特征,即 Fisher、基于相关的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。分别为 33% 的分类准确率。为了提高分类精度,通过应用数据融合方法生成融合的混合特征数据集。从每张图像中,观察到 245 条混合特征数据(H、W、COM 和 RLM),并在应用四种不同的特征选择技术后选择了 13 个优化特征,即 Fisher、基于相关的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。分别。为了提高分类精度,通过应用数据融合方法生成融合的混合特征数据集。从每张图像中,观察到 245 条混合特征数据(H、W、COM 和 RLM),并在应用四种不同的特征选择技术后选择了 13 个优化特征,即 Fisher、基于相关的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。分别。为了提高分类精度,通过应用数据融合方法生成融合的混合特征数据集。从每张图像中,观察到 245 条混合特征数据(H、W、COM 和 RLM),并在应用四种不同的特征选择技术后选择了 13 个优化特征,即 Fisher、基于相关的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。通过应用数据融合方法生成融合的混合特征数据集。从每张图像中,观察到 245 条混合特征数据(H、W、COM 和 RLM),并在应用四种不同的特征选择技术后选择了 13 个优化特征,即 Fisher、基于相关的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。通过应用数据融合方法生成融合的混合特征数据集。从每张图像中,观察到 245 条混合特征数据(H、W、COM 和 RLM),并在应用四种不同的特征选择技术后选择了 13 个优化特征,即 Fisher、基于相关的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。观察到245条混合特征数据(H、W、COM和RLM),应用Fisher、基于相关性的特征选择、互信息和错误概率加4种不同的特征选择技术后,选出了13个优化的特征。平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。观察到245条混合特征数据(H、W、COM和RLM),应用Fisher、基于相关性的特征选择、互信息和错误概率加4种不同的特征选择技术后,选出了13个优化的特征。平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。基于相关性的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。基于相关性的特征选择、互信息和错误概率加上平均相关性。在选定的优化特征上部署了五个名为顺序最小优化 (SMO)、逻辑 (Lg)、多层感知器 (MLP)、逻辑模型树 (LMT) 和简单逻辑 (SLg) 的 ML 分类器(使用 10 倍交叉验证),它们分别显示出相当高的分类准确率,分别为 98.53%、99%、99.66%、99.73% 和 99.73%。
更新日期:2020-05-19
down
wechat
bug