当前位置: X-MOL 学术Pattern Recogn. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A reduced universum twin support vector machine for class imbalance learning
Pattern Recognition ( IF 8 ) Pub Date : 2020-06-01 , DOI: 10.1016/j.patcog.2019.107150
B. Richhariya , M. Tanveer

Abstract In most of the real world datasets, there is an imbalance in the number of samples belonging to different classes. Various pattern classification problems such as fault or disease detection involve class imbalanced data. The support vector machine (SVM) classifier becomes biased towards the majority class due to class imbalance. Moreover, in the existing SVM based techniques for class imbalance, there is no information about the distribution of data. Motivated by the idea of prior information about data distribution, a reduced universum twin support vector machine for class imbalance learning (RUTSVM-CIL) is proposed in this paper. For the first time, universum learning is incorporated with SVM to solve the problem of class imbalance. Oversampling and undersampling of data is performed to remove the imbalance in the classes. The universum data points are used to give prior information about the data. To reduce the computation time of our universum based algorithm, we use a small sized rectangular kernel matrix. The reduced kernel matrix needs less storage space, and thus applicable for large scale imbalanced datasets. Comprehensive experimentation is performed on various synthetic, real world and large scale imbalanced datasets. In comparison to the existing approaches for class imbalance, the proposed RUTSVM-CIL gives better generalization performance for most of the benchmark datasets. Also, the computation cost of RUTSVM-CIL is very less, making it suitable for real world applications.

中文翻译:

用于类不平衡学习的简化的universum孪生支持向量机

摘要 在大多数现实世界的数据集中,属于不同类别的样本数量存在不平衡。各种模式分类问题,例如故障或疾病检测,都涉及类不平衡数据。由于类不平衡,支持向量机 (SVM) 分类器变得偏向于多数类。此外,在现有的基于 SVM 的类不平衡技术中,没有关于数据分布的信息。受数据分布先验信息思想的启发,本文提出了一种用于类不平衡学习的简化通用孪生支持向量机(RUTSVM-CIL)。首次将 universum learning 与 SVM 结合来解决类不平衡问题。执行数据的过采样和欠采样以消除类中的不平衡。universum 数据点用于提供有关数据的先验信息。为了减少我们基于 universum 的算法的计算时间,我们使用了一个小尺寸的矩形核矩阵。缩减的核矩阵需要更少的存储空间,因此适用于大规模不平衡数据集。对各种合成、真实世界和大规模不平衡数据集进行了综合实验。与现有的类不平衡方法相比,所提出的 RUTSVM-CIL 为大多数基准数据集提供了更好的泛化性能。此外,RUTSVM-CIL 的计算成本非常低,使其适用于现实世界的应用。缩减的核矩阵需要更少的存储空间,因此适用于大规模不平衡数据集。对各种合成、真实世界和大规模不平衡数据集进行了综合实验。与现有的类不平衡方法相比,所提出的 RUTSVM-CIL 为大多数基准数据集提供了更好的泛化性能。此外,RUTSVM-CIL 的计算成本非常低,使其适用于现实世界的应用。缩减的核矩阵需要更少的存储空间,因此适用于大规模不平衡数据集。对各种合成、真实世界和大规模不平衡数据集进行了综合实验。与现有的类不平衡方法相比,所提出的 RUTSVM-CIL 为大多数基准数据集提供了更好的泛化性能。此外,RUTSVM-CIL 的计算成本非常低,使其适用于现实世界的应用。提出的 RUTSVM-CIL 为大多数基准数据集提供了更好的泛化性能。此外,RUTSVM-CIL 的计算成本非常低,使其适用于现实世界的应用。提出的 RUTSVM-CIL 为大多数基准数据集提供了更好的泛化性能。此外,RUTSVM-CIL 的计算成本非常低,使其适用于现实世界的应用。
更新日期:2020-06-01
down
wechat
bug