当前位置: X-MOL 学术Mach. Learn. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
An empirical analysis of binary transformation strategies and base algorithms for multi-label learning
Machine Learning ( IF 4.3 ) Pub Date : 2020-06-10 , DOI: 10.1007/s10994-020-05879-3
Adriano Rivolli , Jesse Read , Carlos Soares , Bernhard Pfahringer , André C. P. L. F. de Carvalho

Investigating strategies that are able to efficiently deal with multi-label classification tasks is a current research topic in machine learning. Many methods have been proposed, making the selection of the most suitable strategy a challenging issue. From this premise, this paper presents an extensive empirical analysis of the binary transformation strategies and base algorithms for multi-label learning. This subset of strategies uses the one-versus-all approach to transform the original data, generating one binary data set per label, upon which any binary base algorithm can be applied. Considering that the influence of the base algorithm on the predictive performance obtained by the strategies has not been considered in depth by many empirical studies, we investigated the influence of distinct base algorithms on the performance of several strategies. Thus, this study covers a family of multi-label strategies using a diversified range of base algorithms, exploring their relationship over different perspectives. This finding has significant implications concerning the methodology of evaluation adopted in multi-label experiments containing binary transformation strategies, given that multiple base algorithms should be considered. Despite these improvements in strategy and base algorithms, for many data sets, a large number of labels, mainly those less frequent, were either never predicted, or always misclassified. We conclude the experimental analysis by recommending strategies and base algorithms in accordance with different performance criteria.

中文翻译:

多标签学习的二元变换策略和基础算法的实证分析

研究能够有效处理多标签分类任务的策略是机器学习的当前研究课题。已经提出了许多方法,使得选择最合适的策略成为一个具有挑战性的问题。在此前提下,本文对多标签学习的二元转换策略和基本算法进行了广泛的实证分析。这个策略子集使用一对多的方法来转换原始数据,为每个标签生成一个二进制数据集,可以应用任何二进制基础算法。考虑到基础算法对策略获得的预测性能的影响,很多实证研究没有深入考虑,我们研究了不同的基础算法对几种策略性能的影响。因此,本研究涵盖了一系列使用多种基础算法的多标签策略,从不同角度探索了它们之间的关系。鉴于应考虑多种基本算法,这一发现对包含二进制转换策略的多标签实验中采用的评估方法具有重要意义。尽管在策略和基础算法方面有这些改进,但对于许多数据集,大量标签,主要是那些不太频繁的标签,要么从未被预测,要么总是被错误分类。我们通过根据不同的性能标准推荐策略和基本算法来结束实验分析。这项研究涵盖了一系列使用多种基础算法的多标签策略,从不同角度探索了它们之间的关系。鉴于应考虑多种基本算法,这一发现对包含二进制转换策略的多标签实验中采用的评估方法具有重要意义。尽管在策略和基础算法方面有这些改进,但对于许多数据集,大量标签,主要是那些不太频繁的标签,要么从未被预测,要么总是被错误分类。我们通过根据不同的性能标准推荐策略和基本算法来结束实验分析。这项研究涵盖了一系列使用多种基础算法的多标签策略,从不同角度探索了它们之间的关系。鉴于应考虑多种基本算法,这一发现对包含二进制转换策略的多标签实验中采用的评估方法具有重要意义。尽管在策略和基础算法方面有这些改进,但对于许多数据集,大量标签,主要是那些不太频繁的标签,要么从未被预测,要么总是被错误分类。我们通过根据不同的性能标准推荐策略和基本算法来结束实验分析。鉴于应考虑多种基本算法,这一发现对包含二进制转换策略的多标签实验中采用的评估方法具有重要意义。尽管在策略和基础算法方面有这些改进,但对于许多数据集,大量标签,主要是那些不太频繁的标签,要么从未被预测,要么总是被错误分类。我们通过根据不同的性能标准推荐策略和基本算法来结束实验分析。鉴于应考虑多种基本算法,这一发现对包含二进制转换策略的多标签实验中采用的评估方法具有重要意义。尽管在策略和基础算法方面有这些改进,但对于许多数据集,大量标签,主要是那些不太频繁的标签,要么从未被预测,要么总是被错误分类。我们通过根据不同的性能标准推荐策略和基本算法来结束实验分析。要么从未预测过,要么总是被错误分类。我们通过根据不同的性能标准推荐策略和基本算法来结束实验分析。要么从未预测过,要么总是被错误分类。我们通过根据不同的性能标准推荐策略和基本算法来结束实验分析。
更新日期:2020-06-10
down
wechat
bug