当前位置: X-MOL 学术Nat. Comput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Multi-region symbolic regression: combining functions under a multi-objective approach
Natural Computing ( IF 1.7 ) Pub Date : 2021-03-10 , DOI: 10.1007/s11047-021-09851-5
Felipe Casadei , Gisele L. Pappa

This paper introduces Multi-Region Symbolic Regression (MR-SR), a general framework that divides the original input data space of symbolic regression problems into subspaces (regions), generates different solutions to fit these regions and then combines them. MR-SR has three main components: (1) a strategy for finding the different regions of the data input space; (2) a method for generating the functions for each region; and (3) a strategy for combining the models found by (2). The main contribution of this paper is on how we generate the functions for each region. We model the function generation problem following a multi-objective approach, where each objective corresponds to the quality of the evolved function in a region, and the number of objectives is equal to the number of regions of the data input space. We test MR-SR in two scenarios with different objectives. In the first, we used the new approach to solve the symbolic regression problem with standard GP, with the main objective of reducing error rate. In the second, we took advantage of this method for a different purpose: to reduce the dimensionality of the semantic space of a variation of GP, namely Geometric Semantic Genetic Programming (GSGP). Results in 10 datasets showed that the method using clustering k-means and a model switching strategy—which makes predictions using the best evolved function for the region of interest—obtained better results in 5 out of 10 datasets for GP with 2 regions. For GSGP the framework was less effective due to the lack of diversity of the solutions evolved.



中文翻译:

多区域符号回归:在多目标方法下组合函数

本文介绍了多区域符号回归(MR-SR),它是将符号回归问题的原始输入数据空间划分为子空间(区域),生成适合这些区域的不同解决方案并将其组合的通用框架。MR-SR具有三个主要组成部分:(1)查找数据输入空间不同区域的策略;(2)一种用于产生每个区域的功能的方法;(3)合并由(2)找到的模型的策略。本文的主要贡献在于我们如何为每个区域生成函数。我们遵循多目标方法对函数生成问题进行建模,其中每个目标对应于一个区域中演化函数的质量,并且目标数等于数据输入空间的区域数。我们在具有不同目标的两种情况下测试MR-SR。首先,我们使用新方法来解决标准GP的符号回归问题,其主要目的是降低错误率。第二,我们利用此方法的另一个目的:减少GP变体的语义空间的维数,即几何语义遗传编程(GSGP)。10个数据集中的结果表明,使用聚类k均值和模型切换策略的方法(使用感兴趣区域的最佳演化函数进行预测)在10个数据集中的2个区域的10个数据集中有5个获得了更好的结果。对于GSGP而言,由于解决方案缺乏多样性,因此该框架的效果较差。我们使用新方法来解决标准GP的符号回归问题,其主要目的是减少错误率。第二,我们利用此方法的另一个目的:减少GP变体的语义空间的维数,即几何语义遗传编程(GSGP)。10个数据集中的结果表明,使用聚类k均值和模型切换策略的方法(使用感兴趣区域的最佳演化函数进行预测)在10个数据集中的2个区域的10个数据集中有5个获得了更好的结果。对于GSGP而言,由于解决方案缺乏多样性,因此该框架的效果较差。我们使用新方法来解决标准GP的符号回归问题,其主要目的是减少错误率。第二,我们利用此方法的另一个目的:减少GP变体的语义空间的维数,即几何语义遗传编程(GSGP)。10个数据集中的结果表明,使用聚类k均值和模型切换策略的方法(使用感兴趣区域的最佳演化函数进行预测)在10个数据集中的2个区域的10个数据集中有5个获得了更好的结果。对于GSGP而言,由于解决方案缺乏多样性,因此该框架的效果较差。以减少GP变体(即几何语义遗传编程(GSGP))的语义空间的维数。10个数据集中的结果表明,使用聚类k均值和模型切换策略的方法(使用感兴趣区域的最佳演化函数进行预测)在10个数据集中的2个区域的10个数据集中有5个获得了更好的结果。对于GSGP而言,由于解决方案缺乏多样性,因此该框架的效果较差。以减少GP变体(即几何语义遗传编程(GSGP))的语义空间的维数。10个数据集中的结果表明,使用聚类k均值和模型切换策略的方法(使用感兴趣区域的最佳演化函数进行预测)在10个数据集中的2个区域的10个数据集中有5个获得了更好的结果。对于GSGP而言,由于解决方案缺乏多样性,因此该框架的效果较差。

更新日期:2021-03-10
down
wechat
bug