当前位置: X-MOL 学术Complex Intell. Syst. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Genetic programming with separability detection for symbolic regression
Complex & Intelligent Systems ( IF 5.8 ) Pub Date : 2021-01-04 , DOI: 10.1007/s40747-020-00240-6
Wei-Li Liu , Jiaquan Yang , Jinghui Zhong , Shibin Wang

Genetic Programming (GP) is a popular and powerful evolutionary optimization algorithm that has a wide range of applications such as symbolic regression, classification and program synthesis. However, existing GPs often ignore the intrinsic structure of the ground truth equation of the symbolic regression problem. To improve the search efficacy of GP on symbolic regression problems by fully exploiting the intrinsic structure information, this paper proposes a genetic programming with separability detection technique (SD-GP). In the proposed SD-GP, a separability detection method is proposed to detect additive separable characteristics of input features from the observed data. Then based on the separability detection results, a chromosome representation is proposed, which utilizes multiple sub chromosomes to represent the final solution. Some sub chromosomes are used to construct separable sub functions by using separate input features, while the other sub chromosomes are used to construct sub functions by using all input features. The final solution is the weighted sum of all sub functions, and the optimal weights of sub functions are obtained by using the least squares method. In this way, the structure information can be learnt and the global search ability of GP can be maintained. Experimental results on synthetic problems with differing characteristics have demonstrated that the proposed SD-GP can perform better than several state-of-the-art GPs in terms of the success rate of finding the optimal solution and the convergence speed.



中文翻译:

具有可分离性检测的遗传编程用于符号回归

遗传编程(GP)是一种流行且功能强大的进化优化算法,具有广泛的应用,例如符号回归,分类和程序合成。但是,现有的GP经常会忽略符号回归问题的地面真理方程的内在结构。为了充分利用内在结构信息来提高GP在符号回归问题上的搜索效率,本文提出了一种具有可分离性检测技术(SD-GP)的遗传程序。在提出的SD-GP中,提出了一种可分离性检测方法,用于从观测数据中检测输入特征的加性可分离特征。然后根据可分离性检测结果,提出了一种染色体表示方法,该方法利用多个亚染色体代表最终溶液。一些子染色体用于通过使用单独的输入特征来构建可分离的子功能,而其他子染色体用于通过使用所有输入特征来构建子功能。最终的解决方案是所有子函数的加权和,并使用最小二乘法获得子函数的最佳权重。这样,可以学习结构信息,并可以保持GP的全局搜索能力。针对具有不同特征的合成问题的实验结果表明,就找到最佳解的成功率和收敛速度而言,所提出的SD-GP的性能优于几种最新的GP。而其他子染色体则通过使用所有输入特征来构建子功能。最终的解决方案是所有子函数的加权和,并使用最小二乘法获得子函数的最佳权重。这样,可以学习结构信息,并可以保持GP的全局搜索能力。针对具有不同特征的合成问题的实验结果表明,就找到最佳解的成功率和收敛速度而言,所提出的SD-GP的性能优于几种最新的GP。而其他子染色体则通过使用所有输入特征来构建子功能。最终的解决方案是所有子函数的加权和,并使用最小二乘法获得子函数的最佳权重。这样,可以学习结构信息,并可以保持GP的全局搜索能力。针对具有不同特征的合成问题的实验结果表明,就找到最佳解的成功率和收敛速度而言,所提出的SD-GP的性能优于几种最新的GP。可以学习结构信息,可以保持GP的全局搜索能力。针对具有不同特征的合成问题的实验结果表明,就找到最佳解的成功率和收敛速度而言,所提出的SD-GP的性能优于几种最新的GP。可以学习结构信息,可以保持GP的全局搜索能力。针对具有不同特征的合成问题的实验结果表明,就找到最佳解的成功率和收敛速度而言,所提出的SD-GP的性能优于几种最新的GP。

更新日期:2021-01-05
down
wechat
bug