当前位置: X-MOL 学术Int. J. Biostat. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Super Learner for Survival Data Prediction
International Journal of Biostatistics ( IF 1.2 ) Pub Date : 2020-11-01 , DOI: 10.1515/ijb-2019-0065
Marzieh K Golmakani 1 , Eric C Polley 2
Affiliation  

Survival analysis is a widely used method to establish a connection between a time to event outcome and a set of potential covariates. Accurately predicting the time of an event of interest is of primary importance in survival analysis. Many different algorithms have been proposed for survival prediction. However, for a given prediction problem it is rarely, if ever, possible to know in advance which algorithm will perform the best. In this paper we propose two algorithms for constructing super learners in survival data prediction where the individual algorithms are based on proportional hazards. A super learner is a flexible approach to statistical learning that finds the best weighted ensemble of the individual algorithms. Finding the optimal combination of the individual algorithms through minimizing cross-validated risk controls for over-fitting of the final ensemble learner. Candidate algorithms may range from a basic Cox model to tree-based machine learning algorithms, assuming all candidate algorithms are based on the proportional hazards framework. The ensemble weights are estimated by minimizing the cross-validated negative log partial likelihood. We compare the performance of the proposed super learners with existing models through extensive simulation studies. In all simulation scenarios, the proposed super learners are either the best fit or near the best fit. The performances of the newly proposed algorithms are also demonstrated with clinical data examples.

中文翻译:

生存数据预测的超级学习者

生存分析是一种广泛使用的方法,可以在事件发生时间与一组潜在协变量之间建立联系。准确预测感兴趣事件的时间在生存分析中至关重要。已经提出了许多不同的算法来进行生存预测。但是,对于给定的预测问题,很少(如果有的话)事先知道哪种算法将表现最佳。在本文中,我们提出了两种用于在生存数据预测中构建超级学习者的算法,其中各个算法均基于比例风险。超级学习者是一种灵活的统计学习方法,可以找到各个算法的最佳加权集合。通过最小化交叉验证的风险控制来找到单个算法的最佳组合,以防止最终合奏学习者的过度拟合。假设所有候选算法都基于比例风险框架,则候选算法的范围可能从基本的Cox模型到基于树的机器学习算法。通过最小化交叉验证的负对数偏似然性来估计整体权重。通过广泛的仿真研究,我们将建议的超级学习者与现有模型的性能进行了比较。在所有模拟场景中,建议的超级学习者都是最佳拟合或接近最佳拟合。新提出的算法的性能还通过临床数据示例进行了演示。假设所有候选算法都基于比例风险框架,则候选算法的范围可能从基本的Cox模型到基于树的机器学习算法。通过最小化交叉验证的负对数偏似然性来估计整体权重。通过广泛的仿真研究,我们将建议的超级学习者与现有模型的性能进行了比较。在所有模拟场景中,建议的超级学习者都是最佳拟合或接近最佳拟合。新提出的算法的性能还通过临床数据示例进行了演示。假设所有候选算法都基于比例风险框架,则候选算法的范围可能从基本的Cox模型到基于树的机器学习算法。通过最小化交叉验证的负对数偏似然性来估计整体权重。通过广泛的仿真研究,我们将建议的超级学习者与现有模型的性能进行了比较。在所有模拟场景中,建议的超级学习者都是最佳拟合或接近最佳拟合。新提出的算法的性能还通过临床数据示例进行了演示。通过广泛的仿真研究,我们将建议的超级学习者与现有模型的性能进行了比较。在所有模拟场景中,建议的超级学习者都是最佳拟合或接近最佳拟合。新提出的算法的性能还通过临床数据示例进行了演示。通过广泛的仿真研究,我们将建议的超级学习者与现有模型的性能进行了比较。在所有模拟场景中,建议的超级学习者都是最佳拟合或接近最佳拟合。新提出的算法的性能还通过临床数据示例进行了演示。
更新日期:2020-11-01
down
wechat
bug