当前位置: X-MOL 学术Stat. Anal. Data Min. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Cross-validation and Peeling Strategies for Survival Bump Hunting using Recursive Peeling Methods.
Statistical Analysis and Data Mining ( IF 1.3 ) Pub Date : 2016-01-22 , DOI: 10.1002/sam.11301
Jean-Eudes Dazard 1 , Michael Choe 1 , Michael LeBlanc 2 , J Sunil Rao 3
Affiliation  

We introduce a framework to build a survival/risk bump hunting model with a censored time‐to‐event response. Our survival bump hunting (SBH) method is based on a recursive peeling procedure that uses a specific survival peeling criterion derived from non‐/semi‐parametric statistics such as the hazard ratio, the log‐rank test or the Nelson–Aalen estimator. To optimize the tuning parameter of the model and validate it, we introduce an objective function based on survival‐ or prediction‐error statistics, such as the log‐rank test and the concordance error rate. We also describe two alternative cross‐validation techniques adapted for the joint task of decision‐rule making by recursive peeling and survival estimation. Numerical analyses show the importance of replicated cross‐validation and the differences between criteria and techniques in both low‐ and high‐dimensional settings. Although several non‐parametric survival models exist, none address the problem of directly identifying local extrema. We show how SBH efficiently estimates extreme survival/risk subgroups, unlike other models. This provides an insight into the behavior of commonly used models and suggests alternatives to be adopted in practice. Finally, our SBH framework was applied to a clinical dataset. In it, we identified subsets of patients characterized by clinical and demographic covariates with a distinct extreme survival outcome for which tailored medical interventions could be made. An R package Patient Rule Induction Method in Survival, Regression and Classification settings (PRIMsrc) is available on Comprehensive R Archive Network (CRAN) and GitHub.

中文翻译:

使用递归剥离方法进行生存颠簸狩猎的交叉验证和剥离策略。

我们引入了一个框架,该框架构建了带有审查时间到事件响应的生存/风险突击搜寻模型。我们的生存颠簸搜寻(SBH)方法是基于递归剥离过程的,该过程使用从非/半参数统计数据(例如危险比,对数秩检验或Nelson-Aalen估计量)得出的特定生存剥离标准。为了优化模型的调整参数并对其进行验证,我们引入了基于生存或预测误差统计量的目标函数,例如对数秩检验和一致性误差率。我们还描述了两种可选的交叉验证技术,这些技术适用于通过递归剥离和生存估计制定决策规则的联合任务。数值分析表明了重复交叉验证的重要性以及在低维和高维环境中标准和技术之间的差异。尽管存在几种非参数的生存模型,但没有一个模型能够直接识别局部极值。与其他模型不同,我们展示了SBH如何有效地估计极端生存/风险亚组。这可以深入了解常用模型的行为,并建议在实践中采用的替代方法。最后,我们的SBH框架被应用于临床数据集。在其中,我们确定了具有临床和人口统计学协变量特征的患者子集,这些患者子集具有明显的极端生存结果,可以针对这些患者进行量身定制的医学干预。生存,回归和分类设置中的R包患者规则归纳方法(没有一个解决直接识别局部极值的问题。与其他模型不同,我们展示了SBH如何有效地估计极端生存/风险亚组。这可以深入了解常用模型的行为,并建议在实践中采用的替代方法。最后,我们的SBH框架被应用于临床数据集。在其中,我们确定了具有临床和人口统计学协变量特征的患者子集,这些患者子集具有明显的极端生存结果,可以针对这些患者进行量身定制的医学干预。生存,回归和分类设置中的R包患者规则归纳方法(没有一个解决直接识别局部极值的问题。与其他模型不同,我们展示了SBH如何有效地估计极端生存/风险亚组。这可以深入了解常用模型的行为,并建议在实践中采用的替代方法。最后,我们的SBH框架被应用于临床数据集。在其中,我们确定了具有临床和人口统计学协变量特征的患者子集,这些患者子集具有明显的极端生存结果,可以针对这些患者进行量身定制的医学干预。生存,回归和分类设置中的R包患者规则归纳方法(这可以深入了解常用模型的行为,并建议在实践中采用的替代方法。最后,我们的SBH框架被应用于临床数据集。在其中,我们确定了具有临床和人口统计学协变量特征的患者子集,这些患者子集具有明显的极端生存结果,可以针对这些患者进行量身定制的医学干预。生存,回归和分类设置中的R包患者规则归纳方法(这可以深入了解常用模型的行为,并建议在实践中采用的替代方法。最后,我们的SBH框架被应用于临床数据集。在其中,我们确定了具有临床和人口统计学协变量特征的患者子集,这些患者子集具有明显的极端生存结果,可以针对这些患者进行量身定制的医学干预。生存,回归和分类设置中的R包患者规则归纳方法(可在Composite R Archive Network(CRAN)和GitHub上找到PRIMsrc)。
更新日期:2016-01-22
down
wechat
bug