当前位置: X-MOL 学术Stat. Med. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Handling missing predictor values when validating and applying a prediction model to new patients.
Statistics in Medicine ( IF 1.8 ) Pub Date : 2020-07-20 , DOI: 10.1002/sim.8682
Jeroen Hoogland 1 , Marit van Barreveld 2, 3 , Thomas P A Debray 1, 4 , Johannes B Reitsma 1, 4 , Tom E Verstraelen 3 , Marcel G W Dijkgraaf 2 , Aeilko H Zwinderman 2
Affiliation  

Missing data present challenges for development and real‐world application of clinical prediction models. While these challenges have received considerable attention in the development setting, there is only sparse research on the handling of missing data in applied settings. The main unique feature of handling missing data in these settings is that missing data methods have to be performed for a single new individual, precluding direct application of mainstay methods used during model development. Correspondingly, we propose that it is desirable to perform model validation using missing data methods that transfer to practice in single new patients. This article compares existing and new methods to account for missing data for a new individual in the context of prediction. These methods are based on (i) submodels based on observed data only, (ii) marginalization over the missing variables, or (iii) imputation based on fully conditional specification (also known as chained equations). They were compared in an internal validation setting to highlight the use of missing data methods that transfer to practice while validating a model. As a reference, they were compared to the use of multiple imputation by chained equations in a set of test patients, because this has been used in validation studies in the past. The methods were evaluated in a simulation study where performance was measured by means of optimism corrected C‐statistic and mean squared prediction error. Furthermore, they were applied in data from a large Dutch cohort of prophylactic implantable cardioverter defibrillator patients.

中文翻译:

在验证预测模型并将其应用于新患者时,处理缺失的预测值。

数据丢失给临床预测模型的开发和实际应用带来了挑战。尽管这些挑战在开发环境中受到了相当大的关注,但是对于在应用环境中处理丢失数据的研究很少。在这些设置中处理缺失数据的主要独特功能是必须针对单个新个体执行缺失数据方法,这不包括直接开发模型开发过程中使用的主体方法。相应地,我们建议使用丢失的数据方法执行模型验证,该方法可以转移到单个新患者中进行实践。本文比较了现有方法和新方法,以在预测的情况下解决新个人缺少的数据。这些方法基于(i)仅基于观测数据的子模型,(ii)对缺失变量的边际化,或(iii)基于完全条件规范(也称为链式方程)的推算。在内部验证设置中对它们进行了比较,以突出显示在验证模型时转移到实践中的缺失数据方法的使用。作为参考,将它们与在一组测试患者中通过链式方程使用多重插补进行了比较,因为过去已在验证研究中使用过这种插补。在模拟研究中对这些方法进行了评估,其中通过乐观校正的C统计量和均方预测误差来衡量性能。此外,它们还被用于荷兰的一组预防性植入式心脏复律除颤器患者的数据。或(iii)基于完全条件规范的估算(也称为链式方程)。在内部验证设置中对它们进行了比较,以突出显示在验证模型时转移到实践中的缺失数据方法的使用。作为参考,将它们与一组测试患者中通过链式方程使用多重插值进行了比较,因为过去这种方法已在验证研究中使用。在模拟研究中对这些方法进行了评估,其中通过乐观校正的C统计量和均方预测误差来衡量性能。此外,它们还被用于荷兰的一组预防性植入式心脏复律除颤器患者的数据。或(iii)基于完全条件规范的估算(也称为链式方程)。在内部验证设置中对它们进行了比较,以突出显示在验证模型时转移到实践中的缺失数据方法的使用。作为参考,将它们与在一组测试患者中通过链式方程使用多重插补进行了比较,因为过去已在验证研究中使用过这种插补。在模拟研究中对这些方法进行了评估,其中通过乐观校正的C统计量和均方预测误差来衡量性能。此外,它们还被用于荷兰的一组预防性植入式心脏复律除颤器患者的数据。在内部验证设置中对它们进行了比较,以突出显示在验证模型时转移到实践中的缺失数据方法的使用。作为参考,将它们与一组测试患者中通过链式方程使用多重插值进行了比较,因为过去这种方法已在验证研究中使用。在模拟研究中对这些方法进行了评估,其中通过乐观校正的C统计量和均方预测误差来衡量性能。此外,它们还被用于荷兰的一组预防性植入式心脏复律除颤器患者的数据。在内部验证设置中对它们进行了比较,以突出显示在验证模型时转移到实践中的缺失数据方法的使用。作为参考,将它们与一组测试患者中通过链式方程使用多重插值进行了比较,因为过去这种方法已在验证研究中使用。在模拟研究中对这些方法进行了评估,其中通过乐观校正的C统计量和均方预测误差来衡量性能。此外,它们还被用于荷兰的一组预防性植入式心脏复律除颤器患者的数据。在模拟研究中对这些方法进行了评估,其中通过乐观校正的C统计量和均方预测误差来衡量性能。此外,它们还被用于荷兰的一组预防性植入式心脏复律除颤器患者的数据。在模拟研究中对这些方法进行了评估,其中通过乐观校正的C统计量和均方预测误差来衡量性能。此外,它们还被用于荷兰的一组预防性植入式心脏复律除颤器患者的数据。
更新日期:2020-07-20
down
wechat
bug