当前位置: X-MOL 学术Stat. Med. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Multinomial logistic regression with missing outcome data: An application to cancer subtypes.
Statistics in Medicine ( IF 2 ) Pub Date : 2020-07-06 , DOI: 10.1002/sim.8666
Ching-Yun Wang 1 , Li Hsu 1
Affiliation  

Many diseases such as cancer and heart diseases are heterogeneous and it is of great interest to study the disease risk specific to the subtypes in relation to genetic and environmental risk factors. However, due to logistic and cost reasons, the subtype information for the disease is missing for some subjects. In this article, we investigate methods for multinomial logistic regression with missing outcome data, including a bootstrap hot deck multiple imputation (BHMI), simple inverse probability weighted (SIPW), augmented inverse probability weighted (AIPW), and expected estimating equation (EEE) estimators. These methods are important approaches for missing data regression. The BHMI modifies the standard hot deck multiple imputation method such that it can provide valid confidence interval estimation. Under the situation when the covariates are discrete, the SIPW, AIPW, and EEE estimators are numerically identical. When the covariates are continuous, nonparametric smoothers can be applied to estimate the selection probabilities and the estimating scores. These methods perform similarly. Extensive simulations show that all of these methods yield unbiased estimators while the complete‐case (CC) analysis can be biased if the missingness depends on the observed data. Our simulations also demonstrate that these methods can gain substantial efficiency compared with the CC analysis. The methods are applied to a colorectal cancer study in which cancer subtype data are missing among some study individuals.

中文翻译:

缺失结果数据的多项逻辑回归:对癌症亚型的应用。

许多疾病(如癌症和心脏病)具有异质性,因此研究与遗传和环境风险因素相关的亚型特有的疾病风险具有重要意义。然而,由于物流和成本原因,某些受试者缺少该疾病的亚型信息。在本文中,我们研究了缺失结果数据的多项逻辑回归方法,包括引导热甲板多重插补 (BHMI)、简单逆概率加权 (SIPW)、增强逆概率加权 (AIPW) 和预期估计方程 (EEE)估计器。这些方法是缺失数据回归的重要方法。BHMI 修改了标准热甲板多重插补方法,使其可以提供有效的置信区间估计。在协变量离散的情况下,SIPW、AIPW 和 EEE 估计量在数值上是相同的。当协变量是连续的时,可以应用非参数平滑器来估计选择概率和估计分数。这些方法的表现类似。广泛的模拟表明,所有这些方法都会产生无偏估计,而如果缺失取决于观察到的数据,则完整案例 (CC) 分析可能有偏。我们的模拟还表明,与 CC 分析相比,这些方法可以获得显着的效率。该方法应用于结肠直肠癌研究,其中一些研究个体中缺少癌症亚型数据。可以应用非参数平滑器来估计选择概率和估计分数。这些方法的表现类似。广泛的模拟表明,所有这些方法都会产生无偏估计,而如果缺失取决于观察到的数据,则完整案例 (CC) 分析可能有偏。我们的模拟还表明,与 CC 分析相比,这些方法可以获得显着的效率。该方法应用于结肠直肠癌研究,其中一些研究个体中缺少癌症亚型数据。可以应用非参数平滑器来估计选择概率和估计分数。这些方法的表现类似。广泛的模拟表明,所有这些方法都会产生无偏估计,而如果缺失取决于观察到的数据,则完整案例 (CC) 分析可能有偏。我们的模拟还表明,与 CC 分析相比,这些方法可以获得显着的效率。该方法应用于结肠直肠癌研究,其中一些研究个体中缺少癌症亚型数据。我们的模拟还表明,与 CC 分析相比,这些方法可以获得显着的效率。该方法应用于结肠直肠癌研究,其中一些研究个体中缺少癌症亚型数据。我们的模拟还表明,与 CC 分析相比,这些方法可以获得显着的效率。该方法应用于结肠直肠癌研究,其中一些研究个体中缺少癌症亚型数据。
更新日期:2020-07-06
down
wechat
bug