当前位置: X-MOL 学术Genet. Epidemiol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Quantifying posterior effect size distribution of susceptibility loci by common summary statistics.
Genetic Epidemiology ( IF 2.1 ) Pub Date : 2020-02-25 , DOI: 10.1002/gepi.22286
Olga A Vsevolozhskaya 1 , Dmitri V Zaykin 2
Affiliation  

Testing millions of single nucleotide polymorphisms (SNPs) in genetic association studies has become a standard routine for disease gene discovery. In light of recent re-evaluation of statistical practice, it has been suggested that p-values are unfit as summaries of statistical evidence. Despite this criticism, p-values contain information that can be utilized to address the concerns about their flaws. We present a new method for utilizing evidence summarized by p-values for estimating odds ratio (OR) based on its approximate posterior distribution. In our method, only p-values, sample size, and standard deviation for ln(OR) are needed as summaries of data, accompanied by a suitable prior distribution for ln(OR) that can assume any shape. The parameter of interest, ln(OR), is the only parameter with a specified prior distribution, hence our model is a mix of classical and Bayesian approaches. We show that our method retains the main advantages of the Bayesian approach: it yields direct probability statements about hypotheses for OR and is resistant to biases caused by selection of top-scoring SNPs. Our method enjoys greater flexibility than similarly inspired methods in the assumed distribution for the summary statistic and in the form of the prior for the parameter of interest. We illustrate our method by presenting interval estimates of effect size for reported genetic associations with lung cancer. Although we focus on OR, the method is not limited to this particular measure of effect size and can be used broadly for assessing reliability of findings in studies testing multiple predictors.

中文翻译:

通过常见的汇总统计量化易感性位点的后验效应大小分布。

在遗传关联研究中测试数百万个单核苷酸多态性 (SNP) 已成为疾病基因发现的标准程序。鉴于最近对统计实践的重新评估,有人建议 p 值不适合作为统计证据的摘要。尽管有这种批评,p 值包含可用于解决对其缺陷的担忧的信息。我们提出了一种利用 p 值总结的证据的新方法,用于根据其近似后验分布估计优势比 (OR)。在我们的方法中,只需要 ln(OR) 的 p 值、样本大小和标准偏差作为数据摘要,并伴随 ln(OR) 的合适先验分布,该分布可以呈现任何形状。感兴趣的参数 ln(OR) 是唯一具有指定先验分布的参数,因此我们的模型是经典和贝叶斯方法的混合。我们表明,我们的方法保留了贝叶斯方法的主要优点:它产生了关于 OR 假设的直接概率陈述,并且能够抵抗由选择得分最高的 SNP 引起的偏差。我们的方法在汇总统计的假设分布和感兴趣参数的先验形式方面比类似启发的方法具有更大的灵活性。我们通过呈现报告的与肺癌的遗传关联的效应大小的区间估计来说明我们的方法。尽管我们专注于 OR,但该方法并不限于这种特定的效应大小测量,并且可以广泛用于评估测试多个预测变量的研究结果的可靠性。我们表明,我们的方法保留了贝叶斯方法的主要优点:它产生了关于 OR 假设的直接概率陈述,并且能够抵抗由选择得分最高的 SNP 引起的偏差。我们的方法在汇总统计的假设分布和感兴趣参数的先验形式方面比类似启发的方法具有更大的灵活性。我们通过呈现报告的与肺癌的遗传关联的效应大小的区间估计来说明我们的方法。尽管我们专注于 OR,但该方法并不限于这种特定的效应大小测量,并且可以广泛用于评估测试多个预测变量的研究结果的可靠性。我们表明,我们的方法保留了贝叶斯方法的主要优点:它产生了关于 OR 假设的直接概率陈述,并且能够抵抗由选择得分最高的 SNP 引起的偏差。我们的方法在汇总统计的假设分布和感兴趣参数的先验形式方面比类似启发的方法具有更大的灵活性。我们通过呈现报告的与肺癌的遗传关联的效应大小的区间估计来说明我们的方法。尽管我们专注于 OR,但该方法并不限于这种特定的效应大小测量,并且可以广泛用于评估测试多个预测变量的研究结果的可靠性。它产生关于 OR 假设的直接概率陈述,并且可以抵抗由选择得分最高的 SNP 引起的偏差。我们的方法在汇总统计的假设分布和感兴趣参数的先验形式方面比类似启发的方法具有更大的灵活性。我们通过呈现报告的与肺癌的遗传关联的效应大小的区间估计来说明我们的方法。尽管我们专注于 OR,但该方法并不限于这种特定的效应大小测量,并且可以广泛用于评估测试多个预测变量的研究结果的可靠性。它产生关于 OR 假设的直接概率陈述,并且可以抵抗由选择得分最高的 SNP 引起的偏差。我们的方法在汇总统计的假设分布和感兴趣参数的先验形式方面比类似启发的方法具有更大的灵活性。我们通过呈现报告的与肺癌的遗传关联的效应大小的区间估计来说明我们的方法。尽管我们专注于 OR,但该方法并不限于这种特定的效应大小测量,并且可以广泛用于评估测试多个预测变量的研究结果的可靠性。我们通过呈现报告的与肺癌的遗传关联的效应大小的区间估计来说明我们的方法。尽管我们专注于 OR,但该方法并不限于这种特定的效应大小测量,并且可以广泛用于评估测试多个预测变量的研究结果的可靠性。我们通过呈现报告的与肺癌的遗传关联的效应大小的区间估计来说明我们的方法。尽管我们专注于 OR,但该方法并不限于这种特定的效应大小测量,并且可以广泛用于评估测试多个预测变量的研究结果的可靠性。
更新日期:2020-02-25
down
wechat
bug