当前位置: X-MOL 学术J. Comput. Biol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Potpourri: An Epistasis Test Prioritization Algorithm via Diverse SNP Selection
Journal of Computational Biology ( IF 1.7 ) Pub Date : 2021-04-20 , DOI: 10.1089/cmb.2020.0429
Gizem Caylak 1 , Oznur Tastan 2 , A Ercument Cicek 1, 3
Affiliation  

Genome-wide association studies (GWAS) explain a fraction of the underlying heritability of genetic diseases. Investigating epistatic interactions between two or more loci help to close this gap. Unfortunately, the sheer number of loci combinations to process and hypotheses prohibit the process both computationally and statistically. Epistasis test prioritization algorithms rank likely epistatic single nucleotide polymorphism (SNP) pairs to limit the number of tests. However, they still suffer from very low precision. It was shown in the literature that selecting SNPs that are individually correlated with the phenotype and also diverse with respect to genomic location leads to better phenotype prediction due to genetic complementation. Here, we propose that an algorithm that pairs SNPs from such diverse regions and ranks them can improve prediction power. We propose an epistasis test prioritization algorithm that optimizes a submodular set function to select a diverse and complementary set of genomic regions that span the underlying genome. The SNP pairs from these regions are then further ranked w.r.t. their co-coverage of the case cohort. We compare our algorithm with the state of the art on three GWAS and show that (1) we substantially improve precision (from 0.003 to 0.652) while maintaining the significance of selected pairs, (2) decrease the number of tests by 25-fold, and (3) decrease the runtime by 4-fold. We also show that promoting SNPs from regulatory/coding regions improves the performance (up to 0.8). Potpourri is available at http:/ciceklab.cs.bilkent.edu.tr/potpourri

中文翻译:

Potpourri:通过多样化 SNP 选择的上位性测试优先排序算法

全基因组关联研究 (GWAS) 解释了遗传疾病潜在遗传性的一小部分。研究两个或多个基因座之间的上位相互作用有助于缩小这一差距。不幸的是,要处理和假设的基因座组合的绝对数量在计算和统计上都禁止了该过程。上位性测试优先排序算法对可能的上位性单核苷酸多态性 (SNP) 对进行排序,以限制测试数量。然而,它们的精度仍然很低。文献中显示,选择与表型单独相关且在基因组位置方面也不同的 SNP 会由于遗传互补而导致更好的表型预测。这里,我们建议将来自不同区域的 SNP 配对并对它们进行排序的算法可以提高预测能力。我们提出了一种上位性测试优先排序算法,该算法优化了一个子模块集函数,以选择跨越底层基因组的一组多样化和互补的基因组区域。来自这些地区的 SNP 对然后根据它们对病例队列的共同覆盖进行进一步排序。我们将我们的算法与三个 GWAS 上的最新技术进行比较,并表明 (1) 我们在保持所选对的显着性的同时显着提高了精度(从 0.003 到 0.652),(2)将测试数量减少了 25 倍, (3) 将运行时间减少 4 倍。我们还表明,从监管/编码区域提升 SNP 可以提高性能(高达 0.8)。百花香可在 http://ciceklab.cs.bilkent.edu.tr/potpourri 获得 我们提出了一种上位性测试优先排序算法,该算法优化了一个子模块集函数,以选择跨越底层基因组的一组多样化和互补的基因组区域。来自这些地区的 SNP 对然后根据它们对病例队列的共同覆盖进行进一步排序。我们将我们的算法与三个 GWAS 上的最新技术进行比较,并表明 (1) 我们在保持所选对的显着性的同时显着提高了精度(从 0.003 到 0.652),(2)将测试数量减少了 25 倍, (3) 将运行时间减少 4 倍。我们还表明,从监管/编码区域提升 SNP 可以提高性能(高达 0.8)。百花香可在 http://ciceklab.cs.bilkent.edu.tr/potpourri 获得 我们提出了一种上位性测试优先排序算法,该算法优化了一个子模块集函数,以选择跨越底层基因组的一组多样化和互补的基因组区域。来自这些地区的 SNP 对然后根据它们对病例队列的共同覆盖进行进一步排序。我们将我们的算法与三个 GWAS 上的最新技术进行比较,并表明 (1) 我们在保持所选对的显着性的同时显着提高了精度(从 0.003 到 0.652),(2)将测试数量减少了 25 倍, (3) 将运行时间减少 4 倍。我们还表明,从监管/编码区域提升 SNP 可以提高性能(高达 0.8)。百花香可在 http://ciceklab.cs.bilkent.edu.tr/potpourri 获得 来自这些地区的 SNP 对然后根据它们对病例队列的共同覆盖进行进一步排序。我们将我们的算法与三个 GWAS 上的最新技术进行比较,并表明 (1) 我们在保持所选对的显着性的同时显着提高了精度(从 0.003 到 0.652),(2)将测试数量减少了 25 倍, (3) 将运行时间减少 4 倍。我们还表明,从监管/编码区域提升 SNP 可以提高性能(高达 0.8)。百花香可在 http://ciceklab.cs.bilkent.edu.tr/potpourri 获得 来自这些地区的 SNP 对然后根据它们对病例队列的共同覆盖进行进一步排序。我们将我们的算法与三个 GWAS 上的最新技术进行比较,并表明 (1) 我们在保持所选对的显着性的同时显着提高了精度(从 0.003 到 0.652),(2)将测试数量减少了 25 倍, (3) 将运行时间减少 4 倍。我们还表明,从监管/编码区域提升 SNP 可以提高性能(高达 0.8)。百花香可在 http://ciceklab.cs.bilkent.edu.tr/potpourri 获得 (2) 将测试数量减少 25 倍,以及 (3) 将运行时间减少 4 倍。我们还表明,从监管/编码区域提升 SNP 可以提高性能(高达 0.8)。百花香可在 http://ciceklab.cs.bilkent.edu.tr/potpourri 获得 (2) 将测试数量减少 25 倍,以及 (3) 将运行时间减少 4 倍。我们还表明,从监管/编码区域提升 SNP 可以提高性能(高达 0.8)。百花香可在 http://ciceklab.cs.bilkent.edu.tr/potpourri 获得
更新日期:2021-04-20
down
wechat
bug