当前位置: X-MOL 学术Genet. Sel. Evol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Weighted single-step genomic best linear unbiased prediction integrating variants selected from sequencing data by association and bioinformatics analyses.
Genetics Selection Evolution ( IF 3.6 ) Pub Date : 2020-08-14 , DOI: 10.1186/s12711-020-00568-0
Aoxing Liu 1 , Mogens Sandø Lund 1 , Didier Boichard 2 , Emre Karaman 1 , Bernt Guldbrandtsen 1 , Sebastien Fritz 2, 3 , Gert Pedersen Aamand 4 , Ulrik Sander Nielsen 5 , Goutam Sahana 1 , Yachun Wang 6 , Guosheng Su 1
Affiliation  

Sequencing data enable the detection of causal loci or single nucleotide polymorphisms (SNPs) highly linked to causal loci to improve genomic prediction. However, until now, studies on integrating such SNPs using a single-step genomic best linear unbiased prediction (ssGBLUP) model are scarce. We investigated the integration of sequencing SNPs selected by association (1262 SNPs) and bioinformatics (2359 SNPs) analyses into the currently used 54K-SNP chip, using three ssGBLUP models which make different assumptions on the distribution of SNP effects: a basic ssGBLUP model, a so-called featured ssGBLUP (ssFGBLUP) model that considered selected sequencing SNPs as a feature genetic component, and a weighted ssGBLUP (ssWGBLUP) model in which the genomic relationship matrix was weighted by the SNP variances estimated from a Bayesian whole-genome regression model, with every 1, 30, or 100 adjacent SNPs within a chromosome region sharing the same variance. We used data on milk production and female fertility in Danish Jersey. In total, 15,823 genotyped and 528,981‬ non-genotyped females born between 1990 and 2013 were used as reference population and 7415 genotyped females and 33,040 non-genotyped females born between 2014 and 2016 were used as validation population. With basic ssGBLUP, integrating SNPs selected from sequencing data improved prediction reliabilities for milk and protein yields, but resulted in limited or no improvement for fat yield and female fertility. Model performances depended on the SNP set used. When using ssWGBLUP with the 54K SNPs, reliabilities for milk and protein yields improved by 0.028 for genotyped animals and by 0.006 for non-genotyped animals compared with ssGBLUP. However, with the SNP set that included SNPs selected from sequencing data, no statistically significant difference in prediction reliability was observed between the three ssGBLUP models. In summary, when using 54K SNPs, a ssWGBLUP model with a common weight on the SNPs in a given region is a feasible approach for single-trait genetic evaluation. Integrating relevant SNPs selected from sequencing data into the standard SNP chip can improve the reliability of genomic prediction. Based on such SNP data, a basic ssGBLUP model was suggested since no significant improvement was observed from using alternative models such as ssWGBLUP and ssFGBLUP.

中文翻译:

加权单步基因组最佳线性无偏预测,整合了通过关联和生物信息学分析从测序数据中选择的变体。

测序数据可检测出因果基因座或与因果基因座高度相关的单核苷酸多态性(SNP),以改善基因组预测。然而,直到现在,仍缺乏使用单步基因组最佳线性无偏预测(ssGBLUP)模型整合此类SNP的研究。我们使用三个ssGBLUP模型研究了通过关联(1262 SNPs)和生物信息学(2359 SNPs)分析选择的测序SNP整合到当前使用的54K-SNP芯片中,这些模型对SNP效应的分布做出了不同的假设:基本ssGBLUP模型,所谓的功能性ssGBLUP(ssFGBLUP)模型,该模型将选定的测序SNP视为特征遗传成分,加权ssGBLUP(ssWGBLUP)模型,其中基因组关系矩阵通过贝叶斯全基因组回归模型估计的SNP方差加权,染色体区域内的每1、30或100个相邻SNP共享相同的方差。我们使用了丹麦泽西岛的牛奶产量和女性生育率数据。将1990年至2013年间出生的15823名基因型女性和528981名非基因型女性用作参考人群,并将2014年至2016年之间的7415位基因型女性和33040位非基因型女性用作验证人群。使用基本的ssGBLUP,整合从测序数据中选择的SNP可以提高牛奶和蛋白质产量的预测可靠性,但导致脂肪产量和女性生育力的改善有限或没有改善。模型性能取决于所使用的SNP集。与ssGBLUP相比,当将ssWGBLUP与54K SNP一起使用时,基因型动物的牛奶和蛋白质产量的可靠性提高了0.028,非基因型动物的可靠性提高了0.006。但是,使用包含从测序数据中选择的SNP的SNP集,在三个ssGBLUP模型之间的预测可靠性上没有观察到统计学上的显着差异。总之,在使用54K SNP时,在给定区域中具有相同权重的ssWGBLUP模型是进行单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(如ssWGBLUP和ssFGBLUP)未观察到明显改善。与ssGBLUP相比,基因型动物的牛奶和蛋白质产量的可靠性提高了0.028,非基因型动物的可靠性提高了0.006。但是,使用包含从测序数据中选择的SNP的SNP集,在三个ssGBLUP模型之间的预测可靠性上没有观察到统计学上的显着差异。总之,在使用54K SNP时,在给定区域中具有相同权重的ssWGBLUP模型是进行单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(例如ssWGBLUP和ssFGBLUP)没有发现明显的改进。与ssGBLUP相比,基因型动物的牛奶和蛋白质产量的可靠性提高了0.028,非基因型动物的可靠性提高了0.006。但是,使用包含从测序数据中选择的SNP的SNP集,在三个ssGBLUP模型之间的预测可靠性上没有观察到统计学上的显着差异。总而言之,当使用54K SNP时,在给定区域中具有相同权重的ssWGBLUP模型是进行单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(如ssWGBLUP和ssFGBLUP)未观察到明显改善。与ssGBLUP相比,基因型动物为028,非基因型动物为0.006。但是,使用包含从测序数据中选择的SNP的SNP集,在三个ssGBLUP模型之间的预测可靠性上没有观察到统计学上的显着差异。总而言之,当使用54K SNP时,在给定区域中具有相同权重的ssWGBLUP模型是进行单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(如ssWGBLUP和ssFGBLUP)未观察到明显改善。与ssGBLUP相比,基因型动物为028,非基因型动物为0.006。但是,使用包含从测序数据中选择的SNP的SNP集,在三个ssGBLUP模型之间的预测可靠性上没有观察到统计学上的显着差异。总而言之,当使用54K SNP时,在给定区域中具有相同权重的ssWGBLUP模型是进行单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(例如ssWGBLUP和ssFGBLUP)没有发现明显的改进。如果SNP集包含从测序数据中选择的SNP,则三个ssGBLUP模型之间的预测可靠性没有观察到统计学上的显着差异。总而言之,当使用54K SNP时,在给定区域中具有相同权重的ssWGBLUP模型是进行单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(如ssWGBLUP和ssFGBLUP)未观察到明显改善。如果SNP集包括从测序数据中选择的SNP,则三个ssGBLUP模型之间的预测可靠性没有观察到统计学上的显着差异。总而言之,当使用54K SNP时,在给定区域中具有相同权重的ssWGBLUP模型是进行单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(例如ssWGBLUP和ssFGBLUP)没有发现明显的改进。在给定区域中对SNP具有共同权重的ssWGBLUP模型是进行单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(如ssWGBLUP和ssFGBLUP)未观察到明显改善。在给定区域中对SNP具有共同权重的ssWGBLUP模型是单性状遗传评估的可行方法。将从测序数据中选择的相关SNP整合到标准SNP芯片中可以提高基因组预测的可靠性。基于此类SNP数据,建议使用基本的ssGBLUP模型,因为使用替代模型(如ssWGBLUP和ssFGBLUP)未观察到明显改善。
更新日期:2020-08-15
down
wechat
bug