当前位置: X-MOL 学术Genet. Sel. Evol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A deterministic equation to predict the accuracy of multi-population genomic prediction with multiple genomic relationship matrices.
Genetics Selection Evolution ( IF 3.6 ) Pub Date : 2020-04-28 , DOI: 10.1186/s12711-020-00540-y
Biaty Raymond 1, 2 , Yvonne C J Wientjes 1 , Aniek C Bouwman 1 , Chris Schrooten 3 , Roel F Veerkamp 1
Affiliation  

BACKGROUND A multi-population genomic prediction (GP) model in which important pre-selected single nucleotide polymorphisms (SNPs) are differentially weighted (MPMG) has been shown to result in better prediction accuracy than a multi-population, single genomic relationship matrix ([Formula: see text]) GP model (MPSG) in which all SNPs are weighted equally. Our objective was to underpin theoretically the advantages and limits of the MPMG model over the MPSG model, by deriving and validating a deterministic prediction equation for its accuracy. METHODS Using selection index theory, we derived an equation to predict the accuracy of estimated total genomic values of selection candidates from population [Formula: see text] ([Formula: see text]), when individuals from two populations, [Formula: see text] and [Formula: see text], are combined in the training population and two [Formula: see text], made respectively from pre-selected and remaining SNPs, are fitted simultaneously in MPMG. We used simulations to validate the prediction equation in scenarios that differed in the level of genetic correlation between populations, heritability, and proportion of genetic variance explained by the pre-selected SNPs. Empirical accuracy of the MPMG model in each scenario was calculated and compared to the predicted accuracy from the equation. RESULTS In general, the derived prediction equation resulted in accurate predictions of [Formula: see text] for the scenarios evaluated. Using the prediction equation, we showed that an important advantage of the MPMG model over the MPSG model is its ability to benefit from the small number of independent chromosome segments ([Formula: see text]) due to the pre-selected SNPs, both within and across populations, whereas for the MPSG model, there is only a single value for [Formula: see text], calculated based on all SNPs, which is very large. However, this advantage is dependent on the pre-selected SNPs that explain some proportion of the total genetic variance for the trait. CONCLUSIONS We developed an equation that gives insight into why, and under which conditions the MPMG outperforms the MPSG model for GP. The equation can be used as a deterministic tool to assess the potential benefit of combining information from different populations, e.g., different breeds or lines for GP in livestock or plants, or different groups of people based on their ethnic background for prediction of disease risk scores.

中文翻译:

确定性方程式,用于使用多种基因组关系矩阵预测多种群基因组预测的准确性。

背景技术已经显示了其中重要的预选单核苷酸多态性(SNP)进行差分加权(MPMG)的多人群基因组预测(GP)模型比多人群单基因组关系矩阵([[公式:参见文本])GP模型(MPSG),其中所有SNP均等加权。我们的目标是通过推导和验证确定性预测方程式的准确性,从理论上证明MPMG模型相对于MPSG模型的优势和局限性。方法使用选择指数理论,当来自两个群体的个体(公式:参见文本)时,我们推导了一个方程来预测人群中选择候选物的估计总基因组值的准确性。 ]和[公式:参见文字],在培训人群中合并,分别由预选的SNP和剩余的SNP制成的两个[公式:参见文本]同时安装在MPMG中。我们使用模拟来验证情景中的预测方程,这些情景在种群之间的遗传相关性水平,遗传性和由预先选择的SNP解释的遗传变异比例中有所不同。计算了每种情况下MPMG模型的经验精度,并将其与方程式中的预测精度进行比较。结果通常,导出的预测方程式可以对评估的方案进行[公式:参见文本]的准确预测。使用预测方程,我们证明了MPMG模型相对于MPSG模型的重要优势在于其能够从少量独立染色体区段中受益([公式:由于预先选择的SNP,无论是在种群内部还是种群之间,而对于MPSG模型,[公式:参见文本]只有一个值,该值基于所有SNP计算得出,非常大。但是,这种优势取决于预先选择的SNP,这些SNP解释了该性状在总遗传变异中所占的比例。结论我们开发了一个方程式,可以深入了解MPMG的原因以及在何种条件下优于GP的MPSG模型。该方程式可以用作确定性工具,以评估将来自不同人群(例如,不同品种或品系用于家畜或植物中的GP或基于不同种族背景的不同人群的信息)相结合的潜在收益,以预测疾病风险评分。而对于MPSG模型,[公式:参见文本]只有一个值,它是基于所有SNP计算的,非常大。但是,这种优势取决于预先选择的SNP,这些SNP解释了该性状在总遗传变异中所占的比例。结论我们开发了一个方程式,可以深入了解MPMG的原因以及在何种条件下优于GP的MPSG模型。该方程式可以用作确定性工具,以评估将来自不同人群(例如,不同品种或品系用于家畜或植物中的GP或基于不同种族背景的不同人群的信息)相结合的潜在收益,以预测疾病风险评分。而对于MPSG模型,[公式:参见文本]只有一个值,它是基于所有SNP计算的,非常大。但是,这种优势取决于预先选择的SNP,这些SNP解释了该性状在总遗传变异中所占的比例。结论我们开发了一个方程式,可以深入了解MPMG的原因以及在何种条件下优于GP的MPSG模型。该方程式可以用作确定性工具,以评估将来自不同人群(例如,不同品种或品系用于家畜或植物中的GP或基于不同种族背景的不同人群的信息)相结合的潜在收益,以预测疾病风险评分。这种优势取决于预先选择的SNP,这些SNP可以解释该性状在总遗传变异中所占的比例。结论我们开发了一个方程式,可以深入了解MPMG的原因以及在何种条件下优于GP的MPSG模型。该方程式可以用作确定性工具,以评估将来自不同人群(例如,不同品种或品系用于家畜或植物中的GP或基于不同种族背景的不同人群的信息)相结合的潜在收益,以预测疾病风险评分。这种优势取决于预先选择的SNP,这些SNP可以解释该性状在总遗传变异中所占的比例。结论我们开发了一个方程式,可以深入了解MPMG的原因以及在何种条件下优于GP的MPSG模型。该方程式可以用作确定性工具,以评估将来自不同人群(例如,不同品种或品系用于家畜或植物中的GP或基于不同种族背景的不同人群的信息)相结合的潜在收益,以预测疾病风险评分。
更新日期:2020-04-28
down
wechat
bug