当前位置: X-MOL 学术Syst. Biol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
The Implications of Lineage-Specific Rates for Divergence Time Estimation
Systematic Biology ( IF 6.5 ) Pub Date : 2019-12-06 , DOI: 10.1093/sysbio/syz080
Tom Carruthers 1 , Michael J Sanderson 2 , Robert W Scotland 1
Affiliation  

Abstract Rate variation adds considerable complexity to divergence time estimation in molecular phylogenies. Here, we evaluate the impact of lineage-specific rates—which we define as among-branch-rate-variation that acts consistently across the entire genome. We compare its impact to residual rates—defined as among-branch-rate-variation that shows a different pattern of rate variation at each sampled locus, and gene-specific rates—defined as variation in the average rate across all branches at each sampled locus. We show that lineage-specific rates lead to erroneous divergence time estimates, regardless of how many loci are sampled. Further, we show that stronger lineage-specific rates lead to increasing error. This contrasts to residual rates and gene-specific rates, where sampling more loci significantly reduces error. If divergence times are inferred in a Bayesian framework, we highlight that error caused by lineage-specific rates significantly reduces the probability that the 95% highest posterior density includes the correct value, and leads to sensitivity to the prior. Use of a more complex rate prior—which has recently been proposed to model rate variation more accurately—does not affect these conclusions. Finally, we show that the scale of lineage-specific rates used in our simulation experiments is comparable to that of an empirical data set for the angiosperm genus Ipomoea. Taken together, our findings demonstrate that lineage-specific rates cause error in divergence time estimates, and that this error is not overcome by analyzing genomic scale multilocus data sets. [Divergence time estimation; error; rate variation.]

中文翻译:

谱系特定速率对发散时间估计的影响

摘要 速率变化为分子系统发育中的发散时间估计增加了相当大的复杂性。在这里,我们评估了谱系特异性速率的影响——我们将其定义为在整个基因组中一致作用的分支间速率变异。我们将其影响与残留率(定义为在每个采样位点显示不同的速率变化模式的分支间速率变异)和基因特异性速率(定义为每个采样位点所有分支的平均速率的变化)进行比较. 我们表明,无论采样了多少个位点,谱系特定的速率都会导致错误的发散时间估计。此外,我们表明更强的谱系特定率会导致错误增加。这与残留率和基因特异性率形成对比,其中采样更多位点显着减少错误。如果在贝叶斯框架中推断发散时间,我们强调由谱系特定率引起的错误会显着降低 95% 最高后验密度包括正确值的概率,并导致对先验的敏感性。使用更复杂的速率先验——最近有人提议使用它来更准确地模拟速率变化——不会影响这些结论。最后,我们表明,在我们的模拟实验中使用的谱系特定比率的规模与被子植物属五爪植物的经验数据集的规模相当。综上所述,我们的研究结果表明,谱系特定的速率会导致发散时间估计错误,并且无法通过分析基因组规模的多位点数据集来克服该错误。[发散时间估计;错误; 率变化。] 我们强调,由谱系特定率引起的错误显着降低了 95% 最高后验密度包括正确值的可能性,并导致对先验的敏感性。使用更复杂的速率先验——最近有人提议使用它来更准确地模拟速率变化——不会影响这些结论。最后,我们表明,在我们的模拟实验中使用的谱系特定比率的规模与被子植物属五爪植物的经验数据集的规模相当。综上所述,我们的研究结果表明,谱系特定的速率会导致发散时间估计错误,并且无法通过分析基因组规模的多位点数据集来克服该错误。[发散时间估计;错误; 率变化。] 我们强调,由谱系特定率引起的错误显着降低了 95% 最高后验密度包括正确值的可能性,并导致对先验的敏感性。使用更复杂的速率先验——最近有人提议使用它来更准确地模拟速率变化——不会影响这些结论。最后,我们表明,在我们的模拟实验中使用的谱系特定比率的规模与被子植物属五爪植物的经验数据集的规模相当。综上所述,我们的研究结果表明,谱系特定的速率会导致发散时间估计错误,并且无法通过分析基因组规模的多位点数据集来克服该错误。[发散时间估计;错误; 率变化。] 使用更复杂的速率先验——最近有人提议使用它来更准确地模拟速率变化——不会影响这些结论。最后,我们表明,在我们的模拟实验中使用的谱系特定比率的规模与被子植物属五爪植物的经验数据集的规模相当。综上所述,我们的研究结果表明,谱系特定的速率会导致发散时间估计错误,并且无法通过分析基因组规模的多位点数据集来克服该错误。[发散时间估计;错误; 率变化。] 使用更复杂的速率先验——最近有人提议使用它来更准确地模拟速率变化——不会影响这些结论。最后,我们表明,在我们的模拟实验中使用的谱系特定比率的规模与被子植物属五爪植物的经验数据集的规模相当。综上所述,我们的研究结果表明,谱系特定的速率会导致发散时间估计错误,并且无法通过分析基因组规模的多位点数据集来克服该错误。[发散时间估计;错误; 率变化。] 我们表明,在我们的模拟实验中使用的谱系特定比率的规模与被子植物属 Ipomoea 的经验数据集的规模相当。综上所述,我们的研究结果表明,谱系特定的速率会导致发散时间估计错误,并且无法通过分析基因组规模的多位点数据集来克服该错误。[发散时间估计;错误; 率变化。] 我们表明,在我们的模拟实验中使用的谱系特定比率的规模与被子植物属 Ipomoea 的经验数据集的规模相当。综上所述,我们的研究结果表明,谱系特定的速率会导致发散时间估计错误,并且无法通过分析基因组规模的多位点数据集来克服该错误。[发散时间估计;错误; 率变化。]
更新日期:2019-12-06
down
wechat
bug