当前位置: X-MOL 学术BMC Ecol. Evol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Improving the performance of Bayesian phylogenetic inference under relaxed clock models.
BMC Ecology and Evolution ( IF 2.3 ) Pub Date : 2020-05-14 , DOI: 10.1186/s12862-020-01609-4
Rong Zhang 1 , Alexei Drummond 1, 2
Affiliation  

BACKGROUND Bayesian MCMC has become a common approach for phylogenetic inference. But the growing size of molecular sequence data sets has created a pressing need to improve the computational efficiency of Bayesian phylogenetic inference algorithms. RESULTS This paper develops a new algorithm to improve the efficiency of Bayesian phylogenetic inference for models that include a per-branch rate parameter. In a Markov chain Monte Carlo algorithm, the presented proposal kernel changes evolutionary rates and divergence times at the same time, under the constraint that the implied genetic distances remain constant. Specifically, the proposal operates on the divergence time of an internal node and the three adjacent branch rates. For the root of a phylogenetic tree, there are three strategies discussed, named Simple Distance, Small Pulley and Big Pulley. Note that Big Pulley is able to change the tree topology, which enables the operator to sample all the possible rooted trees consistent with the implied unrooted tree. To validate its effectiveness, a series of experiments have been performed by implementing the proposed operator in the BEAST2 software. CONCLUSIONS The results demonstrate that the proposed operator is able to improve the performance by giving better estimates for a given chain length and by using less running time for a given level of accuracy. Measured by effective samples per hour, use of the proposed operator results in overall mixing more efficient than the current operators in BEAST2. Especially for large data sets, the improvement is up to half an order of magnitude.

中文翻译:

在轻松的时钟模型下提高贝叶斯系统发生推理的性能。

背景技术贝叶斯MCMC已经成为用于系统发育推断的常用方法。但是,随着分子序列数据集规模的增长,迫切需要提高贝叶斯系统发生推理算法的计算效率。结果本文开发了一种新算法,以提高针对包含每个分支速率参数的模型的贝叶斯系统发生推断的效率。在马尔可夫链蒙特卡洛算法中,提出的提议核在隐含遗传距离保持恒定的约束下,同时改变进化速率和发散时间。具体而言,该建议对内部节点的发散时间和三个相邻分支速率进行操作。对于系统发生树的根,讨论了三种策略,即简单距离,小皮带轮和大皮带轮。请注意,Big Pulley能够更改树的拓扑,这使操作员可以对与隐含的无根树一致的所有可能的有根树进行采样。为了验证其有效性,通过在BEAST2软件中实施建议的操作器进行了一系列实验。结论结果表明,提出的算子能够通过对给定的链长给出更好的估计,并在给定的精度水平上使用更少的运行时间来提高性能。通过每小时有效样本的测量,所建议的运算符的使用将使整体混合比BEAST2中的当前运算符更有效。尤其是对于大型数据集,这种改进最多可以达到半个数量级。这使操作员可以对与隐式无根树一致的所有可能的有根树进行采样。为了验证其有效性,已通过在BEAST2软件中实施建议的操作器进行了一系列实验。结论结果表明,提出的算子能够通过对给定的链长给出更好的估计,并在给定的精度水平上使用更少的运行时间来提高性能。通过每小时有效样本的测量,所建议的运算符的使用将使整体混合比BEAST2中的当前运算符更有效。特别是对于大型数据集,这种改进最多可以达到一半的数量级。这使操作员可以对与隐式无根树一致的所有可能的有根树进行采样。为了验证其有效性,通过在BEAST2软件中实施建议的操作器进行了一系列实验。结论结果表明,提出的算子能够通过对给定的链长给出更好的估计,并在给定的精度水平上使用更少的运行时间来提高性能。通过每小时有效样本的测量,所建议的运算符的使用将使整体混合比BEAST2中的当前运算符更有效。特别是对于大型数据集,这种改进最多可以达到一半的数量级。通过在BEAST2软件中实现建议的运算符,已经进行了一系列实验。结论结果表明,提出的算子能够通过对给定的链长给出更好的估计,并在给定的精度水平上使用更少的运行时间来提高性能。通过每小时有效样本的测量,所建议的运算符的使用将使整体混合比BEAST2中的当前运算符更有效。尤其是对于大型数据集,这种改进最多可以达到半个数量级。通过在BEAST2软件中实现建议的运算符,已经进行了一系列实验。结论结果表明,提出的算子能够通过对给定的链长给出更好的估计,并在给定的精度水平上使用更少的运行时间来提高性能。通过每小时有效样本来衡量,使用建议的运算符可以使整体混合比BEAST2中的当前运算符更有效。特别是对于大型数据集,这种改进最多可以达到一半的数量级。通过每小时有效样本来衡量,使用建议的运算符可以使整体混合比BEAST2中的当前运算符更有效。特别是对于大型数据集,这种改进最多可以达到一半的数量级。通过每小时有效样本来衡量,使用建议的运算符可以使整体混合比BEAST2中的当前运算符更有效。特别是对于大型数据集,这种改进最多可以达到一半的数量级。
更新日期:2020-05-14
down
wechat
bug