当前位置: X-MOL 学术Syst. Biol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Systematic Exploration of the High Likelihood Set of Phylogenetic Tree Topologies
Systematic Biology ( IF 6.1 ) Pub Date : 2019-08-28 , DOI: 10.1093/sysbio/syz047
Chris Whidden 1 , Brian C Claywell 1 , Thayer Fisher 2 , Andrew F Magee 3 , Mathieu Fourment 4 , Frederick A Matsen 1
Affiliation  

Bayesian Markov chain Monte Carlo explores tree space slowly, in part because it frequently returns to the same tree topology. An alternative strategy would be to explore tree space systematically, and never return to the same topology. In this paper, we present an efficient parallelized method to map out the high likelihood set of phylogenetic tree topologies via systematic search, which we show to be a good approximation of the high posterior set of tree topologies on the data sets analyzed. Here "likelihood" of a topology refers to the tree likelihood for the corresponding tree with optimized branch lengths. We call this method "phylogenetic topographer" (PT). The PT strategy is very simple: starting in a number of local topology maxima (obtained by hill-climbing from random starting points), explore out using local topology rearrangements, only continuing through topologies that are better than some likelihood threshold below the best observed topology. We show that the normalized topology likelihoods are a useful proxy for the Bayesian posterior probability of those topologies. By using a non-blocking hash table keyed on unique representations of tree topologies, we avoid visiting topologies more than once across all concurrent threads exploring tree space. We demonstrate that PT can be used directly to approximate a Bayesian consensus tree topology. When combined with an accurate means of evaluating per-topology marginal likelihoods, PT gives an alternative procedure for obtaining Bayesian posterior distributions on phylogenetic tree topologies.

中文翻译:

系统发育树拓扑高似然集的系统探索

贝叶斯马尔可夫链蒙特卡罗缓慢探索树空间,部分原因是它经常返回到相同的树拓扑。另一种策略是系统地探索树空间,并且永远不会回到相同的拓扑结构。在本文中,我们提出了一种有效的并行化方法,通过系统搜索来绘制系统发育树拓扑的高似然集,我们证明它是所分析数据集上树拓扑的高后验集的良好近似。这里拓扑的“可能性”是指具有优化分支长度的对应树的树可能性。我们称这种方法为“系统发育地形图”(PT)。PT 策略非常简单:从多个局部拓扑最大值开始(通过从随机起点爬山获得),探索使用局部拓扑重新排列,只继续通过比最佳观察拓扑以下的某个似然阈值更好的拓扑。我们表明归一化拓扑似然是这些拓扑的贝叶斯后验概率的有用代理。通过使用以树拓扑的唯一表示为键的非阻塞哈希表,我们避免在探索树空间的所有并发线程中多次访问拓扑。我们证明了 PT 可以直接用于近似贝叶斯共识树拓扑。当结合评估每个拓扑边缘似然的准确方法时,PT 提供了一种替代程序,用于在系统发育树拓扑上获得贝叶斯后验分布。仅继续通过优于低于最佳观察拓扑的某个似然阈值的拓扑。我们表明归一化拓扑似然是这些拓扑的贝叶斯后验概率的有用代理。通过使用以树拓扑的唯一表示为键的非阻塞哈希表,我们避免在探索树空间的所有并发线程中多次访问拓扑。我们证明了 PT 可以直接用于近似贝叶斯共识树拓扑。当结合评估每个拓扑边缘似然的准确方法时,PT 提供了一种替代程序,用于在系统发育树拓扑上获得贝叶斯后验分布。仅继续通过优于低于最佳观察拓扑的某个似然阈值的拓扑。我们表明归一化拓扑似然是这些拓扑的贝叶斯后验概率的有用代理。通过使用以树拓扑的唯一表示为键的非阻塞哈希表,我们避免在探索树空间的所有并发线程中多次访问拓扑。我们证明了 PT 可以直接用于近似贝叶斯共识树拓扑。当结合评估每个拓扑边缘似然的准确方法时,PT 提供了一种替代程序,用于在系统发育树拓扑上获得贝叶斯后验分布。我们表明归一化拓扑似然是这些拓扑的贝叶斯后验概率的有用代理。通过使用以树拓扑的唯一表示为键的非阻塞哈希表,我们避免在探索树空间的所有并发线程中多次访问拓扑。我们证明了 PT 可以直接用于近似贝叶斯共识树拓扑。当结合评估每个拓扑边缘似然的准确方法时,PT 提供了一种替代程序,用于在系统发育树拓扑上获得贝叶斯后验分布。我们表明归一化拓扑似然是这些拓扑的贝叶斯后验概率的有用代理。通过使用以树拓扑的唯一表示为键的非阻塞哈希表,我们避免在探索树空间的所有并发线程中多次访问拓扑。我们证明了 PT 可以直接用于近似贝叶斯共识树拓扑。当结合评估每个拓扑边缘似然的准确方法时,PT 提供了一种替代程序,用于在系统发育树拓扑上获得贝叶斯后验分布。我们证明了 PT 可以直接用于近似贝叶斯共识树拓扑。当结合评估每个拓扑边缘似然的准确方法时,PT 提供了一种替代程序,用于在系统发育树拓扑上获得贝叶斯后验分布。我们证明了 PT 可以直接用于近似贝叶斯共识树拓扑。当结合评估每个拓扑边缘似然的准确方法时,PT 提供了一种替代程序,用于在系统发育树拓扑上获得贝叶斯后验分布。
更新日期:2019-08-28
down
wechat
bug