当前位置: X-MOL 学术Syst. Biol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Six-State Amino Acid Recoding is not an Effective Strategy to Offset Compositional Heterogeneity and Saturation in Phylogenetic Analyses
Systematic Biology ( IF 6.5 ) Pub Date : 2021-04-08 , DOI: 10.1093/sysbio/syab027
Alexandra M Hernandez 1, 2 , Joseph F Ryan 1, 2
Affiliation  

Six-state amino acid recoding strategies are commonly applied to combat the effects of compositional heterogeneity and substitution saturation in phylogenetic analyses. While these methods have been endorsed from a theoretical perspective, their performance has never been extensively tested. Here, we test the effectiveness of six-state recoding approaches by comparing the performance of analyses on recoded and non-recoded data sets that have been simulated under gradients of compositional heterogeneity or saturation. In our simulation analyses, non-recoding approaches consistently outperform six-state recoding approaches. Our results suggest that six-state recoding strategies are not effective in the face of high saturation. Furthermore, while recoding strategies do buffer the effects of compositional heterogeneity, the loss of information that accompanies six-state recoding outweighs its benefits. In addition, we evaluate recoding schemes with 9, 12, 15, and 18 states and show that these consistently outperform six-state recoding. Our analyses of other recoding schemes suggest that under conditions of very high compositional heterogeneity, it may be advantageous to apply recoding using more than six states, but we caution that applying any recoding should include sufficient justification. Our results have important implications for the more than 90 published papers that have incorporated six-state recoding, many of which have significant bearing on relationships across the tree of life. [Compositional heterogeneity; Dayhoff 6-state recoding; S&R 6-state recoding; six-state amino acid recoding; substitution saturation.]

中文翻译:

六态氨基酸重新编码不是抵消系统发育分析中组成异质性和饱和度的有效策略

六态氨基酸重新编码策略通常用于对抗系统发育分析中组成异质性和取代饱和的影响。虽然这些方法已从理论角度得到认可,但它们的性能从未经过广泛的测试。在这里,我们通过比较在成分异质性或饱和度梯度下模拟的重新编码和非重新编码数据集的分析性能来测试六态重新编码方法的有效性。在我们的模拟分析中,非重新编码方法始终优于六态重新编码方法。我们的结果表明,六态重新编码策略在面对高饱和度时无效。此外,虽然重新编码策略确实缓冲了成分异质性的影响,伴随六态重新编码的信息丢失超过了它的好处。此外,我们评估了具有 9、12、15 和 18 个状态的重新编码方案,并表明这些方案始终优于六态重新编码。我们对其他重新编码方案的分析表明,在成分异质性非常高的条件下,使用超过六个状态应用重新编码可能是有利的,但我们警告说,应用任何重新编码都应包括充分的理由。我们的研究结果对已发表的 90 多篇包含六态重新编码的论文具有重要意义,其中许多论文对生命之树的关系具有重要意义。[组成异质性;Dayhoff 6 态重新编码;S&R 6 态重新编码;六态氨基酸重新编码;取代饱和度。] 12、15 和 18 个状态,并表明这些始终优于六状态重新编码。我们对其他重新编码方案的分析表明,在成分异质性非常高的条件下,使用超过六个状态应用重新编码可能是有利的,但我们警告说,应用任何重新编码都应包括充分的理由。我们的研究结果对已发表的 90 多篇包含六态重新编码的论文具有重要意义,其中许多论文对生命之树的关系具有重要意义。[组成异质性;Dayhoff 6 态重新编码;S&R 6 态重新编码;六态氨基酸重新编码;取代饱和度。] 12、15 和 18 个状态,并表明这些始终优于六状态重新编码。我们对其他重新编码方案的分析表明,在成分异质性非常高的条件下,使用超过六个状态应用重新编码可能是有利的,但我们警告说,应用任何重新编码都应包括充分的理由。我们的研究结果对已发表的 90 多篇包含六态重新编码的论文具有重要意义,其中许多论文对生命之树的关系具有重要意义。[组成异质性;Dayhoff 6 态重新编码;S&R 6 态重新编码;六态氨基酸重新编码;取代饱和度。] 我们对其他重新编码方案的分析表明,在成分异质性非常高的条件下,使用超过六个状态应用重新编码可能是有利的,但我们警告说,应用任何重新编码都应包括充分的理由。我们的研究结果对已发表的 90 多篇包含六态重新编码的论文具有重要意义,其中许多论文对生命之树的关系具有重要意义。[组成异质性;Dayhoff 6 态重新编码;S&R 6 态重新编码;六态氨基酸重新编码;取代饱和度。] 我们对其他重新编码方案的分析表明,在成分异质性非常高的条件下,使用超过六个状态应用重新编码可能是有利的,但我们警告说,应用任何重新编码都应包括充分的理由。我们的研究结果对已发表的 90 多篇包含六态重新编码的论文具有重要意义,其中许多论文对生命之树的关系具有重要意义。[组成异质性;Dayhoff 6 态重新编码;S&R 6 态重新编码;六态氨基酸重新编码;取代饱和度。] 我们的研究结果对已发表的 90 多篇包含六态重新编码的论文具有重要意义,其中许多论文对生命之树的关系具有重要意义。[组成异质性;Dayhoff 6 态重新编码;S&R 6 态重新编码;六态氨基酸重新编码;取代饱和度。] 我们的研究结果对已发表的 90 多篇包含六态重新编码的论文具有重要意义,其中许多论文对生命之树的关系具有重要意义。[组成异质性;Dayhoff 6 态重新编码;S&R 6 态重新编码;六态氨基酸重新编码;取代饱和度。]
更新日期:2021-04-08
down
wechat
bug