当前位置: X-MOL 学术Genome Biol. Evol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Ab Initio Construction and Evolutionary Analysis of Protein-Coding Gene Families with Partially Homologous Relationships: Closely Related Drosophila Genomes as a Case Study.
Genome Biology and Evolution ( IF 3.3 ) Pub Date : 2020-02-27 , DOI: 10.1093/gbe/evaa041
Xia Han 1 , Jindan Guo 1 , Erli Pang 1 , Hongtao Song 1 , Kui Lin 1
Affiliation  

How have genes evolved within a well-known genome phylogeny? Many protein-coding genes should have evolved as a whole at the gene level, and some should have evolved partly through fragments at the subgene level. To comprehensively explore such complex homologous relationships and better understand gene family evolution, here, with de novo-identified modules, the subgene units which could consecutively cover proteins within a set of closely related species, we applied a new phylogeny-based approach that considers evolutionary models with partial homology to classify all protein-coding genes in nine Drosophila genomes. Compared with two other popular methods for gene family construction, our approach improved practical gene family classifications with a more reasonable view of homology and provided a much more complete landscape of gene family evolution at the gene and subgene levels. In the case study, we found that most expanded gene families might have evolved mainly through module rearrangements rather than gene duplications and mainly generated single-module genes through partial gene duplication, suggesting that there might be pervasive subgene rearrangement in the evolution of protein-coding gene families. The use of a phylogeny-based approach with partial homology to classify and analyze protein-coding gene families may provide us with a more comprehensive landscape depicting how genes evolve within a well-known genome phylogeny.

中文翻译:

从头开始的构建和具有部分同源关系的蛋白质编码基因家族的进化分析:案例研究密切相关的果蝇基因组。

基因在众所周知的基因组系统发育中如何进化?许多蛋白质编码基因应该在基因水平上整体进化,而有些应该部分通过子基因水平上的片段进化。为了全面探索这种复杂的同源关系并更好地了解基因家族的进化,在这里,通过从头鉴定的模块,这些亚基因单元可以连续覆盖一组紧密相关物种中的蛋白质,我们应用了一种基于系统进化的新方法,将进化具有部分同源性的模型可以对9个果蝇基因组中的所有蛋白质编码基因进行分类。与其他两种流行的基因家族构建方法相比,我们的方法通过更合理的同源性视角改善了实用的基因家族分类,并在基因和亚基因水平上提供了更加完整的基因家族进化图景。在案例研究中,我们发现大多数扩展的基因家族可能主要通过模块重排而不是基因重复进化而来,并且主要通过部分基因重复生成单模块基因,这表明在蛋白质编码的进化中可能存在普遍的亚基因重排。基因家族。使用具有部分同源性的基于系统发育的方法对蛋白质编码基因家族进行分类和分析,可能会为我们提供更全面的信息,描述基因如何在众所周知的基因组系统发育中进化。我们发现,大多数扩展的基因家族可能主要通过模块重排而不是基因重复进化而来,并且主要通过部分基因重复生成单模块基因,这表明在蛋白质编码基因家族的进化中可能存在普遍的亚基因重排。使用具有部分同源性的基于系统发育的方法对蛋白质编码基因家族进行分类和分析,可以为我们提供更全面的信息,描述基因如何在众所周知的基因组系统发育中进化。我们发现,大多数扩展的基因家族可能主要通过模块重排而不是基因重复进化而来,并且主要通过部分基因重复生成单模块基因,这表明在蛋白质编码基因家族的进化中可能存在普遍的亚基因重排。使用具有部分同源性的基于系统发育的方法对蛋白质编码基因家族进行分类和分析,可以为我们提供更全面的信息,描述基因如何在众所周知的基因组系统发育中进化。
更新日期:2020-04-17
down
wechat
bug