当前位置: X-MOL 学术Genes › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Defining the Rhizobium leguminosarum Species Complex
Genes ( IF 3.5 ) Pub Date : 2021-01-18 , DOI: 10.3390/genes12010111
J Peter W Young 1 , Sara Moeskjær 2 , Alexey Afonin 3 , Praveen Rahi 4 , Marta Maluk 5 , Euan K James 5 , Maria Izabel A Cavassim 6 , M Harun-Or Rashid 7 , Aregu Amsalu Aserse 8 , Benjamin J Perry 9 , En Tao Wang 10 , Encarna Velázquez 11 , Evgeny E Andronov 12 , Anastasia Tampakaki 13 , José David Flores Félix 14 , Raúl Rivas González 11 , Sameh H Youseif 15 , Marc Lepetit 16 , Stéphane Boivin 17 , Beatriz Jorrin 18 , Gregory J Kenicer 19 , Álvaro Peix 20 , Michael F Hynes 21 , Martha Helena Ramírez-Bahena 22 , Arvind Gulati 23 , Chang-Fu Tian 24
Affiliation  

Bacteria currently included in Rhizobium leguminosarum are too diverse to be considered a single species, so we can refer to this as a species complex (the Rlc). We have found 429 publicly available genome sequences that fall within the Rlc and these show that the Rlc is a distinct entity, well separated from other species in the genus. Its sister taxon is R. anhuiense. We constructed a phylogeny based on concatenated sequences of 120 universal (core) genes, and calculated pairwise average nucleotide identity (ANI) between all genomes. From these analyses, we concluded that the Rlc includes 18 distinct genospecies, plus 7 unique strains that are not placed in these genospecies. Each genospecies is separated by a distinct gap in ANI values, usually at approximately 96% ANI, implying that it is a ‘natural’ unit. Five of the genospecies include the type strains of named species: R. laguerreae, R. sophorae, R. ruizarguesonis, “R. indicum” and R. leguminosarum itself. The 16S ribosomal RNA sequence is remarkably diverse within the Rlc, but does not distinguish the genospecies. Partial sequences of housekeeping genes, which have frequently been used to characterize isolate collections, can mostly be assigned unambiguously to a genospecies, but alleles within a genospecies do not always form a clade, so single genes are not a reliable guide to the true phylogeny of the strains. We conclude that access to a large number of genome sequences is a powerful tool for characterizing the diversity of bacteria, and that taxonomic conclusions should be based on all available genome sequences, not just those of type strains.

中文翻译:

定义豆根瘤菌物种复合体

目前包含在豆类根瘤菌中的细菌种类繁多,不能被视为单一物种,因此我们可以将其称为物种复合体(Rlc)。我们发现了 429 个属于 Rlc 的公开可用的基因组序列,这些表明 Rlc 是一个独特的实体,与该属中的其他物种完全分开。它的姊妹类群是R. anhuiense。我们基于 120 个通用(核心)基因的串联序列构建了系统发育,并计算了所有基因组之间的成对平均核苷酸同一性 (ANI)。从这些分析中,我们得出结论,Rlc 包括 18 个不同的基因种,以及 7 个未置于这些基因种中的独特菌株。每个基因种被 ANI 值的明显差距隔开,通常约为 96% ANI,这意味着它是一个“自然”单位。五个基因种包括命名物种的模式菌株:R. laguerreae、R. sophorae、R. ruizarguesonis、“R. indicum”和 R. leguminosarum 本身。16S 核糖体 RNA 序列在 Rlc 中非常多样化,但不能区分基因种。管家基因的部分序列经常被用来表征分离物集合,它们大多可以明确地分配给一个基因种,但一个基因种内的等位基因并不总是形成一个进化枝,因此单个基因并不是真正的系统发育的可靠指南菌株。我们得出的结论是,获取大量基因组序列是表征细菌多样性的有力工具,并且分类学结论应基于所有可用的基因组序列,而不仅仅是类型菌株的基因组序列。sophorae, R. ruizarguesonis, “R. indicum”和 R. leguminosarum 本身。16S 核糖体 RNA 序列在 Rlc 中非常多样化,但不能区分基因种。管家基因的部分序列经常被用来表征分离物集合,它们大多可以明确地分配给一个基因种,但一个基因种内的等位基因并不总是形成一个进化枝,因此单个基因并不是真正的系统发育的可靠指南菌株。我们得出的结论是,获取大量基因组序列是表征细菌多样性的有力工具,并且分类学结论应基于所有可用的基因组序列,而不仅仅是类型菌株的基因组序列。sophorae, R. ruizarguesonis, “R. indicum”和 R. leguminosarum 本身。16S 核糖体 RNA 序列在 Rlc 中非常多样化,但不能区分基因种。管家基因的部分序列经常被用来表征分离物集合,它们大多可以明确地分配给一个基因种,但一个基因种内的等位基因并不总是形成一个进化枝,因此单个基因并不是真正的系统发育的可靠指南菌株。我们得出的结论是,获取大量基因组序列是表征细菌多样性的有力工具,并且分类学结论应基于所有可用的基因组序列,而不仅仅是类型菌株的基因组序列。16S 核糖体 RNA 序列在 Rlc 中非常多样化,但不能区分基因种。管家基因的部分序列经常被用来表征分离物集合,它们大多可以明确地分配给一个基因种,但一个基因种内的等位基因并不总是形成一个进化枝,因此单个基因并不是真正的系统发育的可靠指南菌株。我们得出的结论是,获取大量基因组序列是表征细菌多样性的有力工具,并且分类学结论应基于所有可用的基因组序列,而不仅仅是类型菌株的基因组序列。16S 核糖体 RNA 序列在 Rlc 中非常多样化,但不能区分基因种。管家基因的部分序列经常被用来表征分离物集合,它们大多可以明确地分配给一个基因种,但一个基因种内的等位基因并不总是形成一个进化枝,因此单个基因并不是真正的系统发育的可靠指南菌株。我们得出的结论是,获取大量基因组序列是表征细菌多样性的有力工具,并且分类学结论应基于所有可用的基因组序列,而不仅仅是类型菌株的基因组序列。大部分可以明确地分配给基因种,但基因种内的等位基因并不总是形成进化枝,因此单个基因并不是菌株真正系统发育的可靠指南。我们得出的结论是,获取大量基因组序列是表征细菌多样性的有力工具,分类学结论应基于所有可用的基因组序列,而不仅仅是类型菌株的基因组序列。大部分可以明确地分配给基因种,但基因种内的等位基因并不总是形成进化枝,因此单个基因并不是菌株真正系统发育的可靠指南。我们得出的结论是,获取大量基因组序列是表征细菌多样性的有力工具,并且分类学结论应基于所有可用的基因组序列,而不仅仅是类型菌株的基因组序列。
更新日期:2021-01-18
down
wechat
bug