当前位置: X-MOL 学术BMC Genomics › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Benchmarking hybrid assembly approaches for genomic analyses of bacterial pathogens using Illumina and Oxford Nanopore sequencing.
BMC Genomics ( IF 4.4 ) Pub Date : 2020-09-14 , DOI: 10.1186/s12864-020-07041-8
Zhao Chen 1 , David L Erickson 1 , Jianghong Meng 1
Affiliation  

We benchmarked the hybrid assembly approaches of MaSuRCA, SPAdes, and Unicycler for bacterial pathogens using Illumina and Oxford Nanopore sequencing by determining genome completeness and accuracy, antimicrobial resistance (AMR), virulence potential, multilocus sequence typing (MLST), phylogeny, and pan genome. Ten bacterial species (10 strains) were tested for simulated reads of both mediocre- and low-quality, whereas 11 bacterial species (12 strains) were tested for real reads. Unicycler performed the best for achieving contiguous genomes, closely followed by MaSuRCA, while all SPAdes assemblies were incomplete. MaSuRCA was less tolerant of low-quality long reads than SPAdes and Unicycler. The hybrid assemblies of five antimicrobial-resistant strains with simulated reads provided consistent AMR genotypes with the reference genomes. The MaSuRCA assembly of Staphylococcus aureus with real reads contained msr(A) and tet(K), while the reference genome and SPAdes and Unicycler assemblies harbored blaZ. The AMR genotypes of the reference genomes and hybrid assemblies were consistent for the other five antimicrobial-resistant strains with real reads. The numbers of virulence genes in all hybrid assemblies were similar to those of the reference genomes, irrespective of simulated or real reads. Only one exception existed that the reference genome and hybrid assemblies of Pseudomonas aeruginosa with mediocre-quality long reads carried 241 virulence genes, whereas 184 virulence genes were identified in the hybrid assemblies of low-quality long reads. The MaSuRCA assemblies of Escherichia coli O157:H7 and Salmonella Typhimurium with mediocre-quality long reads contained 126 and 118 virulence genes, respectively, while 110 and 107 virulence genes were detected in their MaSuRCA assemblies of low-quality long reads, respectively. All approaches performed well in our MLST and phylogenetic analyses. The pan genomes of the hybrid assemblies of S. Typhimurium with mediocre-quality long reads were similar to that of the reference genome, while SPAdes and Unicycler were more tolerant of low-quality long reads than MaSuRCA for the pan-genome analysis. All approaches functioned well in the pan-genome analysis of Campylobacter jejuni with real reads. Our research demonstrates the hybrid assembly pipeline of Unicycler as a superior approach for genomic analyses of bacterial pathogens using Illumina and Oxford Nanopore sequencing.

中文翻译:

使用 Illumina 和 Oxford Nanopore 测序对细菌病原体进行基因组分析的基准混合组装方法。

我们使用 Illumina 和 Oxford Nanopore 测序,通过确定基因组完整性和准确性、抗菌素耐药性 (AMR)、毒力潜力、多位点序列分型 (MLST)、系统发育和泛基因组,对 MaSuRCA、SPAdes 和 Unicycler 的混合组装方法进行了基准测试,用于细菌病原体. 测试了 10 种细菌(10 种菌株)的模拟读数,包括普通和低质量的读数,而测试了 11 种细菌(12 种菌株)的真实读数。Unicycler 在实现连续基因组方面表现最好,紧随其后的是 MaSuRCA,而所有 SPAdes 组件都不完整。MaSuRCA 对低质量长读的容忍度低于 SPAdes 和 Unicycler。五种抗微生物菌株与模拟读数的混合组装提供了与参考基因组一致的 AMR 基因型。具有真实读数的金黄色葡萄球菌的 MaSuRCA 组装包含 msr(A) 和 tet(K),而参考基因组和 SPAdes 和 Unicycler 组装包含 blaZ。参考基因组和杂交组合的 AMR 基因型与其他五种具有真实读数的抗菌素耐药菌株一致。所有混合装配中的毒力基因数量与参考基因组相似,无论模拟或真实读数如何。只有一个例外,即长读长质量一般的铜绿假单胞菌的参考基因组和混合组装携带了 241 个毒力基因,而在低质量长读长的混合组装中鉴定了 184 个毒力基因。大肠杆菌 O157 的 MaSuRCA 组件:具有中等质量长读长的 H7 和鼠伤寒沙门氏菌分别包含 126 和 118 个毒力基因,而在低质量长读长的 MaSuRCA 组件中分别检测到 110 和 107 个毒力基因。所有方法在我们的 MLST 和系统发育分析中都表现良好。长读长质量一般的鼠伤寒沙门氏菌杂交组装的泛基因组与参考基因组相似,而 SPAdes 和 Unicycler 在泛基因组分析中比 MaSuRCA 更能容忍低质量的长读长。所有方法在空肠弯曲菌的泛基因组分析中都发挥了很好的作用。我们的研究证明了 Unicycler 的混合组装管道是使用 Illumina 和 Oxford Nanopore 测序对细菌病原体进行基因组分析的一种优越方法。而在低质量长读长的 MaSuRCA 组件中分别检测到 110 和 107 个毒力基因。所有方法在我们的 MLST 和系统发育分析中都表现良好。长读长质量一般的鼠伤寒沙门氏菌杂交组装的泛基因组与参考基因组相似,而 SPAdes 和 Unicycler 在泛基因组分析中比 MaSuRCA 更能容忍低质量的长读长。所有方法在空肠弯曲菌的泛基因组分析中都发挥了很好的作用。我们的研究证明了 Unicycler 的混合组装管道是使用 Illumina 和 Oxford Nanopore 测序对细菌病原体进行基因组分析的一种优越方法。而在低质量长读长的 MaSuRCA 组件中分别检测到 110 和 107 个毒力基因。所有方法在我们的 MLST 和系统发育分析中都表现良好。长读长质量一般的鼠伤寒沙门氏菌杂交组装的泛基因组与参考基因组相似,而 SPAdes 和 Unicycler 在泛基因组分析中比 MaSuRCA 更能容忍低质量的长读长。所有方法在空肠弯曲菌的泛基因组分析中都发挥了很好的作用。我们的研究证明了 Unicycler 的混合组装管道是使用 Illumina 和 Oxford Nanopore 测序对细菌病原体进行基因组分析的一种优越方法。所有方法在我们的 MLST 和系统发育分析中都表现良好。长读长质量一般的鼠伤寒沙门氏菌杂交组装的泛基因组与参考基因组相似,而 SPAdes 和 Unicycler 在泛基因组分析中比 MaSuRCA 更能容忍低质量的长读长。所有方法在空肠弯曲菌的泛基因组分析中都发挥了很好的作用。我们的研究证明了 Unicycler 的混合组装管道是使用 Illumina 和 Oxford Nanopore 测序对细菌病原体进行基因组分析的一种优越方法。所有方法在我们的 MLST 和系统发育分析中都表现良好。长读长质量一般的鼠伤寒沙门氏菌杂交组装的泛基因组与参考基因组相似,而 SPAdes 和 Unicycler 在泛基因组分析中比 MaSuRCA 更能容忍低质量的长读长。所有方法在空肠弯曲菌的泛基因组分析中都发挥了很好的作用。我们的研究证明了 Unicycler 的混合组装管道是使用 Illumina 和 Oxford Nanopore 测序对细菌病原体进行基因组分析的一种优越方法。而在泛基因组分析中,SPAdes 和 Unicycler 比 MaSuRCA 更能容忍低质量的长读长。所有方法在空肠弯曲菌的泛基因组分析中都发挥了很好的作用。我们的研究证明了 Unicycler 的混合组装管道是使用 Illumina 和 Oxford Nanopore 测序对细菌病原体进行基因组分析的一种优越方法。而在泛基因组分析中,SPAdes 和 Unicycler 比 MaSuRCA 更能容忍低质量的长读长。所有方法在空肠弯曲菌的泛基因组分析中都发挥了很好的作用。我们的研究证明了 Unicycler 的混合组装管道是使用 Illumina 和 Oxford Nanopore 测序对细菌病原体进行基因组分析的一种优越方法。
更新日期:2020-09-14
down
wechat
bug