当前位置: X-MOL 学术bioRxiv. Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Mining metagenomes for natural product biosynthetic gene clusters: unlocking new potential with ultrafast techniques
bioRxiv - Bioinformatics Pub Date : 2021-01-20 , DOI: 10.1101/2021.01.20.427441
Emiliano Pereira , Marnix Medema , Pier Luigi Buttigieg , Peter Meinicke , Frank Oliver Gloeckner , Antonio Fernandez-Guerra

Microorganisms produce an immense variety of natural products through the expression of Biosynthetic Gene Clusters (BGCs): physically clustered genes that encode the enzymes of a specialized metabolic pathway. These natural products cover a wide range of chemical classes (e.g., aminoglycosides, lantibiotics, nonribosomal peptides, oligosaccharides, polyketides, terpenes) that are highly valuable for industrial and medical applications. Metagenomics, as a culture-independent approach, has greatly enhanced our ability to survey the functional potential of microorganisms and is growing in popularity for the mining of BGCs. However, to effectively exploit metagenomic data to this end, it will be crucial to more efficiently identify these genomic elements in highly complex and ever-increasing volumes of data. Here, we address this challenge by developing the ultrafast Biosynthetic Gene cluster MEtagenomic eXploration toolbox (BiG-MEx). BiG-MEx rapidly identifies a broad range of BGC protein domains, assess their diversity and novelty, and predicts the abundance profile of natural product BGC classes in metagenomic data. We show the advantages of BiG-MEx compared to standard BGC-mining approaches, and use it to explore the BGC domain and class composition of samples in the TARA Oceans and Human Microbiome Project datasets. In these analyses, we demonstrate BiG-MEx's applicability to study the distribution, diversity, and ecological roles of BGCs in metagenomic data, and guide the exploration of natural products with clinical applications.

中文翻译:

挖掘天然产物生物合成基因簇的元基因组:利用超快技术释放新潜力

微生物通过生物合成基因簇(BGC)的表达生产出各种各样的天然产物:这些生物簇聚的基因编码专门的代谢途径的酶。这些天然产物涵盖了广泛的化学类别(例如,氨基糖苷,羊毛硫抗生素,非核糖体肽,寡糖,聚酮化合物,萜烯),对工业和医学应用具有很高的价值。元基因组学作为一种与文化无关的方法,极大地增强了我们调查微生物功能潜能的能力,并且在挖掘BGC方面越来越受欢迎。然而,为了有效地利用宏基因组学数据,至关重要的是,在高度复杂且不断增长的数据量中更有效地识别这些基因组元素。这里,我们通过开发超快速生物合成基因簇MEtagenomic eXploration工具箱(BiG-MEx)来应对这一挑战。BiG-MEx可快速识别广泛的BGC蛋白结构域,评估其多样性和新颖性,并在宏基因组学数据中预测天然产物BGC类的丰度概况。我们展示了BiG-MEx与标准BGC采矿方法相比的优势,并用它来探索TARA海洋和人类微生物组项目数据集中样品的BGC域和类别组成。在这些分析中,我们证明了BiG-MEx在研究宏基因组学数据中BGC的分布,多样性和生态作用方面的适用性,并指导具有临床应用的天然产物的探索。BiG-MEx可快速识别广泛的BGC蛋白结构域,评估其多样性和新颖性,并在宏基因组学数据中预测天然产物BGC类的丰度概况。我们展示了BiG-MEx与标准BGC采矿方法相比的优势,并用它来探索TARA海洋和人类微生物组项目数据集中样品的BGC域和类别组成。在这些分析中,我们证明了BiG-MEx在研究宏基因组学数据中BGC的分布,多样性和生态作用方面的适用性,并指导具有临床应用的天然产物的探索。BiG-MEx可快速识别广泛的BGC蛋白结构域,评估其多样性和新颖性,并在宏基因组学数据中预测天然产物BGC类的丰度概况。我们展示了BiG-MEx与标准BGC采矿方法相比的优势,并用它来探索TARA海洋和人类微生物组项目数据集中样品的BGC域和类别组成。在这些分析中,我们证明了BiG-MEx在研究宏基因组学数据中BGC的分布,多样性和生态作用方面的适用性,并指导具有临床应用的天然产物的探索。并用它来探索TARA海洋和人类微生物组计划数据集中样品的BGC域和类别组成。在这些分析中,我们证明了BiG-MEx在研究宏基因组学数据中BGC的分布,多样性和生态作用方面的适用性,并指导具有临床应用的天然产物的探索。并用它来探索TARA海洋和人类微生物组计划数据集中样品的BGC域和类别组成。在这些分析中,我们证明了BiG-MEx在研究宏基因组学数据中BGC的分布,多样性和生态作用方面的适用性,并指导具有临床应用的天然产物的探索。
更新日期:2021-01-21
down
wechat
bug