当前位置: X-MOL 学术Genome Biol. Evol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Chromosomal-Level Genome Assembly of the Sea Urchin Lytechinus variegatus Substantially Improves Functional Genomic Analyses.
Genome Biology and Evolution ( IF 3.2 ) Pub Date : 2020-05-20 , DOI: 10.1093/gbe/evaa101
Phillip L Davidson 1 , Haobing Guo 2, 3 , Lingyu Wang 1 , Alejandro Berrio 1 , He Zhang 2, 3 , Yue Chang 2, 3 , Andrew L Soborowski 4, 5 , David R McClay 1 , Guangyi Fan 2, 3 , Gregory A Wray 1, 4, 5
Affiliation  

Lytechinus variegatus is a camarodont sea urchin found widely throughout the western Atlantic Ocean in a variety of shallow-water marine habitats. Its distribution, abundance, and amenability to developmental perturbation make it a popular model for ecologists and developmental biologists. Here, we present a chromosomal-level genome assembly of L. variegatus generated from a combination of PacBio long reads, 10X Genomics sequencing, and HiC chromatin interaction sequencing. We show L. variegatus has 19 chromosomes with an assembly size of 870.4 Mb. The contiguity and completeness of this assembly is reflected by a scaffold length N50 of 45.5Mb and BUSCO completeness score of 95.5%. Ab-initio and transcript-informed gene modelling and annotation identified 27,232 genes with an average gene length of 12.6 Kb, comprising an estimated 39.5% of the genome. Repetitive regions, on the other hand, make up approximately 45.4% of the genome. Physical mapping of well-studied developmental genes onto each chromosome reveals non-random spatial distribution of distinct genes and gene families, which provides insight into how certain gene families may have evolved and are transcriptionally regulated in this species. Lastly, aligning RNA-seq and ATAC-seq data onto this assembly demonstrates the value of highly contiguous, complete genome assemblies for functional genomics analyses that is unattainable with fragmented, incomplete assemblies. This genome will be of great value to the scientific community as a resource for genome evolution, developmental, and ecological studies of this species and the Echinodermata.

中文翻译:

海胆 Lytechinus variegatus 的染色体水平基因组组装显着改善了功能基因组分析。

Lytechinus variegatus 是一种肉色海胆,广泛分布于整个西大西洋的各种浅水海洋栖息地。它的分布、丰富度和对发育扰动的顺从性使其成为生态学家和发育生物学家的流行模型。在这里,我们展示了由 PacBio 长读长、10X 基因组学测序和 HiC 染色质相互作用测序的组合产生的 L. variegatus 的染色体水平基因组组装。我们显示 L. variegatus 有 19 条染色体,组装大小为 870.4 Mb。该组件的连续性和完整性由 45.5Mb 的支架长度 N50 和 95.5% 的 BUSCO 完整性评分反映。Ab-initio 和转录信息基因建模和注释确定了 27,232 个基因,平均基因长度为 12.6 Kb,估计包括 39 个。基因组的 5%。另一方面,重复区域约占基因组的 45.4%。将经过充分研究的发育基因映射到每条染色体上的物理图谱揭示了不同基因和基因家族的非随机空间分布,这提供了对某些基因家族如何进化并在该物种中受到转录调控的洞察。最后,将 RNA-seq 和 ATAC-seq 数据比对到该组装上,证明了高度连续、完整的基因组组装在功能基因组学分析中的价值,这是碎片化、不完整组装无法实现的。该基因组作为该物种和棘皮动物的基因组进化、发育和生态研究的资源,对科学界具有重要价值。基因组的 4%。将经过充分研究的发育基因映射到每条染色体上的物理图谱揭示了不同基因和基因家族的非随机空间分布,这提供了对某些基因家族如何进化并在该物种中受到转录调控的洞察。最后,将 RNA-seq 和 ATAC-seq 数据比对到该组装上,证明了高度连续、完整的基因组组装在功能基因组学分析中的价值,这是碎片化、不完整组装无法实现的。该基因组作为该物种和棘皮动物的基因组进化、发育和生态研究的资源,对科学界具有重要价值。基因组的 4%。将经过充分研究的发育基因映射到每条染色体上的物理图谱揭示了不同基因和基因家族的非随机空间分布,这提供了对某些基因家族如何进化并在该物种中受到转录调控的洞察。最后,将 RNA-seq 和 ATAC-seq 数据比对到该组装上,证明了高度连续、完整的基因组组装在功能基因组学分析中的价值,这是碎片化、不完整组装无法实现的。该基因组作为该物种和棘皮动物的基因组进化、发育和生态研究的资源,对科学界具有重要价值。这提供了对某些基因家族如何在该物种中进化和转录调控的深入了解。最后,将 RNA-seq 和 ATAC-seq 数据比对到该组装上,证明了高度连续、完整的基因组组装在功能基因组学分析中的价值,这是碎片化、不完整组装无法实现的。该基因组作为该物种和棘皮动物的基因组进化、发育和生态研究的资源,对科学界具有重要价值。这提供了对某些基因家族如何在该物种中进化和转录调控的深入了解。最后,将 RNA-seq 和 ATAC-seq 数据比对到该组装上,证明了高度连续、完整的基因组组装在功能基因组学分析中的价值,这是碎片化、不完整组装无法实现的。该基因组作为该物种和棘皮动物的基因组进化、发育和生态研究的资源,对科学界具有重要价值。不完整的组件。该基因组作为该物种和棘皮动物的基因组进化、发育和生态研究的资源,对科学界具有重要价值。不完整的组件。该基因组作为该物种和棘皮动物的基因组进化、发育和生态研究的资源,对科学界具有重要价值。
更新日期:2020-05-20
down
wechat
bug