当前位置: X-MOL 学术Mol. Ecol. Resour. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Joint identification of sex and sex-linked scaffolds in non-model organisms using low depth sequencing data
Molecular Ecology Resources ( IF 5.5 ) Pub Date : 2021-08-24 , DOI: 10.1111/1755-0998.13491
Casia Nursyifa 1 , Anna Brüniche-Olsen 1 , Genis Garcia-Erill 1 , Rasmus Heller 1 , Anders Albrechtsen 1
Affiliation  

Being able to assign sex to individuals and identify autosomal and sex-linked scaffolds are essential in most population genomic analyses. Non-model organisms often have genome assemblies at scaffold-level and lack characterization of sex-linked scaffolds. Previous methods to identify sex and sex-linked scaffolds have relied on synteny between the non-model organism and a closely related species or prior knowledge about the sex of the samples to identify sex-linked scaffolds. In the latter case, the difference in depth of coverage between the autosomes and the sex chromosomes are used. Here, we present “sex assignment through coverage” (SATC), a method to assign sex to samples and identify sex-linked scaffolds from next generation sequencing (NGS) data. The method works for species with a homogametic/heterogametic sex determination system and only requires a scaffold-level reference assembly and sampling of both sexes with whole genome sequencing (WGS) data. We use the sequencing depth distribution across scaffolds to jointly identify: (i) male and female individuals, and (ii) sex-linked scaffolds. This is achieved through projecting the scaffold depths into a low-dimensional space using principal component analysis (PCA) and subsequent Gaussian mixture clustering. We demonstrate the applicability of our method using data from five mammal species and a bird species complex. The method is freely available at https://github.com/popgenDK/SATC as R code and a graphical user interface (GUI).

中文翻译:

使用低深度测序数据联合鉴定非模式生物中的性和性相关支架

在大多数人群基因组分析中,能够为个体分配性别并识别常染色体和性连锁支架是必不可少的。非模式生物通常具有支架​​水平的基因组组装,并且缺乏性连锁支架的表征。以前识别性别和与性相关的支架的方法依赖于非模式生物与密切相关的物种之间的同线性或关于样本性别的先验知识来识别性相关的支架。在后一种情况下,使用常染色体和性染色体之间覆盖深度的差异。在这里,我们提出了“通过覆盖分配性别”(SATC),这是一种将性别分配给样本并从下一代测序(NGS)数据中识别与性别相关的支架的方法。该方法适用于具有同配子/异配子性别确定系统的物种,并且只需要支架级参考组装和具有全基因组测序 (WGS) 数据的两性样本。我们使用跨支架的测序深度分布来共同识别:(i)男性和女性个体,以及(ii)与性别相关的支架。这是通过使用主成分分析 (PCA) 和随后的高斯混合聚类将支架深度投影到低维空间来实现的。我们使用来自五种哺乳动物和一种鸟类复合体的数据证明了我们方法的适用性。该方法可在 https://github.com/popgenDK/SATC 作为 R 代码和图形用户界面 (GUI) 免费获得。我们使用跨支架的测序深度分布来共同识别:(i)男性和女性个体,以及(ii)与性别相关的支架。这是通过使用主成分分析 (PCA) 和随后的高斯混合聚类将支架深度投影到低维空间来实现的。我们使用来自五种哺乳动物和一种鸟类复合体的数据证明了我们方法的适用性。该方法可在 https://github.com/popgenDK/SATC 作为 R 代码和图形用户界面 (GUI) 免费获得。我们使用跨支架的测序深度分布来共同识别:(i)男性和女性个体,以及(ii)与性别相关的支架。这是通过使用主成分分析 (PCA) 和随后的高斯混合聚类将支架深度投影到低维空间来实现的。我们使用来自五种哺乳动物和一种鸟类复合体的数据证明了我们方法的适用性。该方法可在 https://github.com/popgenDK/SATC 作为 R 代码和图形用户界面 (GUI) 免费获得。我们使用来自五种哺乳动物和一种鸟类复合体的数据证明了我们方法的适用性。该方法可在 https://github.com/popgenDK/SATC 作为 R 代码和图形用户界面 (GUI) 免费获得。我们使用来自五种哺乳动物和一种鸟类复合体的数据证明了我们方法的适用性。该方法可在 https://github.com/popgenDK/SATC 作为 R 代码和图形用户界面 (GUI) 免费获得。
更新日期:2021-08-24
down
wechat
bug