当前位置: X-MOL 学术Heredity › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
The influence of a priori grouping on inference of genetic clusters: simulation study and literature review of the DAPC method
Heredity ( IF 3.1 ) Pub Date : 2020-08-04 , DOI: 10.1038/s41437-020-0348-2
Joshua M Miller 1 , Catherine I Cullingham 2 , Rhiannon M Peery 1
Affiliation  

Inference of genetic clusters is a key aim of population genetics, sparking development of numerous analytical methods. Within these, there is a conceptual divide between finding de novo structure versus assessment of a priori groups. Recently developed, Discriminant Analysis of Principal Components (DAPC), combines discriminant analysis (DA) with principal component (PC) analysis. When applying DAPC, the groups used in the DA (specified a priori or described de novo) need to be carefully assessed. While DAPC has rapidly become a core technique, the sensitivity of the method to misspecification of groups and how it is being empirically applied, are unknown. To address this, we conducted a simulation study examining the influence of a priori versus de novo group designations, and a literature review of how DAPC is being applied. We found that with a priori groupings, distance between genetic clusters reflected underlying FST. However, when migration rates were high and groups were described de novo there was considerable inaccuracy, both in terms of the number of genetic clusters suggested and placement of individuals into those clusters. Nearly all (90.1%) of 224 studies surveyed used DAPC to find de novo clusters, and for the majority (62.5%) the stated goal matched the results. However, most studies (52.3%) omit key run parameters, preventing repeatability and transparency. Therefore, we present recommendations for standard reporting of parameters used in DAPC analyses. The influence of groupings in genetic clustering is not unique to DAPC, and researchers need to consider their goal and which methods will be most appropriate.

中文翻译:

先验分组对遗传簇推断的影响:DAPC方法的模拟研究和文献综述

遗传簇的推断是群体遗传学的一个关键目标,激发了许多分析方法的发展。在这些之中,发现从头结构与评估先验群体之间存在概念上的分歧。最近开发的主成分判别分析 (DAPC) 将判别分析 (DA) 与主成分 (PC) 分析相结合。应用 DAPC 时,需要仔细评估 DA 中使用的组(先验指定或从头描述)。虽然 DAPC 已迅速成为一项核心技术,但该方法对组错误指定的敏感性以及它如何在经验上应用尚不清楚。为了解决这个问题,我们进行了一项模拟研究,检查了先验组指定与从头组指定的影响,并对如何应用 DAPC 进行了文献回顾。我们发现,通过先验分组,遗传簇之间的距离反映了潜在的 FST。然而,当迁移率很高并且从头开始描述群体时,无论是在建议的遗传集群的数量还是在这些集群中的个体放置方面,都存在相当大的不准确性。在接受调查的 224 项研究中,几乎所有 (90.1%) 都使用 DAPC 来寻找从头集群,并且大多数 (62.5%) 的既定目标与结果相符。然而,大多数研究 (52.3%) 省略了关键的运行参数,从而妨碍了可重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。基因簇之间的距离反映了潜在的 FST。然而,当迁移率很高并且从头开始描述群体时,无论是在建议的遗传集群的数量还是在这些集群中的个体放置方面,都存在相当大的不准确性。在接受调查的 224 项研究中,几乎所有 (90.1%) 都使用 DAPC 来寻找从头集群,并且大多数 (62.5%) 的既定目标与结果相符。然而,大多数研究 (52.3%) 省略了关键的运行参数,从而妨碍了可重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。基因簇之间的距离反映了潜在的 FST。然而,当迁移率很高并且从头开始描述群体时,无论是在建议的遗传集群的数量还是在这些集群中的个体放置方面,都存在相当大的不准确性。在接受调查的 224 项研究中,几乎所有 (90.1%) 都使用 DAPC 来寻找从头集群,并且大多数 (62.5%) 的既定目标与结果相符。然而,大多数研究 (52.3%) 省略了关键的运行参数,从而妨碍了可重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。当迁移率很高并且从头开始描述群体时,无论是在建议的遗传集群的数量还是个人进入这些集群的数量方面,都存在相当大的不准确之处。在接受调查的 224 项研究中,几乎所有 (90.1%) 都使用 DAPC 来寻找从头集群,并且大多数 (62.5%) 的既定目标与结果相符。然而,大多数研究 (52.3%) 省略了关键的运行参数,从而妨碍了可重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。当迁移率很高并且从头开始描述群体时,无论是在建议的遗传集群的数量还是个人进入这些集群的数量方面,都存在相当大的不准确之处。在接受调查的 224 项研究中,几乎所有 (90.1%) 都使用 DAPC 来寻找从头集群,并且大多数 (62.5%) 的既定目标与结果相符。然而,大多数研究 (52.3%) 省略了关键的运行参数,从而妨碍了可重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。就建议的遗传集群的数量和将个体放置到这些集群中而言。在接受调查的 224 项研究中,几乎所有 (90.1%) 都使用 DAPC 来寻找从头集群,并且大多数 (62.5%) 的既定目标与结果相符。然而,大多数研究 (52.3%) 省略了关键的运行参数,从而妨碍了可重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。就建议的遗传集群的数量和将个体放置到这些集群中而言。在接受调查的 224 项研究中,几乎所有 (90.1%) 都使用 DAPC 来寻找从头集群,并且大多数 (62.5%) 的既定目标与结果相符。然而,大多数研究 (52.3%) 省略了关键的运行参数,从而妨碍了可重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。防止重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。防止重复性和透明度。因此,我们提出了 DAPC 分析中使用的参数标准报告的建议。分组对遗传聚类的影响并不是 DAPC 独有的,研究人员需要考虑他们的目标以及最合适的方法。
更新日期:2020-08-04
down
wechat
bug