当前位置: X-MOL 学术Biostatistics › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Estimating diversity in networked ecological communities.
Biostatistics ( IF 1.8 ) Pub Date : 2020-05-20 , DOI: 10.1093/biostatistics/kxaa015
Amy D Willis 1 , Bryan D Martin 1
Affiliation  

Comparing ecological communities across environmental gradients can be challenging, especially when the number of different taxonomic groups in the communities is large. In this setting, community-level summaries called diversity indices are widely used to detect changes in the community ecology. However, estimation of diversity indices has received relatively little attention from the statistical community. The most common estimates of diversity are the maximum likelihood estimates of the parameters of a multinomial model, even though the multinomial model implies strict assumptions about the sampling mechanism. In particular, the multinomial model prohibits ecological networks, where taxa positively and negatively co-occur. In this article, we leverage models from the compositional data literature that explicitly account for co-occurrence networks and use them to estimate diversity. Instead of proposing new diversity indices, we estimate popular diversity indices under these models. While the methodology is general, we illustrate the approach for the estimation of the Shannon, Simpson, Bray-Curtis, and Euclidean diversity indices. We contrast our method to multinomial, low-rank, and nonparametric methods for estimating diversity indices. Under simulation, we find that the greatest gains of the method are in strongly networked communities with many taxa. Therefore, to illustrate the method, we analyze the microbiome of seafloor basalts based on a 16S amplicon sequencing dataset with 1425 taxa and 12 communities.

中文翻译:

估计网络生态社区的多样性。

跨环境梯度比较生态群落可能具有挑战性,尤其是当群落中不同分类群的数量很大时。在这种情况下,称为多样性指数的社区级摘要被广泛用于检测社区生态的变化。然而,统计界对多样性指数的估计相对较少。最常见的多样性估计是多项模型参数的最大似然估计,即使多项模型暗示了对采样机制的严格假设。特别是,多项式模型禁止生态网络,其中分类群正负共存。在本文中,我们利用来自组合数据文献的模型,这些模型明确解释了共现网络,并使用它们来估计多样性。我们没有提出新的多样性指数,而是在这些模型下估计流行的多样性指数。虽然该方法是通用的,但我们说明了估计香农、辛普森、布雷-柯蒂斯和欧几里得多样性指数的方法。我们将我们的方法与用于估计多样性指数的多项式、低秩和非参数方法进行对比。在模拟下,我们发现该方法的最大收益是在具有许多分类群的强网络社区中。因此,为了说明该方法,我们基于具有 1425 个分类群和 12 个群落的 16S 扩增子测序数据集分析了海底玄武岩的微生物组。我们没有提出新的多样性指数,而是在这些模型下估计流行的多样性指数。虽然该方法是通用的,但我们说明了估计香农、辛普森、布雷-柯蒂斯和欧几里得多样性指数的方法。我们将我们的方法与用于估计多样性指数的多项式、低秩和非参数方法进行对比。在模拟下,我们发现该方法的最大收益是在具有许多分类群的强网络社区中。因此,为了说明该方法,我们基于具有 1425 个分类群和 12 个群落的 16S 扩增子测序数据集分析了海底玄武岩的微生物组。我们没有提出新的多样性指数,而是在这些模型下估计流行的多样性指数。虽然该方法是通用的,但我们说明了估计香农、辛普森、布雷-柯蒂斯和欧几里得多样性指数的方法。我们将我们的方法与用于估计多样性指数的多项式、低秩和非参数方法进行对比。在模拟下,我们发现该方法的最大收益是在具有许多分类群的强网络社区中。因此,为了说明该方法,我们基于具有 1425 个分类群和 12 个群落的 16S 扩增子测序数据集分析了海底玄武岩的微生物组。我们将我们的方法与用于估计多样性指数的多项式、低秩和非参数方法进行对比。在模拟下,我们发现该方法的最大收益是在具有许多分类群的强网络社区中。因此,为了说明该方法,我们基于具有 1425 个分类群和 12 个群落的 16S 扩增子测序数据集分析了海底玄武岩的微生物组。我们将我们的方法与用于估计多样性指数的多项式、低秩和非参数方法进行对比。在模拟下,我们发现该方法的最大收益是在具有许多分类群的强网络社区中。因此,为了说明该方法,我们基于具有 1425 个分类群和 12 个群落的 16S 扩增子测序数据集分析了海底玄武岩的微生物组。
更新日期:2020-05-20
down
wechat
bug