当前位置: X-MOL 学术Proc. Natl. Acad. Sci. U.S.A. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A hierarchical Bayesian mixture model for inferring the expression state of genes in transcriptomes.
Proceedings of the National Academy of Sciences of the United States of America ( IF 9.4 ) Pub Date : 2020-08-11 , DOI: 10.1073/pnas.1919748117
Ammon Thompson 1 , Michael R May 2 , Brian R Moore 2 , Artyom Kopp 2
Affiliation  

Transcriptomes are key to understanding the relationship between genotype and phenotype. The ability to infer the expression state (active or inactive) of genes in the transcriptome offers unique benefits for addressing this issue. For example, qualitative changes in gene expression may underly the origin of novel phenotypes, and expression states are readily comparable between tissues and species. However, inferring the expression state of genes is a surprisingly difficult problem, owing to the complex biological and technical processes that give rise to observed transcriptomic datasets. Here, we develop a hierarchical Bayesian mixture model that describes this complex process and allows us to infer expression state of genes from replicate transcriptomic libraries. We explore the statistical behavior of this method with analyses of simulated datasets—where we demonstrate its ability to correctly infer true (known) expression states—and empirical-benchmark datasets, where we demonstrate that the expression states inferred from RNA-sequencing (RNA-seq) datasets using our method are consistent with those based on independent evidence. The power of our method to correctly infer expression states is generally high and remarkably, approaches the maximum possible power for this inference problem. We present an empirical analysis of primate-brain transcriptomes, which identifies genes that have a unique expression state in humans. Our method is implemented in the freely available R package zigzag.



中文翻译:

用于推断转录组中基因表达状态的分级贝叶斯混合模型。

转录组是理解基因型和表型之间关系的关键。推断转录组中基因表达状态(有活性或无活性)的能力为解决此问题提供了独特的好处。例如,基因表达的质变可能是新表型的起源,而表达状态在组织和物种之间很容易比较。然而,由于产生观察到的转录组数据集的复杂的生物学和技术过程,推断基因的表达状态是一个令人惊讶的难题。在这里,我们开发了描述此复杂过程的分层贝叶斯混合模型,并允许我们从复制转录组文库中推断基因的表达状态。我们通过对模拟数据集进行分析来探索这种方法的统计行为-在其中我们展示了其正确推断真实(已知)表达状态的能力-在经验基准数据集中,我们展示了从RNA测序(RNA- seq)数据集使用我们的方法与基于独立证据的数据集一致。我们的方法正确推断表达状态的能力通常很高,并且非常明显,接近此推断问题的最大可能功效。我们提出了灵长类脑转录组的实证分析,可确定在人类中具有独特表达状态的基因。我们的方法在免费提供的R包之字形中实现。其中我们证明了使用我们的方法从RNA测序(RNA-seq)数据集推断出的表达状态与基于独立证据的表达状态一致。我们的方法正确推断表达状态的能力通常很高,并且非常明显,接近此推断问题的最大可能功效。我们提出了灵长类脑转录组的实证分析,可确定在人类中具有独特表达状态的基因。我们的方法在免费提供的R包之字形中实现。其中我们证明了使用我们的方法从RNA测序(RNA-seq)数据集推断出的表达状态与基于独立证据的表达状态一致。我们的方法正确推断表达状态的能力通常很高,并且明显接近此推断问题的最大可能功效。我们提出了灵长类脑转录组的实证分析,可确定在人类中具有独特表达状态的基因。我们的方法在免费提供的R包之字形中实现。接近此推断问题的最大可能功率。我们提出了灵长类脑转录组的实证分析,可确定在人类中具有独特表达状态的基因。我们的方法在免费提供的R包之字形中实现。接近此推断问题的最大可能功率。我们提出了灵长类脑转录组的实证分析,可确定在人类中具有独特表达状态的基因。我们的方法在免费提供的R包之字形中实现。

更新日期:2020-08-11
down
wechat
bug