当前位置: X-MOL 学术bioRxiv. Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
The Gene Expression Deconvolution Interactive Tool (GEDIT): Accurate Cell Type Quantification from Gene Expression Data
bioRxiv - Bioinformatics Pub Date : 2020-09-14 , DOI: 10.1101/728493
Brian B. Nadel , David Lopez , Dennis J. Montoya , Feiyang Ma , Hannah Waddel , Misha M. Khan , Serghei Mangul , Matteo Pellegrini

The cell type composition of heterogeneous tissue samples can be a critical variable in both clinical and laboratory settings. However, current experimental methods of cell type quantification (e.g. cell flow cytometry) are costly, time consuming, and can introduce bias. Computational approaches that infer cell type abundance from expression data offer an alternate solution. While these methods have gained popularity, most are limited to predicting hematopoietic cell types and do not produce accurate predictions for stromal cell types. Many of these methods are also limited to particular platforms, whether RNA-seq or specific microarrays. We present the Gene Expression Deconvolution Interactive Tool (GEDIT), a tool that overcomes these limitations, compares favorably with existing methods, and provides superior versatility. Using both simulated and experimental data, we extensively evaluate the performance of GEDIT and demonstrate that it returns robust results under a wide variety of conditions. These conditions include a variety of platforms (microarray and RNA-seq), tissue types (blood and stromal), and species (human and mouse). Finally, we provide reference data from eight sources spanning a wide variety of stromal and hematopoietic types in both human and mouse. This reference database allows the user to obtain estimates for a wide variety of tissue samples without having to provide their own data. GEDIT also accepts user submitted reference data, thus allowing the estimation of any cell type or subtype, provided that reference data is available.

中文翻译:

基因表达反卷积交互式工具(GEDIT):从基因表达数据中准确进行细胞类型定量

在临床和实验室环境中,异质组织样品的细胞类型组成可能是关键变量。然而,当前的细胞类型定量的实验方法(例如细胞流式细胞术)是昂贵的,费时的并且会引入偏差。从表达数据推断细胞类型丰度的计算方法提供了另一种解决方案。尽管这些方法已经普及,但大多数方法仅限于预测造血细胞类型,而不能对基质细胞类型产生准确的预测。这些方法中的许多方法也仅限于特定平台,无论是RNA-seq还是特定的微阵列。我们提出了基因表达反卷积交互式工具(GEDIT),该工具克服了这些限制,与现有方法相比具有优势,并提供了卓越的多功能性。使用模拟和实验数据,我们广泛评估了GEDIT的性能,并证明了它在各种条件下均能返回可靠的结果。这些条件包括多种平台(微阵列和RNA-seq),组织类型(血液和基质)和物种(人类和小鼠)。最后,我们提供了来自八种来源的参考数据,涵盖了人类和小鼠的多种基质和造血类型。该参考数据库使用户无需提供自己的数据即可获得各种组织样本的估计值。GEDIT还接受用户提交的参考数据,因此只要参考数据可用,就可以估算任何单元格类型或子类型。我们对GEDIT的性能进行了广泛的评估,并证明了它在各种条件下都能返回可靠的结果。这些条件包括多种平台(微阵列和RNA-seq),组织类型(血液和基质)和物种(人类和小鼠)。最后,我们提供了来自八种来源的参考数据,涵盖了人类和小鼠的多种基质和造血类型。该参考数据库使用户无需提供自己的数据即可获得各种组织样本的估计值。GEDIT还接受用户提交的参考数据,因此只要参考数据可用,就可以估算任何单元格类型或子类型。我们对GEDIT的性能进行了广泛的评估,并证明了它在各种条件下都能返回可靠的结果。这些条件包括多种平台(微阵列和RNA-seq),组织类型(血液和基质)和物种(人类和小鼠)。最后,我们提供了来自八种来源的参考数据,涵盖了人类和小鼠的多种基质和造血类型。该参考数据库使用户无需提供自己的数据即可获得各种组织样本的估计值。GEDIT还接受用户提交的参考数据,因此,只要参考数据可用,就可以估算任何单元格类型或子类型。和物种(人类和老鼠)。最后,我们提供了来自八种来源的参考数据,涵盖了人类和小鼠的多种基质和造血类型。该参考数据库使用户无需提供自己的数据即可获得各种组织样本的估计值。GEDIT还接受用户提交的参考数据,因此,只要参考数据可用,就可以估算任何单元格类型或子类型。和物种(人类和老鼠)。最后,我们提供了来自八种来源的参考数据,涵盖了人类和小鼠的多种基质和造血类型。该参考数据库使用户无需提供自己的数据即可获得各种组织样本的估计值。GEDIT还接受用户提交的参考数据,因此,只要参考数据可用,就可以估算任何单元格类型或子类型。
更新日期:2020-09-15
down
wechat
bug