当前位置: X-MOL 学术bioRxiv. Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Building a learnable universal coordinate system for single-cell atlas with a joint-VAE model
bioRxiv - Bioinformatics Pub Date : 2023-07-30 , DOI: 10.1101/2021.09.09.459281
Haoxiang Gao , Kui Hua , Sijie Chen , Qijin Yin , Rui Jiang , Xuegong Zhang

A universal coordinate system that can ensemble the huge number of cells and capture their heterogeneities is of vital importance for constructing large-scale cell atlases as references for future molecular and cellular studies. Studies have shown that cells in complex organs exhibit multifaceted heterogeneities in their transcriptomic features at multiple resolutions. This nature of complexity makes it hard to design a fixed coordinate system through a combination of known features. It is desirable to build a learnable universal coordinate model that can capture major heterogeneities and serve as a controlled generative model for data argumentation. We developed UniCoord, a specially tuned joint-VAE model to represent single-cell transcriptomic data in a lower-dimensional latent space with high interpretability. Each latent dimension can represent either discrete or continuous feature, and either supervised by prior knowledge or unsupervised. The original transcriptomic profiles can be regenerated from the latent dimensions. The latent dimensions can be easily reconfigured to generate transcriptomic profiles of pseudo cells with desired properties. UniCoord can also be used as a pre-trained model to analyze new data with unseen cell types and thus can serve as a feasible framework for cell annotation and comparison. UniCoord provides a prototype for a learnable universal coordinate framework to enable better analysis and generation of cells with highly orchestrated functions and heterogeneities.

中文翻译:

使用联合 VAE 模型构建可学习的单细胞图谱通用坐标系

一个可以集合大量细胞并捕获其异质性的通用坐标系对于构建大规模细胞图谱作为未来分子和细胞研究的参考至关重要。研究表明,复杂器官中的细胞在多种分辨率下的转录组特征表现出多方面的异质性。这种复杂性使得很难通过已知特征的组合来设计固定的坐标系。人们希望建立一个可学习的通用坐标模型,该模型可以捕获主要的异质性并用作数据论证的受控生成模型。我们开发了 UniCoord,这是一种经过专门调整的联合 VAE 模型,用于表示具有高可解释性的低维潜在空间中的单细胞转录组数据。每个潜在维度可以表示离散或连续特征,并且可以由先验知识监督或无监督。原始转录组谱可以从潜在维度再生。潜在维度可以轻松地重新配置,以生成具有所需特性的伪细胞的转录组图谱。UniCoord 还可以用作预训练模型来分析未见过的细胞类型的新数据,因此可以作为细胞注释和比较的可行框架。UniCoord 提供了可学习通用坐标框架的原型,可以更好地分析和生成具有高度协调的功能和异质性的细胞。原始转录组谱可以从潜在维度再生。潜在维度可以轻松地重新配置,以生成具有所需特性的伪细胞的转录组图谱。UniCoord 还可以用作预训练模型来分析未见过的细胞类型的新数据,因此可以作为细胞注释和比较的可行框架。UniCoord 提供了可学习通用坐标框架的原型,可以更好地分析和生成具有高度协调的功能和异质性的细胞。原始转录组谱可以从潜在维度再生。潜在维度可以轻松地重新配置,以生成具有所需特性的伪细胞的转录组图谱。UniCoord 还可以用作预训练模型来分析未见过的细胞类型的新数据,因此可以作为细胞注释和比较的可行框架。UniCoord 提供了可学习通用坐标框架的原型,可以更好地分析和生成具有高度协调的功能和异质性的细胞。UniCoord 还可以用作预训练模型来分析未见过的细胞类型的新数据,因此可以作为细胞注释和比较的可行框架。UniCoord 提供了可学习通用坐标框架的原型,可以更好地分析和生成具有高度协调的功能和异质性的细胞。UniCoord 还可以用作预训练模型来分析未见过的细胞类型的新数据,因此可以作为细胞注释和比较的可行框架。UniCoord 提供了可学习通用坐标框架的原型,可以更好地分析和生成具有高度协调的功能和异质性的细胞。
更新日期:2023-07-30
down
wechat
bug