当前位置: X-MOL 学术Stat. Med. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Bayesian modified Ising model for identifying spatially variable genes from spatial transcriptomics data
Statistics in Medicine ( IF 2 ) Pub Date : 2022-07-24 , DOI: 10.1002/sim.9530
Xi Jiang 1, 2 , Guanghua Xiao 2 , Qiwei Li 3
Affiliation  

A recent technology breakthrough in spatial molecular profiling (SMP) has enabled the comprehensive molecular characterizations of single cells while preserving spatial information. It provides new opportunities to delineate how cells from different origins form tissues with distinctive structures and functions. One immediate question in SMP data analysis is to identify genes whose expressions exhibit spatially correlated patterns, called spatially variable (SV) genes. Most current methods to identify SV genes are built upon the geostatistical model with Gaussian process to capture the spatial patterns. However, the Gaussian process models rely on ad hoc kernels that could limit the models' ability to identify complex spatial patterns. In order to overcome this challenge and capture more types of spatial patterns, we introduce a Bayesian approach to identify SV genes via a modified Ising model. The key idea is to use the energy interaction parameter of the Ising model to characterize spatial expression patterns. We use auxiliary variable Markov chain Monte Carlo algorithms to sample from the posterior distribution with an intractable normalizing constant in the model. Simulation studies using both simulated and synthetic data showed that the energy-based modeling approach led to higher accuracy in detecting SV genes than those kernel-based methods. When applied to two real spatial transcriptomics (ST) datasets, the proposed method discovered novel spatial patterns that shed light on the biological mechanisms. In summary, the proposed method presents a new perspective for analyzing ST data.

中文翻译:

用于从空间转录组学数据中识别空间可变基因的贝叶斯修正 Ising 模型

空间分子谱分析 (SMP) 的最新技术突破使单细胞的全面分子表征成为可能,同时保留了空间信息。它为描述不同来源的细胞如何形成具有独特结构和功能的组织提供了新的机会。SMP 数据分析中的一个直接问题是识别其表达表现出空间相关模式的基因,称为空间可变 (SV) 基因。目前识别 SV 基因的大多数方法都建立在具有高斯过程的地统计模型之上,以捕获空间模式。然而,高斯过程模型依赖于临时内核,这可能会限制模型识别复杂空间模式的能力。为了克服这一挑战并捕捉更多类型的空间模式,我们介绍了一种贝叶斯方法,通过修改后的伊辛模型来识别 SV 基因。关键思想是利用伊辛模型的能量相互作用参数来表征空间表达模式。我们使用辅助变量马尔可夫链蒙特卡洛算法从模型中具有难以处理的归一化常数的后验分布中采样。使用模拟数据和合成数据的模拟研究表明,与那些基于内核的方法相比,基于能量的建模方法在检测 SV 基因方面具有更高的准确性。当应用于两个真实的空间转录组学 (ST) 数据集时,所提出的方法发现了揭示生物学机制的新空间模式。总之,所提出的方法为分析 ST 数据提供了一个新的视角。关键思想是利用伊辛模型的能量相互作用参数来表征空间表达模式。我们使用辅助变量马尔可夫链蒙特卡洛算法从模型中具有难以处理的归一化常数的后验分布中采样。使用模拟数据和合成数据的模拟研究表明,与那些基于内核的方法相比,基于能量的建模方法在检测 SV 基因方面具有更高的准确性。当应用于两个真实的空间转录组学 (ST) 数据集时,所提出的方法发现了揭示生物学机制的新空间模式。总之,所提出的方法为分析 ST 数据提供了一个新的视角。关键思想是利用伊辛模型的能量相互作用参数来表征空间表达模式。我们使用辅助变量马尔可夫链蒙特卡洛算法从模型中具有难以处理的归一化常数的后验分布中采样。使用模拟数据和合成数据的模拟研究表明,与那些基于内核的方法相比,基于能量的建模方法在检测 SV 基因方面具有更高的准确性。当应用于两个真实的空间转录组学 (ST) 数据集时,所提出的方法发现了揭示生物学机制的新空间模式。总之,所提出的方法为分析 ST 数据提供了一个新的视角。我们使用辅助变量马尔可夫链蒙特卡洛算法从模型中具有难以处理的归一化常数的后验分布中采样。使用模拟数据和合成数据的模拟研究表明,与那些基于内核的方法相比,基于能量的建模方法在检测 SV 基因方面具有更高的准确性。当应用于两个真实的空间转录组学 (ST) 数据集时,所提出的方法发现了揭示生物学机制的新空间模式。总之,所提出的方法为分析 ST 数据提供了一个新的视角。我们使用辅助变量马尔可夫链蒙特卡洛算法从模型中具有难以处理的归一化常数的后验分布中采样。使用模拟数据和合成数据的模拟研究表明,与那些基于内核的方法相比,基于能量的建模方法在检测 SV 基因方面具有更高的准确性。当应用于两个真实的空间转录组学 (ST) 数据集时,所提出的方法发现了揭示生物学机制的新空间模式。总之,所提出的方法为分析 ST 数据提供了一个新的视角。使用模拟数据和合成数据的模拟研究表明,与那些基于内核的方法相比,基于能量的建模方法在检测 SV 基因方面具有更高的准确性。当应用于两个真实的空间转录组学 (ST) 数据集时,所提出的方法发现了揭示生物学机制的新空间模式。总之,所提出的方法为分析 ST 数据提供了一个新的视角。使用模拟数据和合成数据的模拟研究表明,与那些基于内核的方法相比,基于能量的建模方法在检测 SV 基因方面具有更高的准确性。当应用于两个真实的空间转录组学 (ST) 数据集时,所提出的方法发现了揭示生物学机制的新空间模式。总之,所提出的方法为分析 ST 数据提供了一个新的视角。
更新日期:2022-07-24
down
wechat
bug