当前位置 : X-MOL首页行业资讯 › Nat. Commun.∣从单细胞Hi-C数据中成像超分辨率全基因组染色质3D结构:Si-C

Nat. Commun.∣从单细胞Hi-C数据中成像超分辨率全基因组染色质3D结构:Si-C

哺乳动物的染色质线性长度可达2米,它折叠在直径为10-20微米的细胞核中形成复杂的3D结构,该结构对基因表达、细胞分化以及疾病发生等生命过程具有重要的调控作用[1-2]如何得到超高分辨率的单细胞的染色质3D结构是生命科学中的一个核心问题。解决这个问题的主要实验手段之一是单细胞Hi-C技术,它能够在全基因组范围内捕捉到细胞中序列距离远但空间距离近的染色质片段对。利用单细胞Hi-C技术研究染色质三维结构的难点在于:(1)Hi-C实验给出的染色质三维结构信息是不同染色质片段对之间的距离约束信息,该约束是二维的、间接的;(2)Hi-C技术不能将每一对在空间上相互靠近的染色质片段都标识出来,意味着Hi-C数据给出的结构信息是不完整的而且是有噪声的 [3]如何从单细胞 Hi-C 数据中准确地构建出高分辨率的染色质3D结构是一个尚未解决的问题。


近日,华南师范大学孟露明博士等人在《自然•通讯》(Nature Communications)发表论文,建立了一个可以从单细胞 Hi-C数据中构建出超高分辨的3D结构的方法, Single-Cell Chromosome Conformation Calculator (Si-C),并利用该方法从G1期小鼠单倍体胚胎干细胞(G1-phase haploid mouse embryonic stem (ES) cell)的单细胞Hi-C数据中快速构建了超高分辨率的全基因组的染色质3D结构。


Si-C方法是基于贝叶斯理论的数据驱动方法。它将染色质粗粒化为均匀的串珠模型,它的目标是获得满足单细胞Hi-C数据(C)的最可几的染色质构象(R)。作者基于贝叶斯理论在构象空间上定义了条件概率P(RC) (条件概率分布,the conditional probability distribution);随后作者定义了染色质的3D构象的总势能为E(R)= Econt(R)+ Ephys(R),其中Econt(R) = -lnP(RC) 描述了与Hi-C约束信息数据相一致的、不同染色质珠子之间的势能,Ephys(R) 是谐振子势,这个势能用于确保序列上相邻的两个珠子之间的连接性。通过优化串珠模型的结构R使总能量E(R)降低,当E(R)达到最小值,则相应的条件概率P(RC)达到最大值,该结构即为满足单细胞Hi-C数据的最可几的染色质构象。为了快速得到高精度的优化结构,作者还引入了层级优化方法。图1给出了Si-C方法的流程图。

图1. 从单细胞Hi-C数据中推断3D结构的Si-C方法流程图。图片来源: Nat. Commun.


在构建了Si-C方法后,作者对该方法的有效性进行了多方交叉验证。(1)Si-C结构与单细胞Hi-C数据的一致性。由于Si-C是数据驱动的方法,因此它构建结构与实验数据的一致性是评估该方法有效性的必要条件。Si-C方法构建的100 kb、10 kb和1 kb精度的结构中,被违反的实验约束均不超过1%,而文献中报道的类似的方法Nudynamics的违反率明显高于Si-C方法(图2a)。(2)Si-C结构与FISH探针实验结果的一致性。Si-C方法构建的3D结构与FISH实验结果高度相关(图2b),分辨率为10 kb的Si-C结构与FISH数据的Pearson相关系数为0.889。在100 kb分辨率下,Si-C结构的相关性为0.931,高于NucDynamics结构的相关性0.888。(3)Si-C结构和多细胞Hi-C图之间的一致性。作者从8个G1期小鼠单倍体胚胎干细胞的单细胞Hi-C数据中出构建了8个10kb精度的单细胞Si-C三维结构,将这些3D结构分别转化成距离矩阵,然后将其平均得到可以与多细胞Hi-C图(图3a)进行比较的平均距离矩阵图(图3b)。图3c显示计算的平均距离矩阵图与多细胞Hi-C图的相关系数为-0.92。而且在多细胞Hi-C图中显示的拓扑关联域(TAD)结构,在平均距离矩阵图中也明显被观察到。(4)在 Si-C结构中一致性地观察到了全基因3D结构的保守特征。这些特征包括(i)每个个染色体在空间上占据不同的区域,并且着丝粒和端粒位于细胞核的两侧;(ii)每各区域分相为常染色质和异染色质区,也即A区室和B区室等。通过以上验证和横向比较,作者发现Si-C方法给出的10 kb精度的小鼠单倍体胚胎干细胞的单细胞全基因组3D结构是可靠的。

图2. Si-C的有效性和性能评估。(a)在100 kb(紫色)、10 kb(红色)和1-kb(绿色)分辨率下,Si-C结构集中违反的实验性接触约束的平均百分比,以及相同单元的NucDynamics 100 kb结构集成的平均违反百分比(蓝色) [4]。(b)8对3D FISH探针测量的中位数空间距离与10 kb分辨率Si-C结构中相应对的中位数距离之间的相关性。(c)Si-C(红色)和NucDynamics(蓝色)在细胞1结构计算成本方面的比较。图片来源: Nat. Commun.

图3.(a)小鼠ES细胞的100 kb分辨率多细胞Hi-C接触频率矩阵。(b)从8个10 kb分辨率单细胞距离矩阵导出的100 kb分辨率平均距离矩阵。TAD区域由三角形标记。(c)a和b图之间的相关性。皮尔逊相关系数(ρ)为-0.92。红线为幂律拟合,标度指数等于-0.3。图片来源: Nat. Commun.


Si-C方法首次在10 kb精度下给出了小鼠单倍体胚胎干细胞的单细胞全基因组3D结构,该结构展示了前所未有的染色质三维结构的折叠细节。如图4所示,作者发现,一些如环状或发夹状等精细结构在100 kb分辨率结构中无法被可视化出来,而在10 kb结构中被很好地展示。这些精细结构对于研究基因调控具有重要的意义。


文章从建模效率上横向比较了能够从哺乳动物单细胞Hi-C数据中构建出全基因组的3D结构的方法,目前只有两个Si-C和NucDynamic,发现Si-C方法的建模速度是NucDynamic的两倍(图2c)。最后,作者指出,为了确保使用Si-C方法从Hi-C接触数据所构建三维结构的可靠性,应确保单个染色质珠子的平均接触读数不小于0.2个,此即Si-C方法的精度极限。

图4. 通过10 kb大小的珠子(左)显示的环状(a)和发夹状(b)超精细结构,以及通过Si-C(中)和Nucdynamics(右)推断的100 kb大小的珠子显示的相同区域的3D结构。图片来源: Nat. Commun.


“如果将单细胞Hi-C实验技术提供的结构信息比喻为二维码,Si-C方法就是一个高效且准确的扫码器。”孟露明博士说,“Si-C方法提供的高精度染色质三维结构将大大降低三维结构与生物功能相关性研究的门槛。”


该论文的第一作者为孟露明博士,同时他也是该论文的唯一通讯作者。硕士研究生王晨曦、石毅副教授(上海交通大学)、罗琼教授(华南师范大学)对该工作均有重要贡献。


原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):

Si-C is a method for inferring super-resolution intact genome structure from single-cell Hi-C data

Luming Meng, Chenxi Wang, Yi Shi & Qiong Luo 

Nat. Commun., 202112, 4369, DOI: 10.1038/s41467-021-24662-z


参考文献:

1. Rowley, M. J. & Corces, V. G. Organizational principles of 3D genome architecture. Nat Rev Genet, 19, 789-800, doi: 10.1038/s41576-018-0060-8 (2018).

2. McCord, R. P., Kaplan, N. & Giorgetti, L. Chromosome Conformation Capture and Beyond: Toward an Integrative View of Chromosome Structure and Function. Mol Cell, 77, 688-708 (2020).

3. You, Q. et al. Direct DNA crosslinking with CAP-C uncovers transcription-dependent chromatin organization at high resolution. Nat Biotechnol, doi: 10.1038/s41587-020-0643-8 (2020).

4. Stevens, T. J. et al. 3D structures of individual mammalian genomes studied by single-cell Hi-C. Nature, 544, 59-64, doi: 10.1038/nature21429 (2017).


如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

阿拉丁
热点论文一站获取
购书送好礼
天然纤维材料
口腔微生物
英语语言编辑翻译加编辑
材料学领域约200份+SCI期刊
定位全球科研英才
中国图象图形学学会合作刊
东北石油大学合作期刊
动物源性食品遗传学与育种
专业英语编辑服务
左智伟--多次发布
广州
深圳湾
多次发布---上海中医药
南科大
新泽西
罗格斯
上海交大
中科院
南科大
ACS材料视界
down
wechat
bug