当前位置 : X-MOL首页行业资讯 › 基于DNA标记的新型高通量筛选方法的建立及其在筛选DNA表观遗传修饰特异性结合蛋白中的应用

基于DNA标记的新型高通量筛选方法的建立及其在筛选DNA表观遗传修饰特异性结合蛋白中的应用

注:文末有本文科研思路分析


DNA化学修饰是脊椎动物遗传信息中重要的表观遗传形式之一,其中发生于CpG中胞嘧啶的5碳上的甲基化是最常见的一种DNA化学修饰,已知人类基因组中约80%的CpG位点的胞嘧啶都可以在某一个生理条件下被甲基化(mC)。由于甲基化在许多细胞生理活动中发挥着关键作用(基因组印记、X染色体失活、抑制转座因子和调节转录等),因此甲基化胞嘧啶也被称为组成DNA的第五种碱基。近年来,越来越多新的DNA表观遗传修饰被鉴定发现,比如CpG位点中胞嘧啶5碳上的甲基修饰可以被TET酶进一步氧化形成羟甲基修饰(hmC)、甲酰基修饰(fC)和羧基修饰(caC)、以及发生于腺嘌呤6碳上的甲基化修饰(m6A)等。筛选和鉴定识别这些DNA表观遗传修饰的蛋白(readers)是揭开其调控机制神秘面纱的关键一步,然而由于筛选技术的限制,我们对这类蛋白知之甚少。


传统的高通量筛选方法,如蛋白质结合微阵列(PBM)、转录因子(TF)蛋白芯片、酵母单杂交、SMiLE-seq和SELEX等技术,在筛选鉴定蛋白质-DNA相互作用方面发挥了重要作用,产生了大量的数据,大大开拓了对于转录因子的认知。然而由于本身的技术限制,这些数据通常不涉及DNA的表观遗传修饰,或仅囿于mCpG。更重要的是上述方法都是基于一对多的筛选策略,费时费力,工作量非常大。


约翰霍普金斯大学医学院朱衡教授课题组和钱江教授课题组提出了一种全新的多对多的筛选策略,称为Digital Affinity Profiling via Proximity Ligation(DAPPL)。这是一个通过实现高度多重化将目前高通量筛选推至极限的全新理念,因为成百上千的蛋白可以同时在一个试管内对庞大的DNA文库进行筛选。DAPPL技术的突破点之一是利用DNA序列作为蛋白质的条形码,从而在根本上解决了现有分子标签对多重化的严重限制,实现了多对多的筛选模式。DAPPL的另一突破点是利用改进的proximity ligation反应把TF蛋白上的DNA条形码与其捕获的DNA片段连接在一起,然后通过分析二代测序结果实现解析多对多筛选产生的海量数据。下面简略描述利用DAPPL系统性地找寻全新的DNA表观遗传修饰识别蛋白的设计和数据分析。


首先,表达纯化上千个带有GST标签的人类转录因子蛋白,并利用谷胱甘肽珠子捕获这些重组蛋白。其次,设计一组DNA序列,每个都带有其独特的条形码序列。将这些DNA条形码分子通过共价偶联逐一标记到各个转录因子蛋白上。然后,把标记好的不同蛋白珠子混合在一起为DAPPL反应做准备。与此同时,合成四个随机的dsDNA文库,每个文库带有一种表观遗传修饰(即mCpG、hmCpG、fCpG、caCpG),以及可以用于识别这种修饰的条形码序列。作为对照,将一组没有修饰的文库与这些文库以等比例混合。接下来,将混合后的DNA文库与带有条形码DNA标记的蛋白珠子混合物进行孵育,洗涤去除未结合的DNA片段,然后通过Golden Gate Assembly将TF蛋白捕获的DNA片段连接到其自身携带的DNA条形码上。之后,将连接的DNA产物用特定引物进行PCR扩增。最后,经二代测序后利用生物信息学的手段解析每种蛋白结合的各个文库的DNA序列信息,以鉴定特异性识别各种表观遗传修饰的转录因子蛋白(图1)。

图1. DAPPL技术筛选特异性识别DNA表观遗传修饰的转录因子蛋白。


通过对DAPPL二代测序结果的分析,作者发现有14、1、7和28个转录因子分别能够特异性识别带有mCpG、hmCpG、fCpG和caCpG双链对称修饰(symmetric)的DNA序列,即DNA序列上的表观遗传修饰能够增强该序列与相应转录因子的相互作用(红色;图2)。反之,他们也发现DNA序列上的mCpG、hmCpG、fCpG和caCpG对称修饰对于部分转录因子来说抑制了其与相应靶标DNA序列的相互作用(蓝色;图2)。此外,还有部分转录因子与其靶标DNA的相互作用不受这些表观遗传修饰的影响(灰色;图2)。

图2. DNA表观遗传对称修饰对转录因子与DNA之间相互作用的影响。


作者同样也对DNA单侧(hemi)表观遗传修饰的文库进行筛选和鉴定,观察到与上述筛选相似的结果。在利用生物信息学比较DNA分子上的对称和单侧表观遗传修饰对于转录因子蛋白和靶标DNA分子的结合影响时,他们发现无论是增强还是抑制蛋白和DNA的相互作用,DNA分子上的对称修饰都比单侧修饰的影响效果更强。接下来的EMSA实验以及TF-DNA结合的动力学研究完全证实了计算结果(图3)。最后,为了探索鉴定到的表观遗传修饰特异性结合蛋白在基因表达调控中的功能,他们将重点放在人胚胎干细胞H1细胞的染色质中hmC修饰位点与USF1和USF2两个转录因子的结合上。研究发现USF1和USF2结合的带有hmC修饰的染色质区域大多富集在弱增强子区域,因此,USF1和USF2可能通过hmC结合活性来调控H1细胞弱增强子相关基因的转录。

图3. DNA表观遗传对称修饰对其与转录因子的相互作用的影响比单侧修饰更大。


原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):

An all-to-all approach to the identification of sequence-specific readers for epigenetic DNA modifications on cytosine

Guang Song, Guohua Wang, Ximei Luo, Ying Cheng, Qifeng Song, Jun Wan, Cedric Moore, Hongjun Song, Peng Jin, Jiang Qian, Heng Zhu 

Nat. Commun., 202112, 795, DOI: 10.1038/s41467-021-20950-w


科研思路分析


Q:这项研究最初是什么目的?或者说想法是怎么产生的?

A:朱衡教授实验室长期专注于高通量人类蛋白质组芯片的制备及其在基础生物医学领域的应用,包括揭示蛋白质与DNA/RNA之间的相互作用机制、建立各种酶与底物的网络图、探索病原体与宿主之间相互作用的分子机制、以及筛选自身免疫疾病和癌症的生物标记物等。近年来,DNA表观遗传修饰在胚胎发育以及癌症中的重要作用引起众多科学家的研究兴趣。而此前我们利用人类转录因子蛋白芯片发现了大量的可以识别含有mCpG对称修饰DNA片段的转录因子,对于重新认识转录因子在DNA表观遗传学中的调控机制提出了新的思路。对mCpG的研究相对比较深入, 而目前对其他的表观修饰(hmCpG, fCpG, caCpG)的生物学功能几乎一无所知,找到能与这些表观修饰特异作用的蛋白能帮助我们对这些表观修饰的功能作深入的研究。然而,现有的各种蛋白质-DNA高通量筛选方法,包括蛋白质芯片技术,都是基于一对多的筛选策略—也就是说每一次筛选只能用一个蛋白或一个DNA片段。如要穷尽1700个人类转录因子与一个16-mer的DNA文库(即4.2 X 109条片段)的所有筛选,必须做1700次SELEX筛选、1700次PMB杂交、或4.2 X 109次蛋白芯片杂交,这显然是不切实际的。为了进一步提高目前这些高通量筛选技术的效率,多重化是唯一可行的策略。多重化本身并不是一个新的理念,荧光标记、纳米球、甚至稀土元素都已经被用作分子标签以实现多重化。但这些方法多重化的幅度受到标签本身的极大限制,比如利用稀土元素作为抗体分子标签的CyTOF技术可同时检测的蛋白数目也就不会超过这个宇宙中存在的有限的稀土元素数量。显然,这无法满足同时筛选1700个转录因子的要求。为了解决这个技术瓶颈,我们想到了利用DNA片段作为转录因子的条形码以实现多重化,因为一段N-mer的DNA片段就可以编码4N不同的序列,相对于可供筛选的蛋白质数量绰绰有余。但是,另一个需要解决的难题是如何在除去非特异TF-DNA相互作用之后来解析哪一个TF结合了什么样的DNA片段。我们最终提出的解决方案是把转录因子上的DNA条形码与其捕获的DNA片段连接起来,这样一来,连接后的产物既包含了TF的身份信息(条形码)、又包含了该TF捕获的DNA片段,而且可以在PCR扩增后用二代测序方法解读所有捕获的信息。


Q:研究过程中遇到哪些挑战?

A:本项研究中最大的挑战是如何有效的对转录因子蛋白进行DNA标记以及控制杂交信号的背景,这对于有效提取测序结果中蛋白信号和结合的DNA信号,鉴定转录因子蛋白识别的特意性序列起着至关重要的作用。


此外,这项研究属于新型的高通量筛选技术的研发,对于测序结果的分析方法的主要挑战是如何从海量的数据中找到真正的信号。现成的motif寻找程序不适用于我们的数据,我们因而开发了一套新的计算方法来分析这些数据,同时提高计算灵敏度。因此我们借鉴各种相关方法技术方面的经验,以及生物实验的验证来摸索和挖掘DAPPL测序结果中有用信息。


Q:该研究成果可能有哪些重要的应用?哪些领域的企业或研究机构可能从该成果中获得帮助?

A:本研究中发现了大量的能特异识别DNA甲基化,羟甲基化,甲酰基化和羧基化等各种表观遗传修饰的人类转录因子,这对于今后开展表观遗传修饰在胚胎发育、相关疾病发病治疗机制等方面的研究提供了大量的数据和基础,同时对于进一步研究相关转录因子在表观遗传背景下对基因表达的调控机制提供了重要线索。


DAPPL作为一种多对多全面解析分子与分子之间相互作用的策略,我们相信未来可以应用于各种生物分子之间相互作用的筛选和鉴定。例如,蛋白质与RNA之间相互作用的研究,鉴于目前已发现的RNA修饰超过100种,我们预计DAPPL在研究RNA转录后修饰相关结合蛋白中将产生更长久的影响。此外,DAPPL可应用于利用DNA编码的小分子药库(即DEL)快速筛选可识别药物靶点的小分子结合物,鉴于目前一些小分子库的复杂度已经达到上万亿,DAPPL策略的应用将大大加快药物研发的速度。


如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

JACS
材料科学跨学科高质量前沿研究
中国作者高影响力研究精选
虚拟特刊
亚洲大洋洲地球科学
NPJ欢迎投稿
自然科研论文编辑
ERIS期刊投稿
欢迎阅读创刊号
自然职场,为您触达千万科研人才
spring&清华大学出版社
城市可持续发展前沿研究专辑
Springer 纳米技术权威期刊征稿
全球视野覆盖
施普林格·自然新
chemistry
物理学研究前沿热点精选期刊推荐
化学领域亟待解决的问题
材料学研究精选新
GIANT
ACS ES&T Engineering
ACS ES&T Water
阿拉丁试剂right
屿渡论文,编辑服务
何川
清华大学
郭维
陈永胜
上海中医药大学
华东师范大学
张夏衡
史大永
楚甲祥
西湖石航
隐藏1h前已浏览文章
课题组网站
新版X-MOL期刊搜索和高级搜索功能介绍
ACS材料视界
南开大学
张韶光
华辉
天合科研
x-mol收录
试剂库存
down
wechat
bug