表皮生长因子受体(EGFR)是细胞表面的一种受体酪氨酸激酶,在许多人类癌症中均发生突变和过表达,尤其是在非小细胞肺癌(NSCLC)和胶质母细胞瘤(GBM)中。突变的EGFR癌蛋白会引起下游信号通路的持续性激活,从而导致不受控制的细胞增殖、生存和耐药性。对于典型EGFR突变(L858R, 19号外显子缺失, T790M)的NSCLC患者来说,EGFR酪氨酸激酶抑制剂(TKIs)为他们带来了希望,为癌症患者靶向治疗开辟了新格局。但是,耐药性问题不可避免的发生了,进而限制了EGFR酪氨酸激酶抑制剂临床使用。此外,EGFR酪氨酸激酶抑制剂在恶性胶质瘤、结直肠癌和肝癌中的临床疗效非常有限,表明不同癌症对EGFR酪氨酸激酶抑制剂的敏感性不同。因此,研发靶向EGFR信号通路的新靶标和新策略是非常必要的。
G-四链体(G4s)是一种特殊的DNA二级结构(图1),大量存在于癌基因中,尤其在癌基因的近端启动子中富集,它们控制着癌基因的复制、转录、翻译等过程,被认为是癌症治疗中有潜力了的颖性生物靶标。
图1. DNA中G4结构形成的示意图
目前上市的EGFR靶向抑制剂均是针对EGFR癌蛋白,但EGFR癌蛋白突变会产生耐药性问题。为解决此难题,中国药科大学孔令义/王凯波团队首次尝试从EGFR癌基因的角度出发,通过结合和稳定EGFR近端启动子的DNA G4结构,来抑制EGFR癌基因的表达,进而达到杀灭癌细胞的目的,为EGFR信号通路抑制剂研究提供可行的替代策略,为天然产物抗癌药物研发提供新靶点和新思路。
G4特异性的CHIP-seq数据表明,EGFR转录起始位点(TSS)上游-50到-16序列(Pu35)具有形成DNA G4的潜力(图2a)。为了确定Pu35 DNA可以形成的G4结构,作者首先进行了DMS足迹实验,该实验是近生理条件下确定G4形成的常用方法。参与G-四集体形成的鸟嘌呤N7被屏蔽,因此避免了DMS甲基化和随后的哌啶裂解,从而在条带上表现出不同的深浅。实验结果表明(图2c),G束II-V中观察到11个鸟嘌呤受到了明显的保护作用,而在VII中,G24也受到了微弱的保护作用,提示EGFR癌基因近端启动子区域形成了一个末端序列折返型的特殊G4结构(EGFR-G4)。由于该G4结构十分独特,利于特定配体靶向,因此作者打算对其进一步研究。使用包含EGFR-G4形成序列在内的野生型(wt)Pu24序列进行核磁共振测试,在10-12ppm 显示出12个高分辨的亚氨基质子峰,表明G4结构的形成。但是,核磁图谱存在基线高、波峰宽等现象,说明有其它小比例的结构存在(图2d)。作者基于DMS结果,将不参与G-四集体形成的G23突变为A(Pu24m1),发现形成了与Pu24序列相同的G4结构,且Pu24m1的核磁共振谱图谱质量得到了明显改善(图2d)。由于侧链序列对于G4的形成和特异性配体的识别至关重要,因此作者在Pu24m1两端各添加了一个胸腺嘧啶(Pu26m1T)使头尾侧链数量均为3个碱基(图2d)。与Pu24m1相比,Pu26m1T具有相似的亚氨基质子信号峰和良好的谱图质量,因此,作者选择Pu26m1T作为后续结构测定和研究的基础。作者通过EMSA凝胶和CD实验证明了这三个序列均为分子内G4单体结构,且均为平行型G4拓扑结构(图2e)。
图2. EGFR -G4序列设计及其构象分析
在一维核磁共振氢谱中,Pu26m1T DNA的高质量谱图表明形成了明确的G4 结构,且适合于溶液结构的确定。因此,作者配制了高浓度样品,采集了HSQC、NOESY、TOCSY等二维图谱,进而对EGFR-G4上的H信号进行了全归属,然后利用计算机分子动力学模拟等技术,结合NOESY提供的H-H信号间的距离信息,经过反复模拟和修改,最终得到了吻合NOESY信息的三元复合空间结构(图3)。
EGFR-G4的核心由3个G-四集体组成,它夹在G3-A11碱基对和A19-A23-A25三联体平面之间。在5’端,G3-A11碱基对通过末端碱基T1和C2进一步加强,形成完整的帽子结构。而在3’端,除了A19-A23-A25三联体平面外,还有额外的G20-A22-T26三联体平面进行了连续叠加,再通过G21形成帽子结构(图3)。值得注意的是,虽然由一个三联体平面组成的帽子结构经常出现在各种G4结构中,但由两个堆叠的三联体平面形成的帽子结构目前尚未报道,而这种特殊的帽子结构作为折返型EGFR-G4的独特特征,很可能被特定蛋白质识别或特定小分子靶向,为生理机制的探索和个性化的治疗提供了可观的前景。
图3. 溶液中EGFR -G4结构示意图
为了验证EGFR-G4的稳定性,作者选取了能量最低的前三个EGFR-G4结构,进行了长时间无约束的MD模拟实验(图4)。在总共960ns的模拟中,所有重原子的RMSD值为2.32±0.43Å,G-四集体核心的RMSD值为1.77±0.39Å,表明了EGFR-G4的整体结构是稳定的。在整个模拟过程中,三联体平面保持良好,表明它们对EGFR-G4的折叠至关重要,而T1和T26相比于其它碱基具有更加灵活的构象,表明末端残基对结构稳定并不重要,可以进一步扩展。有趣的是,在T26脱离G20-A22-T26三联体平面后,G20-A22碱基对仍能保持相对稳定。总之,无约束 MD 模拟实验表明,折返型EGFR-G4结构是稳定的,且能在较长的基因组序列中形成。
图4. EGFR -G4无约束的MD模拟实验
为了进一步证实扩展后的EGFR 癌基因启动子序列可以形成折返型G4结构。作者在Pu26m1T序列的3’末端逐步增加胸腺嘧啶的数量,正如所预期的,扩展后的序列仍然形成了稳定的折返型G4结构(图5b,c)。在作者之前的研究中,空缺G4s(vG4s)可以被鸟嘌呤代谢物(如cGMP和dGMP)所填充,因此,作者将dGMP滴定到不同的3’端延伸序列中。结果表明,即使是Pu29m1TTTT,dGMP也不能与分子内的G24残基竞争形成dGMP-vG4s,再次证实了这个折返型EGFR-G4是高度稳定的(图5d)。
图5. EGFR -G4各延长序列的构象分析及其dGMP滴定图
迄今为止,只报道过4种折返型启动子G4结构,但由于它们都缺少3’端残基,使得折返型G4是否能在人体内真实存在成为了一个疑问(图6)。而本文作者首次确定了具有自然侧链残基折返型G4的溶液结构,并且证明了它可以在基因组环境中存在,具有十分重大的意义。
图6. 目前已报道的折返型G4结构示意图
为了进一步研究EGFR -G4能否在较长的DNA环境中形成,并发挥潜在的生物活性。作者使用包含wt EGFR -G4的DNA长模板进行了DNA聚合酶停止试验,DNA模板链中形成的G4结构可以阻止DNA聚合酶的延伸(图7a)。如图7b所示,引物延伸的提前停滞产物明显依赖于钾离子浓度,这意味着在长DNA模板中确实形成了折返型EGFR -G4。而G4稳定配体的存在已被证明可以增加G4介导的停滞产物的形成,因此作者使用了广泛认可的G4稳定化合物pyridostatin(PDS)进行实验。结果表明,随着PDS浓度的增加,停滞产物的数量逐渐增加,说明小分子可以通过靶向EGFR -G4抑制DNA聚合酶(图7c)。该实验说明,折返型EGFR -G4可以在生理条件下形成,且具有潜在的生物学功能,这使得EGFR -G4可以成为替代EGFR信号抑制的新生物分子靶点。
图7. 长序列下EGFR -G4的DNA聚合酶停止实验
总体来看,该研究首次发现并解析了带有自然侧链残基的折返型G4的溶液结构,证明了该EGFR -G4结构高度稳定且能够被小分子化合物靶向,为EGFR信号通路抑制剂的研究提供了新靶标和新策略,为天然产物抗癌药物研究提供了新方向。此外,EGFR蛋白在新冠病毒或丙肝病毒感染的病人中也出现了高表达,抑制EGFR信号通路被证明具有良好的抗病毒效果,因此,该项研究也为抗新冠病毒和抗丙肝病毒的研究和治疗提供了新靶点和新思路。
本文研究意义如下:
1. 药物靶点研究对于新药的发现和开发非常重要。药物靶点研究可以促进对疾病的认识和探究疾病的发生机制。而只有深入了解疾病的机理,才能针对性地治疗疾病。G4s作为核酸新靶点,避免了因蛋白质突变导致的多药耐药性的产生(目前尚未发现G4s靶点结合小分子化合物而引起G4序列突变的现象)且G4s较传统DNA更加稳定,避免了DNA稳定性差而引发的治疗疗效不持久。
2. EGFR -G4的成功解析,为靶向EGFR信号通路提供了新靶标和新策略。
3. EGFR -G4首次发现了含有侧链残基的折返和由两个三联体平面堆叠形成的帽子结构,为人体内存在折返型G4提供了证据,也为溶液NMR解析提供了新的思路。
4. EGFR-G4结构独特,与之结合的蛋白质和小分子化合物将有更好的特异性。作为靶点有巨大的潜力。
该论文共同第一作者为中国药科大学博士后刘玉霜和中国药科大学2020级硕士研究生李金柱。该论文通讯作者为中国药科大学副校长孔令义教授和王凯波研究员。
原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):
Structure of the Major G-Quadruplex in the Human EGFR Oncogene Promoter Adopts a Unique Folding Topology with a Distinctive Snap-Back Loop
Yushuang Liu, Jinzhu Li, Yongqiang Zhang, Yingying Wang, Juannan Chen, Yuting Bian, Yuanzheng Xia, Ming-Hua Yang, Kewei Zheng, Kai-Bo Wang*, and Ling-Yi Kong*
J. Am. Chem. Soc., 2023, DOI: 10.1021/jacs.3c05214
研究团队简介
王凯波,中国药科大学研究员,博士研究生导师。美国普渡大学博士后,沈阳药科大学博士,美国癌症研究协会(AACR)会员,中国化学会会员。荣获国家优秀青年科学基金、国家自然科学面上基金,江苏省“双创人才”基金,中国药科大学高层次人才引进基金,江苏省青年基金等。主要进行DNA G-四链与天然产物的相互作用研究,包括NMR溶液结构解析和体内外药理活性评价等,开发抗肿瘤新药。在药学、化学领域国际著名期刊发表相关研究论文30余篇,主要包括:J. Am. Chem. Soc.(5篇); Nat. Commun.;Angew. Chem. Int. Ed.; Org. Lett.; J. Nat. Prod.等。累计影响因子230,累计引用600余次。其中,J. Am. Chem. Soc.(2019,141,11059)被Science Daily, EurekAlert等多家全球性媒体进行了专项报道;J. Am. Chem. Soc.(2021, 143, 16311)被选为当期的spotlights on recent JACS publications。发布PDB结构7个。荣获辽宁省优秀博士论文。申请美国专利一项,参与撰写英文著作一本。
课题组网站:
https://www.x-mol.com/groups/Wang_G4Lab
参考文献
Robichaux JP, Le X, Vijayan RSK, et al. Structure-based classification predicts drug response in EGFR-mutant NSCLC. Nature. 2021; 597(7878):732-737.
Zheng KW, Zhang JY, He YD, et al. Detection of genomic G-quadruplexes in living cells using a small artificial protein. Nucleic Acids Res. 2020; 48(20):11706-11720.
Liu LY, Ma TZ, Zeng YL, Liu W, Mao ZW. Structural Basis of Pyridostatin and Its Derivatives Specifically Binding to G-Quadruplexes. J Am Chem Soc. 2022; 144(26):11878-11887.
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!