146815
当前位置: 首页   >  课题组新闻   >  课题组建立量子化学计算与AI驱动的多维精准代谢组学方法
课题组建立量子化学计算与AI驱动的多维精准代谢组学方法
发布时间:2025-08-08

      同分异构是分子的普遍现象,大量同分异构体广泛存在于生物和化学体系中。它们不仅赋予生命和化学系统以丰富的分子结构多样性,更在其中发挥着关键的生物与化学功能。然而,异构体间微小的结构差异,却可能导致其功能产生巨大差别。例如,我们熟知的手性药物沙利度胺,其R构型具有治疗作用,而S构型却会导致新生儿畸形。又如反式脂肪酸,其摄入通常被认为有害健康,但最新研究表明,反式油酸反而能促进肿瘤抗原呈递,抑制肿瘤生长。这些发现凸显出我们目前对异构体的认知仍非常有限,对其结构与功能关系的理解严重不足。

      其中一个重要原因在于异构体水平分析面临巨大挑战。由于理化性质高度相似、分子质量相同、特征碎片离子谱图相近,异构体的分离与精准分析极为困难,已成为分析化学领域的公认难题。然而,异构体水平的研究又亟需去深入探索。为此,武汉大学陈素明教授课题组将异构体水平质谱分析作为为主要研究方向。为攻克异构体精准、快速、实时分析的难题,课题组独辟蹊径,从异构体的化学反应性、气相构象、反应动力学等化学维度入手,发展了一系列创新的质谱分析方法,成功实现了异构体水平的精准结构组学分析、高通量反应监测及亚稳态过程解析(代表性工作:Nat. Commun. 2022, 13, 2652; Nat. Commun. 2023, 14, 6671; Sci. Adv. 2024, 10, eadk1721; Angew. Chem. Int. Ed. 2023, 62, e202306460; J. Am. Chem. Soc. 2024, 146, 32777-32784)。

      近日,该课题组在国际权威学术期刊《Angew. Chem. Int. Ed.》(《德国应用化学》)上在线发表了他们在异构体水平质谱分析方面的最新研究成果。论文题为:“Quantum Chemistry Calculation-Assisted Large-Scale Collision Cross Section Prediction Empowers Derivatization-Enhanced Multidimensional Metabolomics”(量子化学计算辅助的大规模碰撞横截面预测技术助力衍生增强多维代谢组学)。该研究通过构建大规模衍生代谢物四维信息数据库并开发多维匹配方法,成功实现了异构体水平的衍生增强代谢组学分析。

      四维代谢组学作为一种新兴分析范式,通过整合精确质量、保留时间、碎片离子及碰撞横截面(Collision Cross Section, CCS)这四个维度的测量,可提供多维正交分析,显著提升代谢物结构鉴定的准确性。CCS作为分子的固有属性,其获取通常依赖化学标准品的实验测定或基于大量标品数据的预测。然而,标准品的大规模获取常受限于来源和成本。因此,如何在不依赖标品的情况下,大规模获取衍生代谢物的精准CCS值,并进一步建立异构体水平的多维分析方法,是一项重大挑战。

      该研究创新性地提出了一种结合量子化学计算与机器学习的策略,用于大规模精准预测衍生代谢物的CCS值。其核心原理是:首先利用量子化学计算获得甾醇离子在气相中的最低能量构象,进而计算其CCS值;随后,基于此小规模计算数据集,建立机器学习模型,用以预测大规模CCS数据库。该方法预测结果的平均相对误差仅为1.6%,准确性显著优于现有方法。此外,研究还结合了基于迁移学习的保留时间预测,以及对特征碎片离子裂解规律的研究和计算,最终在不依赖大量标准品的情况下,成功构建了大规模的衍生代谢物四维信息数据库(图1)。

      研究以结构复杂、异构体繁多且具有重要生物功能的甾醇分析为范例,开发了一种可同时兼顾甾醇及甾醇酯的N-甲基氮杂环丙烷化衍生方法。该方法不仅能显著提升甾醇的分析灵敏度,还能实现对双键位置异构体的精准鉴定。通过构建大规模的衍生甾醇脂质四维信息数据库(n = 4,891),并建立四维匹配打分算法,研究在异构体水平上实现了高覆盖度的不饱和甾醇组学分析(图1)。定量揭示了超过100种甾醇脂质在器官中的特异性分布规律,并发现了重要甾醇在组织间代谢途径的差异性(图2)。该研究为发展衍生增强的四维代谢组学奠定了重要基础,并为精准甾醇组学分析及其代谢研究提供了有效的解决方案。

图1. 量子化学计算辅助的衍生代谢物CCS预测及其用于异构体水平甾醇组学分析示意图。(a) 无需依赖标准品的衍生代谢物大规模CCS获取工作流程的示意图。该工作流程包括衍生化代谢物的化学结构生成、基于量子化学的CCS计算、利用计算得到的CCS数据集训练机器学习模型,以及大规模CCS数据库预测。(b) 异构体水平四维不饱和甾醇鉴定示意图。该过程主要包括不饱和甾醇的N-甲基氮杂环丙烷化衍生化、四维信息生成、LC-IM-MS/MS分析以及四维数据匹配。

图2. 小鼠组织特异性甾醇脂质分布分析。 (a) 小鼠器官及用于甾醇脂质分析的样本示意图。 (b) 不同样本中鉴定出的甾醇脂质数量比较。 (c) 鉴定出的甾醇脂质类型及比例分析。 (d) 不同样本中常见及特有甾醇脂质的分布情况。(e) 以组织湿重(mg)为基准进行标准化的不同样本中九种甾醇脂质亚类的绝对浓度。(f) 小鼠样本中甾醇脂质的HCA分析(n = 104)。(g) 不同小鼠样本中五种甾醇亚类的浓度分布。每个亚类中所有检测到的甾醇脂质的平均绝对浓度被求和并进行对数转换以进行可视化(n = 4)。


      该论文的共同第一作者为武汉大学高等研究院研究生孙健和罗俊萌,陈素明教授为论文唯一通讯作者,武汉大学为论文的唯一署名单位。该研究得到了国家自然科学基金、国家科技重大专项等项目经费的支持。

      论文链接:https://onlinelibrary.wiley.com/doi/10.1002/anie.202507483