HeuSMA: A Multigradient LC-MS Strategy for Improving Peak Identification in Untargeted Metabolomics
Anal. Chem. 2025, 97, 7719−7728
https://doi.org/10.1021/acs.analchem.4c05315
研究背景
研究问题:代谢组学旨在全面分析生物系统中的小分子,以揭示生理过程和疾病状态的生化基础。然而,当前的代谢组学覆盖度有限,无法全面检测生物样本中的所有代谢物,这对于准确注释代谢物和发现潜在的生物标志物至关重要。
研究难点:液相色谱-质谱联用(LC-MS)技术虽然分辨率高、灵敏度强,但单一的LC-MS分析条件难以实现全面的代谢组覆盖。此外,在处理非靶向代谢组学数据时,如何有效提取完整的代谢特征信号,尤其是对于低丰度或色谱峰定义不清晰的情况,是一个重大挑战。
文献综述:目前,已有多种工具(如MS-DIAL和MZmine)用于代谢组学数据处理,但它们在代谢物覆盖度和峰鉴定准确性方面存在局限性。本研究提出的HeuSMA策略,通过多梯度液相色谱-质谱分析,旨在克服这些限制,提高代谢组学分析的效率和准确性。
HeuSMA策略介绍
策略核心:HeuSMA策略是一种基于多梯度液相色谱-质谱(LC-MS)的启发式策略,旨在提高非靶向代谢组学分析中的代谢物覆盖范围和峰识别准确性。该策略通过在给定样本上执行多个梯度条件下的LC-MS分析,构建启发式峰列表,并利用该列表指导启发式峰挑选。
实施步骤:首先,使用多种LC梯度条件对样本进行LC-MS分析,然后通过N-酰基甘氨酸保留指数(N-acyl glycine RI)系统对检测到的峰进行对齐,构建启发式峰列表。接着,使用该峰列表指导在特定梯度条件下对获得的代谢组学数据进行峰挑选、峰形评估和多样本峰对齐。最后,将不同LC梯度条件下获得的MS/MS谱图分配给根据启发式峰列表挑选出的峰。
软件工具:为了提高HeuSMA策略的可用性,开发了两个用户友好的图形界面软件解决方案Heuristic Peak List Generator (HPLG)和Heuristic Processor (HP),这些软件自动化了从原始数据导入到最终结果导出的数据处理步骤。
实验材料与方法
材料与试剂:实验使用了LC/MS级甲醇、乙腈和甲酸等试剂,以及实验室合成的N-酰基甘氨酸同系物校准剂。使用了来自北京LABLEAD BIOTECH Co., Ltd.的商业人血清样本。
样本收集与准备:从武汉大学中南医院收集了104个人血清样本,包括54个正常对照和50个肝细胞癌(HCC)患者样本。血清样本的提取和去蛋白化采用冷甲醇沉淀法。
LC-MS分析:使用Agilent 1290 Infinity II液相色谱系统和Agilent 6546 Q-TOF质谱仪进行LC-MS分析。采用五种不同的线性梯度条件进行LC分离,并使用全扫描模式和自动MS/MS模式进行质谱分析。
结果与分析
峰对齐可行性:通过引入22种N-酰基甘氨酸同系物作为校准剂,评估了不同梯度条件下的峰对齐能力。结果表明,保留指数(RI)系统具有出色的峰对齐能力,且在短梯度条件下RI的标准偏差会增加。
LC梯度对代谢组覆盖的影响:研究了五种不同的LC梯度条件对代谢组覆盖的影响。结果表明,使用多种梯度条件可以显著提高代谢组覆盖范围,增加检测到的特征数量。
启发式峰挑选方法:开发了一种启发式峰挑选方法(HPP),该方法通过锁定峰区域、平滑色谱峰、检测色谱峰和计算高斯相似度四个步骤进行峰挑选。与传统方法相比,HPP在峰挑选的灵敏度和准确性方面表现出色。
应用实例
肝细胞癌代谢组学分析:通过HeuSMA策略对HCC患者和正常对照的血清样本进行分析,检测到的特征数量超过使用MS-DIAL工具检测到的数量。通过主成分分析(PCA)和正交偏最小二乘判别分析(OPLSDA)验证了HeuSMA和MS-DIAL的聚类结果一致性,但火山图分析和Venn图显示了两种工具在识别差异代谢物方面的差异。
总体结论
HeuSMA策略的优势:HeuSMA策略通过多梯度LC-MS分析显著提高了非靶向代谢组学分析中的代谢物覆盖范围和MS/MS谱图的获取,提高了数据处理的分析准确性和效率。此外,HeuSMA策略通过开发的HPLG和HP软件工具,简化了数据处理流程,提高了用户操作的便捷性和效率。
研究意义:HeuSMA策略和相关软件工具的开发,为代谢组学研究提供了新的分析手段,有助于更全面地获取非靶向代谢组学信息,推动了代谢组学在疾病诊断和生物标志物发现中的应用。