责编 | 兮
代谢是一切生命活动的基础。代谢组学技术通过检测代谢物在生命体中的含量,反映出个体在基因与环境共同作用下的生化特征,尤其是新代谢物的发现将有助于探索生命活动的未知机制。譬如,促癌代谢物2-羟基戊二酸(2-hydroxyglutarate)的发现,为探索急性髓细胞白血病(AML)的癌变机理,及开发靶向抑制剂的癌症治疗方案奠定了基础【1-3】。代谢组学及多学科的交叉研究将促进发现与疾病相关的分子标志物,为疾病的早期发现和治疗提供重要的依据。
代谢组学近年来迅速发展,利用液相色谱-质谱技术可测出上千种不同的小分子代谢物,但是代谢组学的数据中仍有大量离子峰未被鉴定,意味着仍有潜在的代谢物待发现。如何全面的、准确的对这些离子峰进行标注,并发展新的分析手段,系统性的发现生命体中潜在新代谢物,也是代谢组学领域的前沿问题。分子网络分析(Molecular network analysis)利用离子峰之间的关系来扩大离子峰标注的广度并提高准确性,是近年来代谢组学数据分析的一个新趋势【4-7】。
2021年10月28日,美国普林斯顿大学Joshua D. Rabinowitz 课题组(第一作者为陈立博士,现任复旦大学代谢与整合生物学研究院青年研究员)在Nature Methods发表了题为Metabolite discovery through global annotation of untargeted metabolomics data的文章。文章报道了名为NetID的新算法,可从非靶向代谢组学数据中系统的对代谢物进行标注,并用于发现未知代谢物。NetID软件目前已公开发布在Github网站(https://github.com/LiChenPU/NetID)。
NetID算法以已知的代谢组学信息为输入,以实验观察到的离子峰为网络节点,并以可以反映生物分子转化(如氧化还原反应,脱羧反应等)及质谱现象(如加和物、同位素等)的分子量差为边,将整体代谢组学数据拓展连接为分子网络。同时,本研究将网络分析算法中的全局网络优化的策略应用在代谢组学的分子网络分析中,生成可连接大多数观察到的离子峰的单一网络,充分利用所有离子峰的信息对整个网络进行全局最优化标注,从而提高峰标注的精度,并生成包含有用生物化学转化信息的离子峰之间的关系。该算法可广泛应用于代谢组学数据分析,从而对缺少MS2谱图的低丰度离子峰进行更好的标注,进而提高发掘潜在的新代谢物的覆盖范围和准确性。
作者将NetID算法应用于酵母和小鼠的非靶向代谢组学数据中,对约3/4的非背景离子峰进行了标注,并成功鉴定出了五种未知代谢物,其中包括硫胺素衍生物和 N-葡萄糖基-牛磺酸。作者进一步通过同位素示踪的实验证实了小鼠体内的这些新代谢物的代谢过程。
综上,该研究的新算法NetID创新性的结合了代谢组学实验原理与网络优化算法,提出了全局化标注非靶向代谢组学数据的新策略,为发现和标注新代谢物有力的工具。
代谢物的化学结构鉴定一直是代谢组学研究的前沿和难点。如何从庞杂的非靶向质谱数据中准确地注释代谢物的化学结构,特别是未知代谢物化学结构仍然存在巨大的挑战。陈立研究员的这个工作发展了一个非靶向代谢组学数据分析的新方法,为从复杂生物样本中发现新的未知代谢物提供了有效的生物信息学工具和思路。
该方法(NetID)的一个重要的创新点在于将传统代谢组学分子网络与线性规划的优化算法有机结合起来。这项工作首先不仅融合了“传统”的MS1信息(如分子量、保留时间等),和MS2质谱信息,更是添加了离子峰之间的生物化学转化关系,并通过全局优化算法,在全局信息的基础上对非靶向质谱数据中离子峰进行注释。传统的分子网络中,每一个离子的标注都是独立进行,往往出现冗余注释和错误注释,难以发现未知代谢物信息。而全局化的分子网络中,每一个离子峰所带的信息被整合利用于整个分子网络所有的离子峰的标注上,从而能够在众多潜在注释中挑选出最优的离子峰注释结果,为发现新的未知代谢物提供了技术支持。
最重要的是,该工作应用NetID算法报道了硫胺素和牛磺酸相关的新的未知代谢物,并且通过详实的同位素示踪实验等技术验证了这些代谢物的化学结构,切实地证明了该算法的实用性和有效性。综上,这个工作对非靶向代谢组学领域特别是未知代谢物化学结构注释是一个极大的促进,我相信这个工具在非靶向代谢组学数据分析中可以得到更广泛的应用。
参考文献
1. Zhao, S. et al. Glioma-Derived Mutations in IDH1 Dominantly Inhibit IDH1 Catalytic Activity and Induce HIF-1α. Science 324, 261–265 (2009).
2. Dang, L. et al. Cancer-associated IDH1 mutations produce 2-hydroxyglutarate. Nature 462, 739 (2009).
3. DiNardo, C. D. et al. Durable Remissions with Ivosidenib in IDH1-Mutated Relapsed or Refractory AML. N. Engl. J. Med. 378, 2386–2398 (2018).
4. Shen, X. et al. Metabolic reaction network-based recursive metabolite annotation for untargeted metabolomics. Nature Communications 10, 1516 (2019).
5. Nothias, L.-F. et al. Feature-based molecular networking in the GNPS analysis environment. Nat Methods 17, 905–908 (2020).
6. Ludwig, M. et al. Database-independent molecular formula annotation using Gibbs sampling through ZODIAC. Nature Machine Intelligence 2, 629–641 (2020).
7. Dührkop, K. et al. Systematic classification of unknown metabolites using high-resolution fragmentation mass spectra. Nature Biotechnology 1–10 (2020) doi:10.1038/s41587-020-0740-8.
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经允许禁止转载,作者拥有所有法定权利,违者必究。