当前位置: X-MOL 学术Nat. Protoc. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Statistical analysis in metabolic phenotyping
Nature Protocols ( IF 13.1 ) Pub Date : 2021-07-28 , DOI: 10.1038/s41596-021-00579-1
Benjamin J Blaise 1, 2, 3 , Gonçalo D S Correia 1, 4 , Gordon A Haggart 1, 4 , Izabella Surowiec 5, 6 , Caroline Sands 1, 4 , Matthew R Lewis 1, 4 , Jake T M Pearce 1, 4 , Johan Trygg 5, 6 , Jeremy K Nicholson 7, 8 , Elaine Holmes 1, 9 , Timothy M D Ebbels 1
Affiliation  

Metabolic phenotyping is an important tool in translational biomedical research. The advanced analytical technologies commonly used for phenotyping, including mass spectrometry (MS) and nuclear magnetic resonance (NMR) spectroscopy, generate complex data requiring tailored statistical analysis methods. Detailed protocols have been published for data acquisition by liquid NMR, solid-state NMR, ultra-performance liquid chromatography (LC-)MS and gas chromatography (GC-)MS on biofluids or tissues and their preprocessing. Here we propose an efficient protocol (guidelines and software) for statistical analysis of metabolic data generated by these methods. Code for all steps is provided, and no prior coding skill is necessary. We offer efficient solutions for the different steps required within the complete phenotyping data analytics workflow: scaling, normalization, outlier detection, multivariate analysis to explore and model study-related effects, selection of candidate biomarkers, validation, multiple testing correction and performance evaluation of statistical models. We also provide a statistical power calculation algorithm and safeguards to ensure robust and meaningful experimental designs that deliver reliable results. We exemplify the protocol with a two-group classification study and data from an epidemiological cohort; however, the protocol can be easily modified to cover a wider range of experimental designs or incorporate different modeling approaches. This protocol describes a minimal set of analyses needed to rigorously investigate typical datasets encountered in metabolic phenotyping.



中文翻译:

代谢表型的统计分析

代谢表型是转化生物医学研究的重要工具。通常用于表型分析的先进分析技术,包括质谱 (MS) 和核磁共振 (NMR) 光谱,会生成需要定制统计分析方法的复杂数据。详细的协议已经发布,用于通过液体 NMR、固态 NMR、超高效液相色谱 (LC-)MS 和气相色谱 (GC-)MS 对生物流体或组织及其预处理进行数据采集。在这里,我们提出了一种有效的协议(指南和软件),用于对这些方法生成的代谢数据进行统计分析。提供了所有步骤的代码,不需要事先的编码技能。我们为完整的表型数据分析工作流程中所需的不同步骤提供有效的解决方案:缩放、标准化、异常值检测、多变量分析以探索和建模研究相关效应、候选生物标志物的选择、验证、多重测试校正和统计模型的性能评估。我们还提供统计功效计算算法和保障措施,以确保提供可靠结果的稳健且有意义的实验设计。我们用两组分类研究和流行病学队列的数据来举例说明该协议;然而,该协议可以很容易地修改以涵盖更广泛的实验设计或结合不同的建模方法。该协议描述了严格调查代谢表型中遇到的典型数据集所需的一组最小分析。多变量分析以探索和建模研究相关效应、候选生物标志物的选择、验证、多重测试校正和统计模型的性能评估。我们还提供统计功效计算算法和保障措施,以确保提供可靠结果的稳健且有意义的实验设计。我们用两组分类研究和流行病学队列的数据来举例说明该协议;然而,该协议可以很容易地修改以涵盖更广泛的实验设计或结合不同的建模方法。该协议描述了严格调查代谢表型中遇到的典型数据集所需的一组最小分析。多变量分析以探索和建模研究相关效应、候选生物标志物的选择、验证、多重测试校正和统计模型的性能评估。我们还提供统计功效计算算法和保障措施,以确保提供可靠结果的稳健且有意义的实验设计。我们用两组分类研究和流行病学队列的数据来举例说明该协议;然而,该协议可以很容易地修改以涵盖更广泛的实验设计或结合不同的建模方法。该协议描述了严格调查代谢表型中遇到的典型数据集所需的一组最小分析。我们还提供统计功效计算算法和保障措施,以确保提供可靠结果的稳健且有意义的实验设计。我们用两组分类研究和流行病学队列的数据来举例说明该协议;然而,该协议可以很容易地修改以涵盖更广泛的实验设计或结合不同的建模方法。该协议描述了严格调查代谢表型中遇到的典型数据集所需的一组最小分析。我们还提供统计功效计算算法和保障措施,以确保提供可靠结果的稳健且有意义的实验设计。我们用两组分类研究和流行病学队列的数据来举例说明该协议;然而,该协议可以很容易地修改以涵盖更广泛的实验设计或结合不同的建模方法。该协议描述了严格调查代谢表型中遇到的典型数据集所需的一组最小分析。该协议可以轻松修改以涵盖更广泛的实验设计或合并不同的建模方法。该协议描述了严格调查代谢表型中遇到的典型数据集所需的一组最小分析。该协议可以轻松修改以涵盖更广泛的实验设计或合并不同的建模方法。该协议描述了严格调查代谢表型中遇到的典型数据集所需的一组最小分析。

更新日期:2021-07-28
down
wechat
bug