当前位置: X-MOL 学术PLOS ONE › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A comparison of Monte Carlo sampling methods for metabolic network models.
PLOS ONE ( IF 3.7 ) Pub Date : 2020-07-01 , DOI: 10.1371/journal.pone.0235393
Shirin Fallahi 1 , Hans J Skaug 1 , Guttorm Alendal 1
Affiliation  

Reaction rates (fluxes) in a metabolic network can be analyzed using constraint-based modeling which imposes a steady state assumption on the system. In a deterministic formulation of the problem the steady state assumption has to be fulfilled exactly, and the observed fluxes are included in the model without accounting for experimental noise. One can relax the steady state constraint, and also include experimental noise in the model, through a stochastic formulation of the problem. Uniform sampling of fluxes, feasible in both the deterministic and stochastic formulation, can provide us with statistical properties of the metabolic network, such as marginal flux probability distributions. In this study we give an overview of both the deterministic and stochastic formulation of the problem, and of available Monte Carlo sampling methods for sampling the corresponding solution space. We apply the ACHR, OPTGP, CHRR and Gibbs sampling algorithms to ten metabolic networks and evaluate their convergence, consistency and efficiency. The coordinate hit-and-run with rounding (CHRR) is found to perform best among the algorithms suitable for the deterministic formulation. A desirable property of CHRR is its guaranteed distributional convergence. Among the three other algorithms, ACHR has the largest consistency with CHRR for genome scale models. For the stochastic formulation, the Gibbs sampler is the only method appropriate for sampling at genome scale. However, our analysis ranks it as less efficient than the samplers used for the deterministic formulation.



中文翻译:

代谢网络模型的蒙特卡洛采样方法的比较。

可以使用基于约束的模型来分析代谢网络中的反应速率(通量),该模型将稳态假设强加给系统。在问题的确定性表示中,必须精确地满足稳态假设,并且在不考虑实验噪声的情况下将观测到的通量包括在模型中。通过问题的随机表述,可以放宽稳态约束,并在模型中包含实验噪声。在确定性公式和随机公式中均可行的均匀通量采样可以为我们提供代谢网络的统计属性,例如边际通量概率分布。在这项研究中,我们概述了问题的确定性和随机性,以及可用的蒙特卡洛采样方法来对相应的解空间进行采样。我们将ACHR,OPTGP,CHRR和Gibbs采样算法应用于十个代谢网络,并评估它们的收敛性,一致性和效率。在适用于确定性公式的算法中,发现采用四舍五入的即插即用坐标方式表现最佳。CHRR的理想属性是其保证的分布收敛性。在其他三种算法中,对于基因组规模模型,ACHR与CHRR的一致性最大。对于随机公式,Gibbs采样器是唯一适合在基因组规模采样的方法。但是,我们的分析认为它的效率不如确定性公式中使用的采样器。CHRR和Gibbs采样算法可用于十个代谢网络,并评估其收敛性,一致性和效率。在适用于确定性公式的算法中,发现采用四舍五入的即插即用坐标方式表现最佳。CHRR的理想属性是其保证的分布收敛性。在其他三种算法中,对于基因组规模模型,ACHR与CHRR的一致性最大。对于随机公式,Gibbs采样器是唯一适合在基因组规模采样的方法。但是,我们的分析认为它的效率不如确定性公式中使用的采样器。CHRR和Gibbs采样算法可用于十个代谢网络,并评估其收敛性,一致性和效率。在适用于确定性公式的算法中,发现采用四舍五入的即插即用坐标方式表现最佳。CHRR的理想属性是其保证的分布收敛性。在其他三种算法中,对于基因组规模模型,ACHR与CHRR的一致性最大。对于随机公式,Gibbs采样器是唯一适合在基因组规模采样的方法。但是,我们的分析认为它的效率不如确定性公式中使用的采样器。在适用于确定性公式的算法中,发现采用四舍五入的即插即用坐标方式表现最佳。CHRR的理想属性是其保证的分布收敛性。在其他三种算法中,对于基因组规模模型,ACHR与CHRR的一致性最大。对于随机公式,Gibbs采样器是唯一适合在基因组规模采样的方法。但是,我们的分析认为它的效率不如确定性公式中使用的采样器。在适用于确定性公式的算法中,发现采用四舍五入的即插即用坐标方式表现最佳。CHRR的理想属性是其保证的分布收敛性。在其他三种算法中,对于基因组规模模型,ACHR与CHRR的一致性最大。对于随机公式,Gibbs采样器是唯一适合在基因组规模采样的方法。但是,我们的分析认为它的效率不如确定性公式所用的采样器。

更新日期:2020-07-01
down
wechat
bug