当前位置: X-MOL 学术BMC Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Robust pathway sampling in phenotype prediction. Application to triple negative breast cancer.
BMC Bioinformatics ( IF 2.9 ) Pub Date : 2020-03-11 , DOI: 10.1186/s12859-020-3356-6
Ana Cernea 1 , Juan Luis Fernández-Martínez 1 , Enrique J deAndrés-Galiana 1, 2 , Francisco Javier Fernández-Ovies 1 , Oscar Alvarez-Machancoses 1 , Zulima Fernández-Muñiz 1 , Leorey N Saligan 3 , Stephen T Sonis 4, 5
Affiliation  

Phenotype prediction problems are usually considered ill-posed, as the amount of samples is very limited with respect to the scrutinized genetic probes. This fact complicates the sampling of the defective genetic pathways due to the high number of possible discriminatory genetic networks involved. In this research, we outline three novel sampling algorithms utilized to identify, classify and characterize the defective pathways in phenotype prediction problems, such as the Fisher’s ratio sampler, the Holdout sampler and the Random sampler, and apply each one to the analysis of genetic pathways involved in tumor behavior and outcomes of triple negative breast cancers (TNBC). Altered biological pathways are identified using the most frequently sampled genes and are compared to those obtained via Bayesian Networks (BNs). Random, Fisher’s ratio and Holdout samplers were more accurate and robust than BNs, while providing comparable insights about disease genomics. The three samplers tested are good alternatives to Bayesian Networks since they are less computationally demanding algorithms. Importantly, this analysis confirms the concept of “biological invariance” since the altered pathways should be independent of the sampling methodology and the classifier used for their inference. Nevertheless, still some modifications are needed in the Bayesian networks to be able to sample correctly the uncertainty space in phenotype prediction problems, since the probabilistic parameterization of the uncertainty space is not unique and the use of the optimum network might falsify the pathways analysis.

中文翻译:

表型预测中的稳健途径采样。适用于三阴性乳腺癌。

表型预测问题通常被认为是不适定的,因为相对于经过仔细检查的遗传探针而言,样本数量非常有限。由于涉及大量可能的歧视性遗传网络,这一事实使有缺陷的遗传途径的采样变得复杂。在这项研究中,我们概述了三种用于识别,分类和表征表型预测问题中缺陷路径的新颖采样算法,例如Fisher比率采样器,Holdout采样器和Random采样器,并将它们分别应用于遗传途径分析参与三阴性乳腺癌(TNBC)的肿瘤行为和预后。使用最频繁采样的基因来识别改变的生物途径,并将其与通过贝叶斯网络(BNs)获得的那些进行比较。随机,Fisher比率和Holdout采样器比BN更加准确和可靠,同时提供了有关疾病基因组学的可比见解。测试的三个采样器是贝叶斯网络的不错选择,因为它们对计算的要求较低。重要的是,该分析证实了“生物不变性”的概念,因为改变的途径应独立于抽样方法和用于其推断的分类器。然而,由于不确定性空间的概率参数化不是唯一的,并且最佳网络的使用可能会伪造路径分析,因此贝叶斯网络仍需要进行一些修改才能正确地对表型预测问题中的不确定性空间进行采样。同时提供有关疾病基因组学的可比见解。测试的三个采样器是贝叶斯网络的不错选择,因为它们对计算的要求较低。重要的是,该分析证实了“生物不变性”的概念,因为改变的途径应独立于抽样方法和用于其推断的分类器。然而,由于不确定性空间的概率参数化不是唯一的,并且最佳网络的使用可能会伪造路径分析,因此在贝叶斯网络中仍需要进行一些修改才能正确地对表型预测问题中的不确定性空间进行采样。同时提供有关疾病基因组学的可比见解。测试的三个采样器是贝叶斯网络的不错选择,因为它们对计算的要求较低。重要的是,该分析证实了“生物不变性”的概念,因为改变的途径应独立于抽样方法和用于其推断的分类器。然而,由于不确定性空间的概率参数化不是唯一的,并且最佳网络的使用可能会伪造路径分析,因此在贝叶斯网络中仍需要进行一些修改才能正确地对表型预测问题中的不确定性空间进行采样。重要的是,该分析证实了“生物学不变性”的概念,因为改变的途径应独立于抽样方法和用于其推断的分类器。然而,由于不确定性空间的概率参数化不是唯一的,并且最佳网络的使用可能会伪造路径分析,因此在贝叶斯网络中仍需要进行一些修改才能正确地对表型预测问题中的不确定性空间进行采样。重要的是,该分析证实了“生物不变性”的概念,因为改变的途径应独立于抽样方法和用于其推断的分类器。然而,由于不确定性空间的概率参数化不是唯一的,并且最佳网络的使用可能会伪造路径分析,因此贝叶斯网络仍需要进行一些修改才能正确地对表型预测问题中的不确定性空间进行采样。
更新日期:2020-03-16
down
wechat
bug