当前位置: X-MOL 学术BMC Med. Genomics › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Machine learning based refined differential gene expression analysis of pediatric sepsis.
BMC Medical Genomics ( IF 2.1 ) Pub Date : 2020-08-28 , DOI: 10.1186/s12920-020-00771-4
Mostafa Abbas 1 , Yasser El-Manzalawy 1, 2
Affiliation  

Differential expression (DE) analysis of transcriptomic data enables genome-wide analysis of gene expression changes associated with biological conditions of interest. Such analysis often provides a wide list of genes that are differentially expressed between two or more groups. In general, identified differentially expressed genes (DEGs) can be subject to further downstream analysis for obtaining more biological insights such as determining enriched functional pathways or gene ontologies. Furthermore, DEGs are treated as candidate biomarkers and a small set of DEGs might be identified as biomarkers using either biological knowledge or data-driven approaches. In this work, we present a novel approach for identifying biomarkers from a list of DEGs by re-ranking them according to the Minimum Redundancy Maximum Relevance (MRMR) criteria using repeated cross-validation feature selection procedure. Using gene expression profiles for 199 children with sepsis and septic shock, we identify 108 DEGs and propose a 10-gene signature for reliably predicting pediatric sepsis mortality with an estimated Area Under ROC Curve (AUC) score of 0.89. Machine learning based refinement of DE analysis is a promising tool for prioritizing DEGs and discovering biomarkers from gene expression profiles. Moreover, our reported 10-gene signature for pediatric sepsis mortality may facilitate the development of reliable diagnosis and prognosis biomarkers for sepsis.

中文翻译:

基于机器学习的小儿败血症的精细差异基因表达分析。

转录组数据的差异表达(DE)分析可实现与感兴趣的生物学条件相关的基因表达变化的全基因组分析。此类分析通常提供了在两个或多个组之间差异表达的大量基因。通常,可以对鉴定出的差异表达基因(DEG)进行进一步的下游分析,以获得更多的生物学见解,例如确定丰富的功能途径或基因本体论。此外,将DEG视为候选生物标记,并且可以使用生物学知识或数据驱动的方法将一小部分DEG识别为生物标记。在这项工作中 我们提出了一种新方法,可通过使用重复交叉验证特征选择程序根据最小冗余最大相关性(MRMR)标准对DEG进行重新排序,从而从DEG列表中识别生物标记。使用199名败血症和败血性休克患儿的基因表达谱,我们确定了108个DEG,并提出了10个基因的签名,可可靠地预测儿科败血症的死亡率,ROC曲线下估计面积(AUC)得分为0.89。基于机器学习的DE分析优化是一种有前途的工具,可用于对DEG进行优先级排序并从基因表达谱中发现生物标记。此外,我们报道的小儿败血症死亡率的10个基因标志可能促进脓毒症可靠诊断和预后生物标志物的发展。使用199名败血症和败血性休克患儿的基因表达谱,我们确定了108个DEG,并提出了10个基因的签名,可可靠地预测儿科败血症的死亡率,ROC曲线下估计面积(AUC)得分为0.89。基于机器学习的DE分析优化是一种有前途的工具,可用于对DEG进行优先级排序并从基因表达谱中发现生物标记。此外,我们报道的小儿败血症死亡率的10个基因标志可能促进脓毒症可靠诊断和预后生物标志物的发展。使用199名败血症和败血性休克患儿的基因表达谱,我们确定了108个DEG,并提出了10个基因的签名,可可靠地预测儿科败血症的死亡率,ROC曲线下估计面积(AUC)得分为0.89。基于机器学习的DE分析优化是一种有前途的工具,可用于对DEG进行优先级排序并从基因表达谱中发现生物标记。此外,我们报道的小儿败血症死亡率的10个基因标志可能促进脓毒症可靠诊断和预后生物标志物的发展。基于机器学习的DE分析优化是一种有前途的工具,可用于对DEG进行优先级排序并从基因表达谱中发现生物标记。此外,我们报道的小儿败血症死亡率的10个基因标志可能促进脓毒症可靠诊断和预后生物标志物的发展。基于机器学习的DE分析优化是一种有前途的工具,可用于对DEG进行优先级排序并从基因表达谱中发现生物标记。此外,我们报道的小儿败血症死亡率的10个基因标志可能促进脓毒症可靠诊断和预后生物标志物的发展。
更新日期:2020-08-28
down
wechat
bug