当前位置: X-MOL 学术Bioinformatics › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
T-Gene: improved target gene prediction.
Bioinformatics ( IF 5.8 ) Pub Date : 2020-04-04 , DOI: 10.1093/bioinformatics/btaa227
Timothy O'Connor 1 , Charles E Grant 2 , Mikael Bodén 3 , Timothy L Bailey 4
Affiliation  

MOTIVATION Identifying the genes regulated by a given transcription factor (its "target genes") is a key step in developing a comprehensive understanding of gene regulation. Previously we developed a method (CisMapper) for predicting the target genes of a transcription factor (TF) based solely on the correlation between a histone modification at the TF's binding site and the expression of the gene across a set of tissues or cell lines. That approach is limited to organisms for which extensive histone and expression data is available, and does not explicitly incorporate the genomic distance between the TF and the gene. RESULTS We present the T-Gene algorithm, which overcomes these limitations. It can be used to predict which genes are most likely to be regulated by a TF, and which of the TF's binding sites are most likely involved in regulating particular genes. T-Gene calculates a novel score that combines distance and histone/expression correlation, and we show that this score accurately predicts when a regulatory element bound by a TF is in contact with a gene's promoter, achieving median precision above 60%. T-Gene is easy to use via its web server or as a command-line tool, and can also make accurate predictions (median precision above 40%) based on distance alone when extensive histone/expression data is not available for the organism. T-Gene provides an estimate of the statistical significance of each of its predictions. AVAILABILITY The T-Gene web server, source code, histone/expression data and genome annotation files are provided at http://meme-suite.org.

中文翻译:

T-Gene:改进的靶基因预测。

动机鉴定由给定转录因子调控的基因(其“靶基因”)是全面理解基因调控的关键步骤。以前,我们仅基于TF结合位点的组蛋白修饰与该基因在一组组织或细胞系中的表达之间的相关性,开发了一种预测转录因子(TF)靶基因的方法(CisMapper)。该方法仅限于可获得大量组蛋白和表达数据的生物,并且未明确纳入TF与基因之间的基因组距离。结果我们提出了克服这些限制的T基因算法。它可以用来预测哪些基因最可能受TF调控,以及哪些TF' s的结合位点最有可能参与调节特定基因。T-Gene计算出一个结合距离和组蛋白/表达相关性的新颖评分,我们证明了该评分可准确预测TF结合的调控元件何时与基因的启动子接触,从而使中位精度达到60%以上。T-Gene易于通过其Web服务器或作为命令行工具使用,并且在无法获得有关生物体的大量组蛋白/表达数据时,也可以仅基于距离进行准确的预测(中值精度高于40%)。T基因提供了每个预测的统计显着性的估计。可用性T-Gene Web服务器,源代码,组蛋白/表达数据和基因组注释文件位于http://meme-suite.org。T-Gene计算出一个结合距离和组蛋白/表达相关性的新颖评分,我们证明了该评分可准确预测由TF结合的调控元件何时与基因的启动子相接触,从而使中位精度达到60%以上。T-Gene易于通过其Web服务器或作为命令行工具使用,并且在无法获得有关生物体的大量组蛋白/表达数据时,也可以仅基于距离进行准确的预测(中值精度高于40%)。T基因提供了每个预测的统计显着性的估计。可用性T-Gene Web服务器,源代码,组蛋白/表达数据和基因组注释文件位于http://meme-suite.org。T-Gene计算出一个结合距离和组蛋白/表达相关性的新颖评分,我们证明了该评分可准确预测由TF结合的调控元件何时与基因的启动子相接触,从而使中位精度达到60%以上。T-Gene易于通过其Web服务器或作为命令行工具使用,并且在无法获得有关生物体的大量组蛋白/表达数据时,也可以仅基于距离进行准确的预测(中值精度高于40%)。T基因提供了每个预测的统计显着性的估计。可用性T-Gene Web服务器,源代码,组蛋白/表达数据和基因组注释文件位于http://meme-suite.org。并且我们证明了该分数准确地预测了由TF结合的调控元件何时与基因的启动子相接触,从而使中值精度达到60%以上。T-Gene易于通过其Web服务器或作为命令行工具使用,并且在无法获得有关生物体的大量组蛋白/表达数据时,也可以仅基于距离进行准确的预测(中值精度高于40%)。T基因提供了每个预测的统计显着性的估计。可用性T-Gene Web服务器,源代码,组蛋白/表达数据和基因组注释文件位于http://meme-suite.org。并且我们证明了该分数准确地预测了由TF结合的调控元件何时与基因的启动子相接触,从而使中值精度达到60%以上。T-Gene易于通过其Web服务器或作为命令行工具使用,并且在无法获得有关生物体的大量组蛋白/表达数据时,也可以仅基于距离进行准确的预测(中值精度高于40%)。T基因提供了每个预测的统计显着性的估计。可用性T-Gene Web服务器,源代码,组蛋白/表达数据和基因组注释文件位于http://meme-suite.org。当没有足够的组蛋白/表达数据时,也可以仅根据距离做出准确的预测(中值精度在40%以上)。T基因提供了每个预测的统计显着性的估计。可用性T-Gene Web服务器,源代码,组蛋白/表达数据和基因组注释文件位于http://meme-suite.org。当没有足够的组蛋白/表达数据时,也可以仅根据距离做出准确的预测(中值精度在40%以上)。T基因提供了每个预测的统计显着性的估计。可用性T-Gene Web服务器,源代码,组蛋白/表达数据和基因组注释文件位于http://meme-suite.org。
更新日期:2020-04-06
down
wechat
bug