当前位置: X-MOL 学术BMC Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
fcScan: a versatile tool to cluster combinations of sites using genomic coordinates.
BMC Bioinformatics ( IF 2.9 ) Pub Date : 2020-05-19 , DOI: 10.1186/s12859-020-3536-4
Abdullah El-Kurdi 1, 2 , Ghiwa Ali Khalil 1 , Georges Khazen 3 , Pierre Khoueiry 1, 2
Affiliation  

BACKGROUND Finding combinations of homotypic or heterotypic genomic sites obeying a specific grammar in DNA sequences is a frequent task in bioinformatics. A typical case corresponds to the identification of cis-regulatory modules characterized by a combination of transcription factor binding sites in a defined window size. Although previous studies identified clusters of genomic sites in species with varying genome sizes, the availability of a dedicated and versatile tool to search for such clusters is lacking. RESULTS We present fcScan, an R/Bioconductor package to search for clusters of genomic sites based on user defined criteria including cluster size, inter-cluster distances and sites order and orientation allowing users to adapt their search criteria to specific biological questions. It supports GRanges, data frame and VCF/BED files as input and returns data in GRanges format. By performing clustering on vectorized data, fcScan is adapted to search for genomic clusters in millions of sites as input in short time and is thus ideal to scan data generated by high throughput methods including next generation sequencing. CONCLUSIONS fcScan is ideal for detecting cis-regulatory modules of transcription factor binding sites with a specific grammar as well as genomic loci enriched for mutations. The flexibility in input parameters allows users to perform searches targeting specific research questions. It is released under Artistic-2.0 License. The source code is freely available through Bioconductor (https://bioconductor.org/packages/fcScan) and GitHub (https://github.com/pkhoueiry/fcScan).

中文翻译:

fcScan:使用基因组坐标对位点组合进行聚类的多功能工具。

背景技术寻找符合DNA序列中特定语法的同型或异型基因组位点的组合是生物信息学中的常见任务。一个典型的案例是对顺式调节模块的鉴定,其特征是在限定的窗口大小内结合转录因子结合位点。尽管先前的研究确定了具有不同基因组大小的物种中的基因组位点簇,但是缺乏一种专用且通用的工具来搜索此类簇。结果我们展示了fcScan,一种R / Bioconductor软件包,可根据用户定义的标准(包括簇大小,簇间距离以及位点顺序和方向)搜索基因组位点的簇,从而使用户可以将搜索标准适应特定的生物学问题。它支持GRanges,数据帧和VCF / BED文件作为输入,并以GRanges格式返回数据。通过对矢量化数据执行聚类,fcScan适用于在短时间内搜索数百万个站点中的基因组簇作为输入,因此非常适合扫描通过高通量方法(包括下一代测序)生成的数据。结论fcScan是检测转录因子结合位点的顺式调控模块的理想方法,该模块具有特定的语法以及丰富的突变基因组位点。输入参数的灵活性使用户可以针对特定研究问题进行搜索。它是根据Artistic-2.0许可证发行的。可通过Bioconductor(https://bioconductor.org/packages/fcScan)和GitHub(https://github.com/pkhoueiry/fcScan)免费获得源代码。通过对矢量化数据执行聚类,fcScan适用于在短时间内搜索数百万个站点中的基因组簇作为输入,因此非常适合扫描通过高通量方法(包括下一代测序)生成的数据。结论fcScan是检测转录因子结合位点的顺式调控模块的理想方法,该模块具有特定的语法以及丰富的突变基因组位点。输入参数的灵活性使用户可以针对特定研究问题进行搜索。它是根据Artistic-2.0许可证发行的。可通过Bioconductor(https://bioconductor.org/packages/fcScan)和GitHub(https://github.com/pkhoueiry/fcScan)免费获得源代码。通过对矢量化数据执行聚类,fcScan适用于在短时间内搜索数百万个站点中的基因组簇作为输入,因此非常适合扫描通过高通量方法(包括下一代测序)生成的数据。结论fcScan是检测转录因子结合位点的顺式调控模块的理想方法,该模块具有特定的语法以及丰富的突变基因组位点。输入参数的灵活性使用户可以针对特定研究问题进行搜索。它是根据Artistic-2.0许可证发行的。可通过Bioconductor(https://bioconductor.org/packages/fcScan)和GitHub(https://github.com/pkhoueiry/fcScan)免费获得源代码。fcScan适用于在短时间内搜索数百万个站点中的基因组簇作为输入,因此非常适合扫描通过高通量方法(包括下一代测序)生成的数据。结论fcScan是检测转录因子结合位点的顺式调控模块的理想方法,该模块具有特定的语法以及丰富的突变基因组位点。输入参数的灵活性使用户可以针对特定研究问题进行搜索。它是根据Artistic-2.0许可证发行的。可通过Bioconductor(https://bioconductor.org/packages/fcScan)和GitHub(https://github.com/pkhoueiry/fcScan)免费获得源代码。fcScan适用于在短时间内搜索数百万个站点中的基因组簇作为输入,因此非常适合扫描通过高通量方法(包括下一代测序)生成的数据。结论fcScan是检测转录因子结合位点的顺式调控模块的理想方法,该模块具有特定的语法以及丰富的突变基因组位点。输入参数的灵活性使用户可以针对特定研究问题进行搜索。它是根据Artistic-2.0许可证发行的。可通过Bioconductor(https://bioconductor.org/packages/fcScan)和GitHub(https://github.com/pkhoueiry/fcScan)免费获得源代码。结论fcScan是检测转录因子结合位点的顺式调控模块的理想方法,该模块具有特定的语法以及丰富的突变基因组位点。输入参数的灵活性使用户可以针对特定研究问题进行搜索。它是根据Artistic-2.0许可证发行的。可通过Bioconductor(https://bioconductor.org/packages/fcScan)和GitHub(https://github.com/pkhoueiry/fcScan)免费获得源代码。结论fcScan是检测转录因子结合位点的顺式调控模块的理想方法,该模块具有特定的语法以及丰富的突变基因组位点。输入参数的灵活性使用户可以针对特定研究问题进行搜索。它是根据Artistic-2.0许可证发行的。可通过Bioconductor(https://bioconductor.org/packages/fcScan)和GitHub(https://github.com/pkhoueiry/fcScan)免费获得源代码。
更新日期:2020-05-19
down
wechat
bug