当前位置: X-MOL 学术IEEE/ACM Trans. Comput. Biol. Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
GaMRed-Adaptive Filtering of High-Throughput Biological Data.
IEEE/ACM Transactions on Computational Biology and Bioinformatics ( IF 4.5 ) Pub Date : 2018-07-23 , DOI: 10.1109/tcbb.2018.2858825
Michal Marczyk , Roman Jaksik , Andrzej Polanski , Joanna Polanska

Data filtering based on removing non-informative features, with unchanged signal between compared experimental conditions, can significantly increase sensitivity of methods used to detect differentially expressed genes or other molecular components measured in high-throughput biological experiments. Criteria for data filtering can be stated on the basis of averages or variances of signal levels across samples. The crucial parts of feature filtering are selection of filter type and cut-off threshold, which are specific to the particular dataset. In this paper, we present an algorithm and a stand-alone application, GaMRed, for adaptive filtering insignificant features in high-throughput data, based on Gaussian mixture decomposition. We have tested the performance of our algorithm using datasets from three different high-throughput biological experiments. We estimated the number of differentially expressed features after applying multiple testing correction and performed functional analysis of obtained features using Gene Ontology terms. Also, we checked if the control of false discovery rate and family-wise error rate after applying feature filtering remains at appropriate level. GaMRed is fast, automatic, and does not require expert knowledge in parameter tuning. The algorithm increases sensitivity of methods used to find differentially expressed features and biological validity of the findings. The program can be downloaded from: http://zaed.aei.polsl.pl/index.php/pl/oprogramowanie-zaed.

中文翻译:

高通量生物数据的GaMRed自适应滤波。

基于去除非信息性特征的数据过滤,在比较的实验条件之间不会产生信号变化,可以显着提高用于检测差异表达基因或其他在高通量生物学实验中测量的分子成分的方法的灵敏度。可以基于样本之间信号电平的平均值或方差来陈述数据过滤的标准。特征过滤的关键部分是特定于特定数据集的过滤器类型和截止阈值的选择。在本文中,我们提出了一种基于高斯混合分解的高通量数据自适应滤波算法和一个独立应用GaMRed。我们使用来自三个不同的高通量生物学实验的数据集测试了算法的性能。在应用多次测试校正后,我们估计了差异表达特征的数量,并使用Gene Ontology术语对获得的特征进行了功能分析。此外,我们检查了应用特征过滤后对错误发现率和家庭错误率的控制是否保持在适当的水平。GaMRed是快速,自动的,不需要参数调整方面的专业知识。该算法提高了用于发现差异表达特征的方法的敏感性以及结果的生物学有效性。该程序可以从以下网址下载:http://zaed.aei.polsl.pl/index.php/pl/oprogramowanie-zaed。在应用多次测试校正后,我们估计了差异表达特征的数量,并使用基因本体论术语对获得的特征进行了功能分析。此外,我们检查了应用特征过滤后对错误发现率和家庭错误率的控制是否保持在适当的水平。GaMRed是快速,自动的,不需要参数调整方面的专业知识。该算法提高了用于发现差异表达特征的方法的敏感性以及结果的生物学有效性。该程序可以从以下网址下载:http://zaed.aei.polsl.pl/index.php/pl/oprogramowanie-zaed。在应用多次测试校正后,我们估计了差异表达特征的数量,并使用Gene Ontology术语对获得的特征进行了功能分析。此外,我们检查了应用特征过滤后对错误发现率和家庭错误率的控制是否保持在适当的水平。GaMRed是快速,自动的,不需要参数调整方面的专业知识。该算法提高了用于发现差异表达特征的方法的敏感性以及结果的生物学有效性。该程序可以从以下网址下载:http://zaed.aei.polsl.pl/index.php/pl/oprogramowanie-zaed。我们检查了应用特征过滤后对错误发现率和家庭错误率的控制是否保持在适当的水平。GaMRed是快速,自动的,不需要参数调整方面的专业知识。该算法提高了用于发现差异表达特征的方法的敏感性以及结果的生物学有效性。该程序可以从以下网址下载:http://zaed.aei.polsl.pl/index.php/pl/oprogramowanie-zaed。我们检查了应用特征过滤后对错误发现率和家庭错误率的控制是否保持在适当的水平。GaMRed是快速,自动的,不需要参数调整方面的专业知识。该算法提高了用于发现差异表达特征的方法的敏感性以及结果的生物学有效性。该程序可以从以下网址下载:http://zaed.aei.polsl.pl/index.php/pl/oprogramowanie-zaed。
更新日期:2020-03-07
down
wechat
bug