当前位置: X-MOL 学术J. Bioinform. Comput. Biol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
PVsiRNAPred: Prediction of plant exclusive virus-derived small interfering RNAs by deep convolutional neural network
Journal of Bioinformatics and Computational Biology ( IF 1 ) Pub Date : 2019-11-25 , DOI: 10.1142/s0219720019500392
Bifang He 1, 2 , Jian Huang 2 , Heng Chen 1
Affiliation  

Plant exclusive virus-derived small interfering RNAs (vsiRNAs) regulate various biological processes, especially important in antiviral immunity. The identification of plant vsiRNAs is important for understanding the biogenesis and function mechanisms of vsiRNAs and further developing anti-viral plants. In this study, we extracted plant vsiRNA sequences from the PVsiRNAdb database. We then utilized deep convolutional neural network (CNN) to develop a deep learning algorithm for predicting plant vsiRNAs based on vsiRNA sequence composition, known as PVsiRNAPred. The key part of PVsiRNAPred is the CNN module, which automatically learns hierarchical representations of vsiRNA sequences related to vsiRNA profiles in plants. When evaluated using an independent testing dataset, the accuracy of the model was 65.70%, which was higher than those of five conventional machine learning method-based classifiers. In addition, PVsiRNAPred obtained a sensitivity of 67.11%, specificity of 64.26% and Matthews correlation coefficient (MCC) of 0.31, and the area under the receiver operating characteristic (ROC) curve (AUC) of PVsiRNAPred was 0.71 in the independent test. The permutation test with 1000 shuffles resulted in a [Formula: see text] value [Formula: see text]. The above results reveal that PVsiRNAPred has favorable generalization capabilities. We hope PVsiRNAPred, the first bioinformatics algorithm for predicting plant vsiRNAs, will allow efficient discovery of new vsiRNAs.

中文翻译:

PVsiRNAPred:通过深度卷积神经网络预测植物专属病毒衍生的小干扰 RNA

植物独有的病毒衍生的小干扰 RNA (vsiRNA) 调节各种生物过程,在抗病毒免疫中尤其重要。植物vsiRNAs的鉴定对于了解vsiRNAs的生物发生和功能机制以及进一步开发抗病毒植物具有重要意义。在这项研究中,我们从 PVsiRNAdb 数据库中提取了植物 vsiRNA 序列。然后,我们利用深度卷积神经网络 (CNN) 开发了一种深度学习算法,用于基于 vsiRNA 序列组成预测植物 vsiRNA,称为 PVsiRNAPred。PVsiRNAPred 的关键部分是 CNN 模块,它自动学习与植物中的 vsiRNA 谱相关的 vsiRNA 序列的层次表示。使用独立测试数据集进行评估时,模型的准确率为 65.70%,高于五个传统的基于机器学习方法的分类器。此外,PVsiRNAPred的敏感性为67.11%,特异性为64.26%,马修斯相关系数(MCC)为0.31,独立检验中PVsiRNAPred的受试者工作特征(ROC)曲线下面积(AUC)为0.71。具有 1000 次随机播放的置换测试产生了 [公式:参见文本] 值 [公式:参见文本]。上述结果表明,PVsiRNAPred 具有良好的泛化能力。我们希望第一个预测植物 vsiRNA 的生物信息学算法 PVsiRNAPred 能够有效地发现新的 vsiRNA。PVsiRNAPred的受试者工作特征(ROC)曲线下面积(AUC)在独立测试中为0.71。具有 1000 次随机播放的置换测试产生了 [公式:参见文本] 值 [公式:参见文本]。上述结果表明,PVsiRNAPred 具有良好的泛化能力。我们希望第一个预测植物 vsiRNA 的生物信息学算法 PVsiRNAPred 能够有效地发现新的 vsiRNA。PVsiRNAPred的受试者工作特征(ROC)曲线下面积(AUC)在独立测试中为0.71。具有 1000 次随机播放的置换测试产生了 [公式:参见文本] 值 [公式:参见文本]。上述结果表明,PVsiRNAPred 具有良好的泛化能力。我们希望第一个预测植物 vsiRNA 的生物信息学算法 PVsiRNAPred 能够有效地发现新的 vsiRNA。
更新日期:2019-11-25
down
wechat
bug