当前位置: X-MOL 学术Brief. Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Prediction of RBP binding sites on circRNAs using an LSTM-based deep sequence learning architecture
Briefings in Bioinformatics ( IF 9.5 ) Pub Date : 2021-08-05 , DOI: 10.1093/bib/bbab342
Zhengfeng Wang 1, 2 , Xiujuan Lei 1
Affiliation  

Circular RNAs (circRNAs) are widely expressed in highly diverged eukaryotes. Although circRNAs have been known for many years, their function remains unclear. Interaction with RNA-binding protein (RBP) to influence post-transcriptional regulation is considered to be an important pathway for circRNA function, such as acting as an oncogenic RBP sponge to inhibit cancer. In this study, we design a deep learning framework, CRPBsites, to predict the binding sites of RBPs on circRNAs. In this model, the sequences of variable-length binding sites are transformed into embedding vectors by word2vec model. Bidirectional LSTM is used to encode the embedding vectors of binding sites, and then they are fed into another LSTM decoder for decoding and classification tasks. To train and test the model, we construct four datasets that contain sequences of variable-length binding sites on circRNAs, and each set corresponds to an RBP, which is overexpressed in bladder cancer tissues. Experimental results on four datasets and comparison with other existing models show that CRPBsites has superior performance. Afterwards, we found that there were highly similar binding motifs in the four binding site datasets. Finally, we applied well-trained CRPBsites to identify the binding sites of IGF2BP1 on circCDYL, and the results proved the effectiveness of this method. In conclusion, CRPBsites is an effective prediction model for circRNA-RBP interaction site identification. We hope that CRPBsites can provide valuable guidance for experimental studies on the influence of circRNA on post-transcriptional regulation.

中文翻译:

使用基于 LSTM 的深度序列学习架构预测 circRNA 上的 RBP 结合位点

环状 RNA (circRNA) 在高度分化的真核生物中广泛表达。尽管 circRNAs 已为人所知多年,但其功能仍不清楚。与 RNA 结合蛋白 (RBP) 相互作用以影响转录后调控被认为是 circRNA 功能的重要途径,例如作为致癌 RBP 海绵抑制癌症。在这项研究中,我们设计了一个深度学习框架 CRPBsites,以预测 RBP 在 circRNA 上的结合位点。在该模型中,可变长度的结合位点序列通过 word2vec 模型转换为嵌入向量。双向 LSTM 用于对结合位点的嵌入向量进行编码,然后将它们输入另一个 LSTM 解码器进行解码和分类任务。为了训练和测试模型,我们构建了四个数据集,其中包含 circRNA 上可变长度结合位点的序列,每个数据集对应一个 RBP,该 RBP 在膀胱癌组织中过度表达。四个数据集的实验结果以及与其他现有模型的比较表明,CRPBsites 具有优越的性能。之后,我们发现四个结合位点数据集中存在高度相似的结合基序。最后,我们应用训练有素的 CRPBsites 来识别 IGF2BP1 在 circCDYL 上的结合位点,结果证明了该方法的有效性。总之,CRPBsites是一种有效的circRNA-RBP相互作用位点识别预测模型。我们希望CRPBsites能为实验研究circRNA对转录后调控的影响提供有价值的指导。每组对应一个 RBP,它在膀胱癌组织中过表达。四个数据集的实验结果以及与其他现有模型的比较表明,CRPBsites 具有优越的性能。之后,我们发现四个结合位点数据集中存在高度相似的结合基序。最后,我们应用训练有素的 CRPBsites 来识别 IGF2BP1 在 circCDYL 上的结合位点,结果证明了该方法的有效性。总之,CRPBsites是一种有效的circRNA-RBP相互作用位点识别预测模型。我们希望CRPBsites能为实验研究circRNA对转录后调控的影响提供有价值的指导。每组对应一个 RBP,它在膀胱癌组织中过表达。四个数据集的实验结果以及与其他现有模型的比较表明,CRPBsites 具有优越的性能。之后,我们发现四个结合位点数据集中存在高度相似的结合基序。最后,我们应用训练有素的 CRPBsites 来识别 IGF2BP1 在 circCDYL 上的结合位点,结果证明了该方法的有效性。总之,CRPBsites是一种有效的circRNA-RBP相互作用位点识别预测模型。我们希望CRPBsites能为实验研究circRNA对转录后调控的影响提供有价值的指导。四个数据集的实验结果以及与其他现有模型的比较表明,CRPBsites 具有优越的性能。之后,我们发现四个结合位点数据集中存在高度相似的结合基序。最后,我们应用训练有素的 CRPBsites 来识别 IGF2BP1 在 circCDYL 上的结合位点,结果证明了该方法的有效性。总之,CRPBsites是一种有效的circRNA-RBP相互作用位点识别预测模型。我们希望CRPBsites能为实验研究circRNA对转录后调控的影响提供有价值的指导。四个数据集的实验结果以及与其他现有模型的比较表明,CRPBsites 具有优越的性能。之后,我们发现四个结合位点数据集中存在高度相似的结合基序。最后,我们应用训练有素的 CRPBsites 来识别 IGF2BP1 在 circCDYL 上的结合位点,结果证明了该方法的有效性。总之,CRPBsites是一种有效的circRNA-RBP相互作用位点识别预测模型。我们希望CRPBsites能为实验研究circRNA对转录后调控的影响提供有价值的指导。我们应用训练有素的 CRPBsites 来识别 IGF2BP1 在 circCDYL 上的结合位点,结果证明了该方法的有效性。总之,CRPBsites是一种有效的circRNA-RBP相互作用位点识别预测模型。我们希望CRPBsites能为实验研究circRNA对转录后调控的影响提供有价值的指导。我们应用训练有素的 CRPBsites 来识别 IGF2BP1 在 circCDYL 上的结合位点,结果证明了该方法的有效性。总之,CRPBsites是一种有效的circRNA-RBP相互作用位点识别预测模型。我们希望CRPBsites能为实验研究circRNA对转录后调控的影响提供有价值的指导。
更新日期:2021-08-05
down
wechat
bug