当前位置: X-MOL 学术J. Comput. Biol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Comparison of Pseudoknotted RNA Secondary Structures by Topological Centroid Identification and Tree Edit Distance.
Journal of Computational Biology ( IF 1.7 ) Pub Date : 2020-09-04 , DOI: 10.1089/cmb.2019.0512
Feiqi Wang 1 , Tatsuya Akutsu 1 , Tomoya Mori 1
Affiliation  

Comparison of RNA structures is one of the most crucial analysis for elucidating their individual functions and promoting medical applications. Because it is widely accepted that their functions and structures are strongly correlated, various methods for RNA secondary structure analysis have been proposed owing to the difficulty in predicting RNA three-dimensional structure directly from its sequence. However, there are few methods dealing with RNA secondary structures with a specific and complex partial structure called pseudoknot despite its significance to biological process, which is a big obstacle for analyzing their functions. In this study, we propose a novel tree representation of pseudoknotted RNA secondary structures by topological centroid identification and their comparison methods based on the tree edit distance. In the proposed method, a given graph representing an RNA secondary structure is transformed to a tree rooted at one of the vertices constituting the topological centroid that is identified by removing cycles with peeling processing for the graph. When comparing tree-represented RNA secondary structures collected from a public database using the tree edit distance and functional gene groups defined by Gene Ontology (GO), the proposed method showed better clustering results according to their GOs than canonical RNA sequence-based comparison. In addition, we also report a case that the combination of the tree edit distance and the sequence edit distance shows a better classification of the pseudoknotted RNA secondary structures.

中文翻译:

通过拓扑质心识别和树编辑距离比较 Pseudoknotted RNA 二级结构。

RNA结构的比较是阐明其各自功能和促进医学应用的最重要的分析之一。由于人们普遍认为它们的功能和结构具有很强的相关性,由于难以直接从其序列预测 RNA 的三维结构,因此提出了各种用于 RNA 二级结构分析的方法。然而,很少有方法处理具有称为假结的特定复杂部分结构的RNA二级结构,尽管它对生物过程具有重要意义,这是分析其功能的一大障碍。在这项研究中,我们通过拓扑质心识别及其基于树编辑距离的比较方法提出了一种新的假结 RNA 二级结构的树表示。在所提出的方法中,将表示 RNA 二级结构的给定图转换为以构成拓扑质心的顶点之一为根的树,该树通过对图进行剥离处理去除循环来识别。当使用基因本体论 (GO) 定义的树编辑距离和功能基因组比较从公共数据库收集的树表示的 RNA 二级结构时,所提出的方法根据其 GO 显示出比基于规范 RNA 序列的比较更好的聚类结果。此外,我们还报告了一个案例,树编辑距离和序列编辑距离的组合显示了对假结 RNA 二级结构的更好分类。将表示 RNA 二级结构的给定图转换为以构成拓扑质心的顶点之一为根的树,该树通过对图进行剥离处理去除循环来识别。当使用基因本体论 (GO) 定义的树编辑距离和功能基因组比较从公共数据库收集的树表示的 RNA 二级结构时,所提出的方法根据其 GO 显示出比基于规范 RNA 序列的比较更好的聚类结果。此外,我们还报告了一个案例,树编辑距离和序列编辑距离的组合显示了对假结 RNA 二级结构的更好分类。将表示 RNA 二级结构的给定图转换为以构成拓扑质心的顶点之一为根的树,该树通过对图进行剥离处理去除循环来识别。当使用基因本体论 (GO) 定义的树编辑距离和功能基因组比较从公共数据库收集的树表示的 RNA 二级结构时,所提出的方法根据其 GO 显示出比基于规范 RNA 序列的比较更好的聚类结果。此外,我们还报告了一个案例,树编辑距离和序列编辑距离的组合显示了对假结 RNA 二级结构的更好分类。当使用基因本体论 (GO) 定义的树编辑距离和功能基因组比较从公共数据库收集的树表示的 RNA 二级结构时,所提出的方法根据其 GO 显示出比基于规范 RNA 序列的比较更好的聚类结果。此外,我们还报告了一个案例,树编辑距离和序列编辑距离的组合显示了对假结 RNA 二级结构的更好分类。当使用基因本体论 (GO) 定义的树编辑距离和功能基因组比较从公共数据库收集的树表示的 RNA 二级结构时,所提出的方法根据其 GO 显示出比基于规范 RNA 序列的比较更好的聚类结果。此外,我们还报告了一个案例,树编辑距离和序列编辑距离的组合显示了对假结 RNA 二级结构的更好分类。
更新日期:2020-09-14
down
wechat
bug