当前位置: X-MOL 学术Brief. Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
ZoomQA: residue-level protein model accuracy estimation with machine learning on sequential and 3D structural features
Briefings in Bioinformatics ( IF 9.5 ) Pub Date : 2021-09-08 , DOI: 10.1093/bib/bbab384
Kyle Hippe 1 , Cade Lilley 1 , Joshua William Berkenpas 1 , Ciri Chandana Pocha 2 , Kiyomi Kishaba 1 , Hui Ding 3 , Jie Hou 2 , Dong Si 4 , Renzhi Cao 1
Affiliation  

Motivation The Estimation of Model Accuracy problem is a cornerstone problem in the field of Bioinformatics. As of CASP14, there are 79 global QA methods, and a minority of 39 residue-level QA methods with very few of them working on protein complexes. Here, we introduce ZoomQA, a novel, single-model method for assessing the accuracy of a tertiary protein structure/complex prediction at residue level, which have many applications such as drug discovery. ZoomQA differs from others by considering the change in chemical and physical features of a fragment structure (a portion of a protein within a radius $r$ of the target amino acid) as the radius of contact increases. Fourteen physical and chemical properties of amino acids are used to build a comprehensive representation of every residue within a protein and grade their placement within the protein as a whole. Moreover, we have shown the potential of ZoomQA to identify problematic regions of the SARS-CoV-2 protein complex. Results We benchmark ZoomQA on CASP14, and it outperforms other state-of-the-art local QA methods and rivals state of the art QA methods in global prediction metrics. Our experiment shows the efficacy of these new features and shows that our method is able to match the performance of other state-of-the-art methods without the use of homology searching against databases or PSSM matrices. Availability http://zoomQA.renzhitech.com

中文翻译:

ZoomQA:通过机器学习对序列和 3D 结构特征进行残基水平蛋白质模型精度估计

动机模型准确性问题的估计是生物信息学领域的一个基石问题。截至 CASP14,有 79 种全局 QA 方法,以及 39 种残留水平 QA 方法中的少数,其中很少有用于蛋白质复合物的。在这里,我们介绍了 ZoomQA,这是一种新颖的单模型方法,用于评估残留水平的三级蛋白质结构/复合物预测的准确性,具有许多应用,例如药物发现。ZoomQA 与其他人的不同之处在于,随着接触半径的增加,片段结构(目标氨基酸半径 $r$ 内的蛋白质的一部分)的化学和物理特征的变化。氨基酸的 14 种物理和化学特性用于构建蛋白质中每个残基的综合表示,并对其在整个蛋白质中的位置进行分级。此外,我们已经展示了 ZoomQA 识别 SARS-CoV-2 蛋白复合物问题区域的潜力。结果 我们在 CASP14 上对 ZoomQA 进行了基准测试,它优于其他最先进的本地 QA 方法,并在全局预测指标上与最先进的 QA 方法相媲美。我们的实验展示了这些新功能的功效,并表明我们的方法能够在不使用同源搜索数据库或 PSSM 矩阵的情况下与其他最先进方法的性能相匹配。可用性 http://zoomQA.renzhitech.com 我们已经展示了 ZoomQA 识别 SARS-CoV-2 蛋白复合物问题区域的潜力。结果 我们在 CASP14 上对 ZoomQA 进行了基准测试,它优于其他最先进的本地 QA 方法,并在全局预测指标上与最先进的 QA 方法相媲美。我们的实验展示了这些新功能的功效,并表明我们的方法能够在不使用同源搜索数据库或 PSSM 矩阵的情况下与其他最先进方法的性能相匹配。可用性 http://zoomQA.renzhitech.com 我们已经展示了 ZoomQA 识别 SARS-CoV-2 蛋白复合物问题区域的潜力。结果 我们在 CASP14 上对 ZoomQA 进行了基准测试,它优于其他最先进的本地 QA 方法,并在全局预测指标上与最先进的 QA 方法相媲美。我们的实验展示了这些新功能的功效,并表明我们的方法能够在不使用同源搜索数据库或 PSSM 矩阵的情况下与其他最先进方法的性能相匹配。可用性 http://zoomQA.renzhitech.com 我们的实验展示了这些新功能的功效,并表明我们的方法能够在不使用同源搜索数据库或 PSSM 矩阵的情况下与其他最先进方法的性能相匹配。可用性 http://zoomQA.renzhitech.com 我们的实验展示了这些新功能的功效,并表明我们的方法能够在不使用同源搜索数据库或 PSSM 矩阵的情况下与其他最先进方法的性能相匹配。可用性 http://zoomQA.renzhitech.com
更新日期:2021-09-08
down
wechat
bug