当前位置: X-MOL 学术J. Chem. Inf. Model. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Assessment of AlphaFold2 for Human Proteins via Residue Solvent Exposure
Journal of Chemical Information and Modeling ( IF 5.6 ) Pub Date : 2022-07-03 , DOI: 10.1021/acs.jcim.2c00243
Kristoffer T Bæk 1 , Kasper P Kepp 1
Affiliation  

As only 35% of human proteins feature (often partial) PDB structures, the protein structure prediction tool AlphaFold2 (AF2) could have massive impact on human biology and medicine fields, making independent benchmarks of interest. We studied AF2’s ability to describe the backbone solvent exposure as a functionally important and easily interpretable “natural coordinate” of protein conformation, using human proteins as test case. After screening for appropriate comparative sets, we matched 1818 human proteins predicted by AF2 against 7585 unique experimental PDBs, and after curation for sequence overlap, we assessed 1264 comparative pairs comprising 115 unique AF2 structures and 652 unique experimental structures. AF2 performed markedly worse for multimers, whereas ligands, cofactors, and experimental resolution were interestingly not very important for performance. AF2 performed excellently for monomer proteins. Challenges relating to specific groups of residues and multimers were analyzed. We identified larger deviations for lower-confidence scores (pLDDT), and exposed residues and polar residues (e.g., Asp, Glu, Asn) being less accurately described than hydrophobic residues. Proline conformations were the hardest to predict, probably due to a common location in dynamic solvent-accessible parts. In summary, using solvent exposure as a metric, we quantified the performance of AF2 for human proteins and provided estimates of the expected agreement as a function of ligand presence, multimer/monomer status, local residue solvent exposure, pLDDT, and amino acid type. Overall performance was found to be excellent.

中文翻译:

通过残留溶剂暴露评估人类蛋白质的 AlphaFold2

由于只有 35% 的人类蛋白质具有(通常是部分的)PDB 结构,因此蛋白质结构预测工具 AlphaFold2 (AF2) 可能会对人类生物学和医学领域产生巨大影响,从而成为感兴趣的独立基准。我们使用人类蛋白质作为测试案例,研究了 AF2 将骨架溶剂暴露描述为功能上重要且易于解释的蛋白质构象“自然坐标”的能力。在筛选出适当的比较组后,我们将 AF2 预测的 1818 种人类蛋白质与 7585 个独特的实验性 PDB 进行匹配,在整理序列重叠后,我们评估了 1264 个比较对,包括 115 个独特的 AF2 结构和 652 个独特的实验结构。AF2 对多聚体的表现明显较差,而配体、辅因子、有趣的是,实验分辨率对性能并不是很重要。AF2 对单体蛋白表现出色。分析了与特定残基和多聚体组相关的挑战。我们确定了较低置信度分数 (pLDDT) 的较大偏差,并且暴露的残基和极性残基(例如,Asp、Glu、Asn)的描述不如疏水残基准确。脯氨酸构象是最难预测的,可能是由于在动态溶剂可接近部件中的共同位置。总之,使用溶剂暴露作为衡量标准,我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。AF2 对单体蛋白表现出色。分析了与特定残基和多聚体组相关的挑战。我们确定了较低置信度分数 (pLDDT) 的较大偏差,并且暴露的残基和极性残基(例如,Asp、Glu、Asn)的描述不如疏水残基准确。脯氨酸构象是最难预测的,可能是由于在动态溶剂可接近部件中的共同位置。总之,使用溶剂暴露作为衡量标准,我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。AF2 对单体蛋白表现出色。分析了与特定残基和多聚体组相关的挑战。我们确定了较低置信度分数 (pLDDT) 的较大偏差,并且暴露的残基和极性残基(例如,Asp、Glu、Asn)的描述不如疏水残基准确。脯氨酸构象是最难预测的,可能是由于在动态溶剂可接近部件中的共同位置。总之,使用溶剂暴露作为衡量标准,我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。分析了与特定残基和多聚体组相关的挑战。我们确定了较低置信度分数 (pLDDT) 的较大偏差,并且暴露的残基和极性残基(例如,Asp、Glu、Asn)的描述不如疏水残基准确。脯氨酸构象是最难预测的,可能是由于在动态溶剂可接近部件中的共同位置。总之,使用溶剂暴露作为衡量标准,我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。分析了与特定残基和多聚体组相关的挑战。我们确定了较低置信度分数 (pLDDT) 的较大偏差,并且暴露的残基和极性残基(例如,Asp、Glu、Asn)的描述不如疏水残基准确。脯氨酸构象是最难预测的,可能是由于在动态溶剂可接近部件中的共同位置。总之,使用溶剂暴露作为衡量标准,我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。Glu, Asn) 的描述不如疏水残基准确。脯氨酸构象是最难预测的,可能是由于在动态溶剂可接近部件中的共同位置。总之,使用溶剂暴露作为衡量标准,我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。Glu, Asn) 的描述不如疏水残基准确。脯氨酸构象是最难预测的,可能是由于在动态溶剂可接近部件中的共同位置。总之,使用溶剂暴露作为衡量标准,我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。我们量化了 AF2 对人类蛋白质的性能,并提供了作为配体存在、多聚体/单体状态、局部残留溶剂暴露、pLDDT 和氨基酸类型函数的预期一致性的估计值。发现整体表现非常出色。
更新日期:2022-07-03
down
wechat
bug