当前位置:
X-MOL 学术
›
J. Chem. Inf. Model.
›
论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
GalaxyWater-CNN: Prediction of Water Positions on the Protein Structure by a 3D-Convolutional Neural Network
Journal of Chemical Information and Modeling ( IF 5.6 ) Pub Date : 2022-06-24 , DOI: 10.1021/acs.jcim.2c00306 Sangwoo Park 1 , Chaok Seok 1, 2
Journal of Chemical Information and Modeling ( IF 5.6 ) Pub Date : 2022-06-24 , DOI: 10.1021/acs.jcim.2c00306 Sangwoo Park 1 , Chaok Seok 1, 2
Affiliation
Proteins interact with numerous water molecules to perform their physiological functions in biological organisms. Most water molecules act as solvent media; hence, their roles may be considered implicitly in theoretical treatments of protein structure and function. However, some water molecules interact intimately with proteins and require explicit treatment to understand their effects. Most physics-based computational methods are limited in their ability to accurately locate water molecules on protein surfaces because of inaccurate energy functions. Instead of relying on an energy function, this study attempts to learn the locations of water molecules from structural data. GalaxyWater-convolutional neural network (CNN) predicts water positions on protein chains, protein–protein interfaces, and protein–compound binding sites using a 3D-CNN model that is trained to generate a water score map on a given protein structure. The training data are compiled from high-resolution protein crystal structures resolved together with water molecules. GalaxyWater-CNN shows improved water prediction performance both in the coverage of crystal water molecules and in the accuracy of the predicted water positions when compared with previous energy-based methods. This method shows a superior performance in predicting water molecules that form hydrogen-bond networks precisely. The web service and the source code of this water prediction method are freely available at https://galaxy.seoklab.org/gwcnn and https://github.com/seoklab/GalaxyWater-CNN, respectively.
中文翻译:
GalaxyWater-CNN:通过 3D 卷积神经网络预测蛋白质结构上的水位
蛋白质与许多水分子相互作用以在生物有机体中发挥其生理功能。大多数水分子充当溶剂介质;因此,它们的作用可能被隐含在蛋白质结构和功能的理论处理中。然而,一些水分子与蛋白质密切相互作用,需要明确处理才能了解它们的作用。由于能量函数不准确,大多数基于物理的计算方法在准确定位蛋白质表面上的水分子的能力方面受到限制。本研究不依赖于能量函数,而是试图从结构数据中了解水分子的位置。GalaxyWater-卷积神经网络 (CNN) 预测蛋白质链上的水位置、蛋白质-蛋白质界面、和蛋白质-化合物结合位点使用 3D-CNN 模型,该模型经过训练可在给定蛋白质结构上生成水分数图。训练数据由与水分子一起解析的高分辨率蛋白质晶体结构编译而成。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。训练数据由与水分子一起解析的高分辨率蛋白质晶体结构编译而成。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。训练数据由与水分子一起解析的高分辨率蛋白质晶体结构编译而成。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。
更新日期:2022-06-24
中文翻译:
GalaxyWater-CNN:通过 3D 卷积神经网络预测蛋白质结构上的水位
蛋白质与许多水分子相互作用以在生物有机体中发挥其生理功能。大多数水分子充当溶剂介质;因此,它们的作用可能被隐含在蛋白质结构和功能的理论处理中。然而,一些水分子与蛋白质密切相互作用,需要明确处理才能了解它们的作用。由于能量函数不准确,大多数基于物理的计算方法在准确定位蛋白质表面上的水分子的能力方面受到限制。本研究不依赖于能量函数,而是试图从结构数据中了解水分子的位置。GalaxyWater-卷积神经网络 (CNN) 预测蛋白质链上的水位置、蛋白质-蛋白质界面、和蛋白质-化合物结合位点使用 3D-CNN 模型,该模型经过训练可在给定蛋白质结构上生成水分数图。训练数据由与水分子一起解析的高分辨率蛋白质晶体结构编译而成。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。训练数据由与水分子一起解析的高分辨率蛋白质晶体结构编译而成。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。训练数据由与水分子一起解析的高分辨率蛋白质晶体结构编译而成。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。与以前的基于能量的方法相比,GalaxyWater-CNN 在结晶水分子的覆盖范围和预测水位置的准确性方面都显示出改进的水预测性能。该方法在精确预测形成氢键网络的水分子方面表现出卓越的性能。这种水预测方法的 Web 服务和源代码分别可在 https://galaxy.seoklab.org/gwcnn 和 https://github.com/seoklab/GalaxyWater-CNN 免费获得。