当前位置: X-MOL 学术Toxicol. Lett. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Prediction of hERG potassium channel blockage using ensemble learning methods and molecular fingerprints
Toxicology Letters ( IF 3.5 ) Pub Date : 2020-10-01 , DOI: 10.1016/j.toxlet.2020.07.003
Miao Liu 1 , Li Zhang 2 , Shimeng Li 1 , Tianzhou Yang 1 , Lili Liu 1 , Jian Zhao 1 , Hongsheng Liu 2
Affiliation  

The human ether-a-go-go-related gene (hERG) encodes a tetrameric potassium channel called Kv11.1. This channel can be blocked by certain drugs, which leads to long QT syndrome, causing cardiotoxicity. This is a significant problem during drug development. Using computer models to predict compound cardiotoxicity during the early stages of drug design will help to solve this problem. In this study, we used a dataset of 1,865 compounds exhibiting known hERG inhibitory activities as a training set. Thirty cardiotoxicity classification models were established using three machine learning algorithms based on molecular fingerprints and molecular descriptors. Through using these models as the base classifier, a new cardiotoxicity classification model with better predictive performance was developed using ensemble learning method. The accuracy of the best base classifier, which was generated using the XGBoost method with molecular descriptors, was 84.8%, and the area under the receiver-operating characteristic curve (AUC) was 0.876 in the five fold cross-validation. However, all of the ensemble models that we developed had higher predictive performance than the base classifiers in the five fold cross-validation. The best predictive performance was achieved by the Ensemble-Top7 model, with accuracy of 84.9% and AUC of 0.887. We also tested the ensemble model using external validation data and achieved accuracy of 85.0% and AUC of 0.786. Furthermore, we identified several hERG-related substructures, which provide valuable information for designing drug candidates.

中文翻译:

使用集成学习方法和分子指纹预测 hERG 钾通道阻塞

人类 ether-a-go-go 相关基因 (hERG) 编码一种称为 Kv11.1 的四聚体钾通道。该通道可被某些药物阻断,导致长QT综合征,引起心脏毒性。这是药物开发过程中的一个重要问题。在药物设计的早期阶段使用计算机模型预测复合心脏毒性将有助于解决这个问题。在这项研究中,我们使用了 1,865 种具有已知 hERG 抑制活性的化合物作为训练集。使用基于分子指纹和分子描述符的三种机器学习算法建立了 30 种心脏毒性分类模型。通过使用这些模型作为基础分类器,使用集成学习方法开发了具有更好预测性能的新的心脏毒性分类模型。使用具有分子描述符的 XGBoost 方法生成的最佳基分类器的准确率为 84.8%,五折交叉验证中的受试者工作特征曲线 (AUC) 下面积为 0.876。然而,在五折交叉验证中,我们开发的所有集成模型都比基本分类器具有更高的预测性能。最好的预测性能是由 Ensemble-Top7 模型实现的,准确率为 84.9%,AUC 为 0.887。我们还使用外部验证数据测试了集成模型,并实现了 85.0% 的准确度和 0.786 的 AUC。此外,我们确定了几个与 hERG 相关的子结构,它们为设计候选药物提供了有价值的信息。在五折交叉验证中,受试者工作特征曲线(AUC)下面积为 0.876。然而,在五折交叉验证中,我们开发的所有集成模型都比基本分类器具有更高的预测性能。最好的预测性能是由 Ensemble-Top7 模型实现的,准确率为 84.9%,AUC 为 0.887。我们还使用外部验证数据测试了集成模型,并实现了 85.0% 的准确度和 0.786 的 AUC。此外,我们确定了几个与 hERG 相关的子结构,它们为设计候选药物提供了有价值的信息。在五折交叉验证中,受试者工作特征曲线(AUC)下面积为 0.876。然而,在五折交叉验证中,我们开发的所有集成模型都比基本分类器具有更高的预测性能。最好的预测性能是由 Ensemble-Top7 模型实现的,准确率为 84.9%,AUC 为 0.887。我们还使用外部验证数据测试了集成模型,并实现了 85.0% 的准确度和 0.786 的 AUC。此外,我们确定了几个与 hERG 相关的子结构,它们为设计候选药物提供了有价值的信息。在五折交叉验证中,我们开发的所有集成模型都比基本分类器具有更高的预测性能。最好的预测性能是由 Ensemble-Top7 模型实现的,准确率为 84.9%,AUC 为 0.887。我们还使用外部验证数据测试了集成模型,并实现了 85.0% 的准确度和 0.786 的 AUC。此外,我们确定了几个与 hERG 相关的子结构,它们为设计候选药物提供了有价值的信息。在五折交叉验证中,我们开发的所有集成模型都比基本分类器具有更高的预测性能。最好的预测性能是由 Ensemble-Top7 模型实现的,准确率为 84.9%,AUC 为 0.887。我们还使用外部验证数据测试了集成模型,并实现了 85.0% 的准确度和 0.786 的 AUC。此外,我们确定了几个与 hERG 相关的子结构,它们为设计候选药物提供了有价值的信息。
更新日期:2020-10-01
down
wechat
bug