当前位置: X-MOL 学术Chemometr. Intell. Lab. Systems › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A novel strategy for prediction of human plasma protein binding using machine learning techniques
Chemometrics and Intelligent Laboratory Systems ( IF 3.7 ) Pub Date : 2020-04-01 , DOI: 10.1016/j.chemolab.2020.103962
Yawen Yuan , Shuo Chang , Zheng Zhang , Zhigang Li , Size Li , Peng Xie , Wai-Ping Yau , Haishu Lin , Weimin Cai , Yanchun Zhang , Xiaoqiang Xiang

Abstract Plasma protein binding (PPB) is a key player of drug ADME (absorption, distribution, metabolism, elimination) behaviors, enabling PPB to have significant impact on drug efficacy and toxicity. As drug discovery enters the era of rational drug design, it is desirable to use in silico model to predict PPB so as to achieve rapid initial screening for potential candidate compounds prior to further time-consuming and costly in vitro and in vivo experimental assay. In this study, a global quantitative structure-activity relationship (QSAR) model of PPB was built on the basis of a large training set comprising more than 5000 compounds to represent large structural diversity. The uneven distribution of PPB was often rectified by two mathematical transformations of PPB but this led to a decrease in prediction accuracy at the lower binding level. To resolve this problem, we proposed a novel strategy to build models for different binding levels. The best model yielded much lower mean absolute error (MAE) of 0.076 on the test set than published models and the MAE was further reduced to 0.041 ​at the high level of binding (0.8–1). The models also performed excellent in the validation set containing some compounds from traditional Chinese medicine. In addition, the applicability domain was determined to identify new compounds which are appropriate for prediction using our built models. In conclusion, this study developed a novel strategy to construct robust QSAR model for PPB prediction which could be used by chemists to predict the PPB of candidate compounds efficiently and make structural modification in the early stage of drug development.

中文翻译:

一种使用机器学习技术预测人血浆蛋白结合的新策略

摘要 血浆蛋白结合(PPB)是药物ADME(吸收、分布、代谢、消除)行为的关键参与者,使PPB对药物疗效和毒性产生显着影响。随着药物发现进入合理药物设计时代,需要使用计算机模型来预测 PPB,以便在进一步耗时且昂贵的体外和体内实验测定之前快速初步筛选潜在的候选化合物。在本研究中,基于包含 5000 多种化合物的大型训练集构建了 PPB 的全局定量构效关系 (QSAR) 模型,以表示大量的结构多样性。PPB 的不均匀分布通常通过 PPB 的两个数学变换来纠正,但这导致较低结合水平的预测准确性下降。为了解决这个问题,我们提出了一种新的策略来为不同的绑定级别构建模型。与已发布的模型相比,最佳模型在测试集上产生的平均绝对误差 (MAE) 低得多,为 0.076,并且在高结合水平 (0.8-1) 下,MAE 进一步降低至 0.041。这些模型在包​​含一些中药化合物的验证集中也表现出色。此外,确定适用性域以识别适合使用我们构建的模型进行预测的新化合物。总之,本研究开发了一种新的策略来构建用于 PPB 预测的稳健 QSAR 模型,化学家可以使用该策略有效地预测候选化合物的 PPB,并在药物开发的早期阶段进行结构修改。我们提出了一种新的策略来为不同的绑定级别构建模型。与已发布的模型相比,最佳模型在测试集上产生的平均绝对误差 (MAE) 低得多,为 0.076,并且在高结合水平 (0.8-1) 下,MAE 进一步降低至 0.041。这些模型在包​​含一些中药化合物的验证集中也表现出色。此外,确定适用性域以识别适合使用我们构建的模型进行预测的新化合物。总之,本研究开发了一种新的策略来构建用于 PPB 预测的稳健 QSAR 模型,化学家可以使用该策略有效地预测候选化合物的 PPB,并在药物开发的早期阶段进行结构修改。我们提出了一种新的策略来为不同的绑定级别构建模型。与已发布的模型相比,最佳模型在测试集上产生的平均绝对误差 (MAE) 低得多,为 0.076,并且在高结合水平 (0.8-1) 下,MAE 进一步降低至 0.041。这些模型在包​​含一些中药化合物的验证集中也表现出色。此外,确定适用性域以识别适合使用我们构建的模型进行预测的新化合物。总之,本研究开发了一种新的策略来构建用于 PPB 预测的稳健 QSAR 模型,化学家可以使用该策略有效地预测候选化合物的 PPB,并在药物开发的早期阶段进行结构修改。与已发布的模型相比,最佳模型在测试集上产生的平均绝对误差 (MAE) 低得多,为 0.076,并且在高结合水平 (0.8-1) 下,MAE 进一步降低至 0.041。这些模型在包​​含一些中药化合物的验证集中也表现出色。此外,确定适用性域以识别适合使用我们构建的模型进行预测的新化合物。总之,本研究开发了一种新的策略来构建用于 PPB 预测的稳健 QSAR 模型,化学家可以使用该策略有效地预测候选化合物的 PPB,并在药物开发的早期阶段进行结构修改。与已发布的模型相比,最佳模型在测试集上产生的平均绝对误差 (MAE) 低得多,为 0.076,并且在高结合水平 (0.8-1) 下,MAE 进一步降低至 0.041。这些模型在包​​含一些中药化合物的验证集中也表现出色。此外,确定适用性域以识别适合使用我们构建的模型进行预测的新化合物。总之,本研究开发了一种新的策略来构建用于 PPB 预测的稳健 QSAR 模型,化学家可以使用该策略有效地预测候选化合物的 PPB,并在药物开发的早期阶段进行结构修改。8-1)。这些模型在包​​含一些中药化合物的验证集中也表现出色。此外,确定适用性域以识别适合使用我们构建的模型进行预测的新化合物。总之,本研究开发了一种新的策略来构建用于 PPB 预测的稳健 QSAR 模型,化学家可以使用该策略有效地预测候选化合物的 PPB,并在药物开发的早期阶段进行结构修改。8-1)。这些模型在包​​含一些中药化合物的验证集中也表现出色。此外,确定适用性域以识别适合使用我们构建的模型进行预测的新化合物。总之,本研究开发了一种新的策略来构建用于 PPB 预测的稳健 QSAR 模型,化学家可以使用该策略有效地预测候选化合物的 PPB,并在药物开发的早期阶段进行结构修改。
更新日期:2020-04-01
down
wechat
bug