当前位置: X-MOL 学术J. Chem. Inf. Model. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Prediction Accuracy of Production ADMET Models as a Function of Version: Activity Cliffs Rule
Journal of Chemical Information and Modeling ( IF 5.6 ) Pub Date : 2022-07-07 , DOI: 10.1021/acs.jcim.2c00699
Robert P Sheridan 1 , J Chris Culberson 1 , Elizabeth Joshi 1 , Matthew Tudor 1 , Prabha Karnachi 1
Affiliation  

As with many other institutions, our company maintains many quantitative structure-activity relationship (QSAR) models of absorption, distribution, metabolism, excretion, and toxicity (ADMET) end points and updates the models regularly. We recently examined version-to-version predictivity for these models over a period of 10 years. In this approach we monitor the goodness of prediction of new molecules relative to the training set of model version V before they are incorporated in the updated model V+1. Using a cell-based permeability assay (Papp) as an example, we illustrate how the QSAR models made from this data are generally predictive and can be utilized to enrich chemical designs and synthesis. Despite the obvious utility of these models, we turned up unexpected behavior in Papp and other ADMET activities for which the explanation is not obvious. One such behavior is that the apparent predictivity of the models as measured by root-mean-square-error can vary greatly from version to version and is sometimes very poor. One intuitively appealing explanation is that the observed activities of the new molecules fall outside the bulk of activities in the training set. Alternatively, one may think that the new molecules are exploring different regions of chemical space than the training set. However, the real explanation has to do with activity cliffs. If the observed activities of the new molecules are different than expected based on similar molecules in the training set, the predictions will be less accurate. This is true for all our ADMET end points.

中文翻译:

作为版本函数的生产 ADMET 模型的预测精度:活动悬崖规则

与许多其他机构一样,我公司维护了许多吸收、分布、代谢、排泄和毒性(ADMET)终点的定量构效关系(QSAR)模型,并定期更新模型。我们最近检查了这些模型在 10 年内的版本间预测性。在这种方法中,我们监控新分子相对于模型版本 V 的训练集的预测优度,然后再将它们合并到更新的模型 V+1 中。以基于细胞的渗透性测定 (Papp) 为例,我们说明了由这些数据制成的 QSAR 模型通常如何具有预测性,并可用于丰富化学设计和合成。尽管这些模型具有明显的效用,我们在 Papp 和其他 ADMET 活动中发现了无法解释的意外行为。一种这样的行为是,由均方根误差测量的模型的表观预测性可能因版本而异,有时甚至非常差。一个直观吸引人的解释是,观察到的新分子的活动超出了训练集中的大部分活动。或者,人们可能认为新分子正在探索与训练集不同的化学空间区域。然而,真正的解释与活动悬崖有关。如果观察到的新分子的活动与基于训练集中类似分子的预期不同,则预测将不太准确。这适用于我们所有的 ADMET 端点。一种这样的行为是,由均方根误差测量的模型的表观预测性可能因版本而异,有时甚至非常差。一个直观吸引人的解释是,观察到的新分子的活动超出了训练集中的大部分活动。或者,人们可能认为新分子正在探索与训练集不同的化学空间区域。然而,真正的解释与活动悬崖有关。如果观察到的新分子的活动与基于训练集中类似分子的预期不同,则预测将不太准确。这适用于我们所有的 ADMET 端点。一种这样的行为是,由均方根误差测量的模型的表观预测性可能因版本而异,有时甚至非常差。一个直观吸引人的解释是,观察到的新分子的活动超出了训练集中的大部分活动。或者,人们可能认为新分子正在探索与训练集不同的化学空间区域。然而,真正的解释与活动悬崖有关。如果观察到的新分子的活动与基于训练集中类似分子的预期不同,则预测将不太准确。这适用于我们所有的 ADMET 端点。一个直观吸引人的解释是,观察到的新分子的活动超出了训练集中的大部分活动。或者,人们可能认为新分子正在探索与训练集不同的化学空间区域。然而,真正的解释与活动悬崖有关。如果观察到的新分子的活动与基于训练集中类似分子的预期不同,则预测将不太准确。这适用于我们所有的 ADMET 端点。一个直观吸引人的解释是,观察到的新分子的活动超出了训练集中的大部分活动。或者,人们可能认为新分子正在探索与训练集不同的化学空间区域。然而,真正的解释与活动悬崖有关。如果观察到的新分子的活动与基于训练集中类似分子的预期不同,则预测将不太准确。这适用于我们所有的 ADMET 端点。真正的解释与活动悬崖有关。如果观察到的新分子的活动与基于训练集中类似分子的预期不同,则预测将不太准确。这适用于我们所有的 ADMET 端点。真正的解释与活动悬崖有关。如果观察到的新分子的活动与基于训练集中类似分子的预期不同,则预测将不太准确。这适用于我们所有的 ADMET 端点。
更新日期:2022-07-07
down
wechat
bug