当前位置: X-MOL 学术J. Comput. Aid. Mol. Des. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Evaluation of multi-target deep neural network models for compound potency prediction under increasingly challenging test conditions
Journal of Computer-Aided Molecular Design ( IF 3.0 ) Pub Date : 2021-02-17 , DOI: 10.1007/s10822-021-00376-8
Raquel Rodríguez-Pérez 1, 2 , Jürgen Bajorath 1
Affiliation  

Machine learning (ML) enables modeling of quantitative structure–activity relationships (QSAR) and compound potency predictions. Recently, multi-target QSAR models have been gaining increasing attention. Simultaneous compound potency predictions for multiple targets can be carried out using ensembles of independently derived target-based QSAR models or in a more integrated and advanced manner using multi-target deep neural networks (MT-DNNs). Herein, single-target and multi-target ML models were systematically compared on a large scale in compound potency value predictions for 270 human targets. By design, this large-magnitude evaluation has been a special feature of our study. To these ends, MT-DNN, single-target DNN (ST-DNN), support vector regression (SVR), and random forest regression (RFR) models were implemented. Different test systems were defined to benchmark these ML methods under conditions of varying complexity. Source compounds were divided into training and test sets in a compound- or analog series-based manner taking target information into account. Data partitioning approaches used for model training and evaluation were shown to influence the relative performance of ML methods, especially for the most challenging compound data sets. For example, the performance of MT-DNNs with per-target models yielded superior performance compared to single-target models. For a test compound or its analogs, the availability of potency measurements for multiple targets affected model performance, revealing the influence of ML synergies.



中文翻译:

在越来越具有挑战性的测试条件下评估多目标深度神经网络模型的复合效力预测

机器学习 (ML) 能够对定量结构-活性关系 (QSAR) 和复合效力预测进行建模。最近,多目标 QSAR 模型越来越受到关注。可以使用独立派生的基于目标的 QSAR 模型的集合或使用多目标深度神经网络 (MT-DNN) 以更集成和更先进的方式对多个目标进行同时复合效力预测。在此,对 270 个人类目标的复合效力值预测中的单目标和多目标 ML 模型进行了大规模系统比较。根据设计,这种大规模评估一直是我们研究的一个特点。为此,实施了 MT-DNN、单目标 DNN (ST-DNN)、支持向量回归 (SVR) 和随机森林回归 (RFR) 模型。定义了不同的测试系统,以在不同复杂性的条件下对这些 ML 方法进行基准测试。考虑到目标信息,源化合物以基于化合物或模拟系列的方式分为训练集和测试集。用于模型训练和评估的数据分区方法会影响 ML 方法的相对性能,尤其是对于最具挑战性的复合数据集。例如,与单目标模型相比,具有每个目标模型的 MT-DNN 的性能产生了卓越的性能。对于测试化合物或其类似物,多个目标的效力测量的可用性影响模型性能,揭示了 ML 协同作用的影响。考虑到目标信息,源化合物以基于化合物或模拟系列的方式分为训练集和测试集。用于模型训练和评估的数据分区方法会影响 ML 方法的相对性能,尤其是对于最具挑战性的复合数据集。例如,与单目标模型相比,具有每个目标模型的 MT-DNN 的性能产生了卓越的性能。对于测试化合物或其类似物,多个目标的效力测量的可用性影响模型性能,揭示了 ML 协同作用的影响。考虑到目标信息,源化合物以基于化合物或模拟系列的方式分为训练集和测试集。用于模型训练和评估的数据分区方法会影响 ML 方法的相对性能,尤其是对于最具挑战性的复合数据集。例如,与单目标模型相比,具有每个目标模型的 MT-DNN 的性能产生了卓越的性能。对于测试化合物或其类似物,多个目标的效力测量的可用性影响模型性能,揭示了 ML 协同作用的影响。特别是对于最具挑战性的化合物数据集。例如,与单目标模型相比,具有每个目标模型的 MT-DNN 的性能产生了卓越的性能。对于测试化合物或其类似物,多个目标的效力测量的可用性影响模型性能,揭示了 ML 协同作用的影响。特别是对于最具挑战性的化合物数据集。例如,与单目标模型相比,具有每个目标模型的 MT-DNN 的性能产生了卓越的性能。对于测试化合物或其类似物,多个目标的效力测量的可用性影响模型性能,揭示了 ML 协同作用的影响。

更新日期:2021-02-18
down
wechat
bug