当前位置: X-MOL 学术Mol. Divers. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
EGFRisopred: a machine learning-based classification model for identifying isoform-specific inhibitors against EGFR and HER2
Molecular Diversity ( IF 3.9 ) Pub Date : 2021-08-03 , DOI: 10.1007/s11030-021-10284-6
Ravi Saini 1 , Subhash Mohan Agarwal 2
Affiliation  

The EGFR kinase pathway is one of the most frequently activated signaling pathways in human cancers. EGFR and HER2 are the two significant members of this pathway, which are attractive drug targets of clinical relevance in lung and breast cancer. Therefore, identifying EGFR- and HER2-specific inhibitors is one of the important challenges in cancer drug discovery. To address this issue, a dataset of 519 compounds having inhibitory activity against both the isoforms, i.e., EGFR and HER2, was collected from the literature and developed a knowledge-based computational classification model for predicting the specificity of a molecule for an isoform (EGFR/HER2) with precision. A total of seventy-two classification models using nine fingerprint types, four classifiers (IBK, NB, SMO and RF) and two different datasets (EGFR and HER2 isoform specific) were developed. It was observed that the models developed using random forest and IBK performed better for EGFR- and HER2-specific datasets, respectively. Scaffold and functional group analysis led to the identification of prevalent core and fragments in each of the datasets. The accuracy of the selected best performing models was also evaluated using the decoy dataset. We have also developed an application EGFRisopred, which integrates the best performing models and permits the user to predict the specificity of a compound as an EGFR-/HER2-specific anticancer agent. It is expected that the tool’s availability as a free utility will allow researchers to identify new inhibitors against these targets important in cancer.

Graphic abstract



中文翻译:

EGFRisopred:一种基于机器学习的分类模型,用于识别针对 EGFR 和 HER2 的亚型特异性抑制剂

EGFR激酶通路是人类癌症中最常被激活的信号通路之一。EGFR 和 HER2 是该途径的两个重要成员,它们是肺癌和乳腺癌临床相关的有吸引力的药物靶点。因此,鉴定 EGFR 和 HER2 特异性抑制剂是癌症药物发现的重要挑战之一。为了解决这个问题,从文献中收集了 519 种对同种型(即 EGFR 和 HER2)具有抑制活性的化合物的数据集,并开发了一个基于知识的计算分类模型,用于预测分子对同种型(EGFR)的特异性。 /HER2) 精确。共有七十二个分类模型,使用九种指纹类型、四种分类器(IBK、NB、开发了 SMO 和 RF)和两个不同的数据集(EGFR 和 HER2 异构体特异性)。据观察,使用随机森林和 IBK 开发的模型分别对 EGFR 和 HER2 特异性数据集表现更好。支架和功能组分析导致在每个数据集中识别普遍的核心和片段。还使用诱饵数据集评估了所选性能最佳模型的准确性。我们还开发了一种应用 EGFRisopred,它集成了性能最佳的模型,并允许用户预测化合物作为 EGFR-/HER2 特异性抗癌剂的特异性。预计该工具作为免费实用程序的可用性将使研究人员能够识别针对这些在癌症中很重要的靶标的新抑制剂。据观察,使用随机森林和 IBK 开发的模型分别对 EGFR 和 HER2 特异性数据集表现更好。支架和功能组分析导致在每个数据集中识别普遍的核心和片段。还使用诱饵数据集评估了所选性能最佳模型的准确性。我们还开发了一种应用 EGFRisopred,它集成了性能最佳的模型,并允许用户预测化合物作为 EGFR-/HER2 特异性抗癌剂的特异性。预计该工具作为免费实用程序的可用性将使研究人员能够识别针对这些在癌症中很重要的靶标的新抑制剂。据观察,使用随机森林和 IBK 开发的模型分别对 EGFR 和 HER2 特异性数据集表现更好。支架和功能组分析导致在每个数据集中识别普遍的核心和片段。还使用诱饵数据集评估了所选性能最佳模型的准确性。我们还开发了一种应用 EGFRisopred,它集成了性能最佳的模型,并允许用户预测化合物作为 EGFR-/HER2 特异性抗癌剂的特异性。预计该工具作为免费实用程序的可用性将使研究人员能够识别针对这些在癌症中很重要的靶标的新抑制剂。支架和功能组分析导致在每个数据集中识别普遍的核心和片段。还使用诱饵数据集评估了所选性能最佳模型的准确性。我们还开发了一种应用 EGFRisopred,它集成了性能最佳的模型,并允许用户预测化合物作为 EGFR-/HER2 特异性抗癌剂的特异性。预计该工具作为免费实用程序的可用性将使研究人员能够识别针对这些在癌症中很重要的靶标的新抑制剂。支架和功能组分析导致在每个数据集中识别普遍的核心和片段。还使用诱饵数据集评估了所选性能最佳模型的准确性。我们还开发了一种应用 EGFRisopred,它集成了性能最佳的模型,并允许用户预测化合物作为 EGFR-/HER2 特异性抗癌剂的特异性。预计该工具作为免费实用程序的可用性将使研究人员能够识别针对这些在癌症中很重要的靶标的新抑制剂。它集成了性能最佳的模型,并允许用户预测化合物作为 EGFR-/HER2 特异性抗癌剂的特异性。预计该工具作为免费实用程序的可用性将使研究人员能够识别针对这些在癌症中很重要的靶标的新抑制剂。它集成了性能最佳的模型,并允许用户预测化合物作为 EGFR-/HER2 特异性抗癌剂的特异性。预计该工具作为免费实用程序的可用性将使研究人员能够识别针对这些在癌症中很重要的靶标的新抑制剂。

图形摘要

更新日期:2021-08-03
down
wechat
bug