当前位置: X-MOL 学术Sci. Program. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Sparse Feature Extraction Method with Elastic Net for Drug-Target Interaction Identification
Scientific Programming Pub Date : 2021-02-24 , DOI: 10.1155/2021/6686409
Zheng-Yang Zhao 1 , Wen-Zhun Huang 1 , Jie Pan 1 , Yu-An Huang 1 , Shan-Wen Zhang 1 , Chang-Qing Yu 1
Affiliation  

The identification of drug-target interactions (DTIs) plays a crucial role in drug discovery. However, the traditional high-throughput techniques based on clinical trials are costly, cumbersome, and time-consuming for identifying DTIs. Hence, new intelligent computational methods are urgently needed to surmount these defects in predicting DTIs. In this paper, we propose a novel computational method that combines position-specific scoring matrix (PSSM), elastic net based sparse features extraction, and rotation forest (RF) classifier. Specifically, we converted each protein primary sequence into PSSM, which contains biological evolutionary information. Then we extract the hidden sparse feature descriptors in PSSM by elastic net based sparse feature extraction method (ESFE). After that, we fuse them with the features of drug, which are represented by molecular fingerprints. Finally, rotation forest classifier works on detecting the potential drug-target interactions. When performing the proposed method by the experiments of fivefold cross validation (CV) on enzyme, ion channel, G protein-coupled receptors (GPCRs), and nuclear receptor datasets, this method achieves average accuracies of 90.32%, 88.91%, 80.65%, and 79.73%, respectively. We also compared the proposed model with the state-of-the-art support vector machine (SVM) classifier and other effective methods on the same datasets. The comparison results distinctly indicate that the proposed model possesses the efficient and robust ability to predict DTIs. We expect that the new model will be able to take effects on predicting massive DTIs.

中文翻译:

弹性网络的稀疏特征提取方法用于药物-靶标相互作用识别

药物-靶标相互作用(DTI)的鉴定在药物发现中起着至关重要的作用。但是,基于临床试验的传统高通量技术鉴定DTI既昂贵,麻烦又费时。因此,迫切需要新的智能计算方法来克服这些缺陷以预测DTI。在本文中,我们提出了一种新颖的计算方法,该方法结合了特定位置评分矩阵(PSSM),基于弹性网的稀疏特征提取和旋转森林(RF)分类器。具体来说,我们将每个蛋白质一级序列转换为PSSM,其中包含生物学进化信息。然后,通过基于弹性网的稀疏特征提取方法(ESFE),提取PSSM中隐藏的稀疏特征描述符。之后,我们将它们与毒品的特征融合在一起,用分子指纹表示。最后,轮作林分类器致力于检测潜在的药物-靶标相互作用。通过对酶,离子通道,G蛋白偶联受体(GPCR)和核受体数据集进行五重交叉验证(CV)实验来执行该方法时,该方法的平均准确度为90.32%,88.91%,80.65%,和79.73%。我们还将提议的模型与最新的支持向量机(SVM)分类器和其他有效方法进行了比较。比较结果清楚地表明,所提出的模型具有预测DTI的有效和鲁棒能力。我们希望新模型将能够对大型DTI的预测产生影响。轮作森林分类器致力于检测潜在的药物-靶标相互作用。通过对酶,离子通道,G蛋白偶联受体(GPCR)和核受体数据集进行五重交叉验证(CV)实验来执行该方法时,该方法的平均准确度为90.32%,88.91%,80.65%,和79.73%。我们还将提议的模型与最新的支持向量机(SVM)分类器和其他有效方法进行了比较。比较结果清楚地表明,所提出的模型具有预测DTI的有效和鲁棒能力。我们希望新模型将能够对大型DTI的预测产生影响。轮作森林分类器致力于检测潜在的药物-靶标相互作用。通过对酶,离子通道,G蛋白偶联受体(GPCR)和核受体数据集进行五重交叉验证(CV)实验来执行该方法时,该方法的平均准确度为90.32%,88.91%,80.65%,和79.73%。我们还将提议的模型与最新的支持向量机(SVM)分类器和其他有效方法进行了比较。比较结果清楚地表明,所提出的模型具有预测DTI的有效和鲁棒能力。我们希望新模型将能够对大型DTI的预测产生影响。通过对酶,离子通道,G蛋白偶联受体(GPCR)和核受体数据集进行五重交叉验证(CV)实验来执行该方法时,该方法的平均准确度为90.32%,88.91%,80.65%,和79.73%。我们还将提议的模型与最新的支持向量机(SVM)分类器和其他有效方法进行了比较。比较结果清楚地表明,所提出的模型具有预测DTI的有效和鲁棒能力。我们希望新模型将能够对大型DTI的预测产生影响。通过对酶,离子通道,G蛋白偶联受体(GPCR)和核受体数据集进行五重交叉验证(CV)实验来执行该方法时,该方法的平均准确度为90.32%,88.91%,80.65%,和79.73%。我们还将提议的模型与最新的支持向量机(SVM)分类器和其他有效方法进行了比较。比较结果清楚地表明,所提出的模型具有预测DTI的有效和鲁棒能力。我们希望新模型将能够对大型DTI的预测产生影响。我们还将提议的模型与最新的支持向量机(SVM)分类器和其他有效方法进行了比较。比较结果清楚地表明,所提出的模型具有预测DTI的有效和鲁棒能力。我们希望新模型将能够对大型DTI的预测产生影响。我们还将提议的模型与最新的支持向量机(SVM)分类器和其他有效方法进行了比较。比较结果清楚地表明,所提出的模型具有预测DTI的有效和鲁棒能力。我们希望新模型将能够对大型DTI的预测产生影响。
更新日期:2021-02-24
down
wechat
bug