当前位置: X-MOL 学术J. Cheminfom. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Deep learning-driven prediction of drug mechanism of action from large-scale chemical-genetic interaction profiles
Journal of Cheminformatics ( IF 7.1 ) Pub Date : 2022-03-12 , DOI: 10.1186/s13321-022-00596-6
Chengyou Liu 1 , Andrew M Hogan 2 , Hunter Sturm 3 , Mohd Wasif Khan 4 , Md Mohaiminul Islam 5 , A S M Zisanur Rahman 2 , Rebecca Davis 3 , Silvia T Cardona 2, 6 , Pingzhao Hu 1, 5, 7
Affiliation  

Chemical–genetic interaction profiling is a genetic approach that quantifies the susceptibility of a set of mutants depleted in specific gene product(s) to a set of chemical compounds. With the recent advances in artificial intelligence, chemical–genetic interaction profiles (CGIPs) can be leveraged to predict mechanism of action of compounds. This can be achieved by using machine learning, where the data from a CGIP is fed into the machine learning platform along with the chemical descriptors to develop a chemogenetically trained model. As small molecules can be considered non-structural data, graph convolutional neural networks, which can learn from the chemical structures directly, can be used to successfully predict molecular properties. Clustering analysis, on the other hand, is a critical approach to get insights into the underlying biological relationships between the gene products in the high-dimensional chemical-genetic data. In this study, we proposed a comprehensive framework based on the large-scale chemical-genetics dataset built in Mycobacterium tuberculosis for predicting CGIPs using graph-based deep learning models. Our approach is structured into three parts. First, by matching M. tuberculosis genes with homologous genes in Escherichia coli (E. coli) according to their gene products, we grouped the genes into clusters with distinct biological functions. Second, we employed a directed message passing neural network to predict growth inhibition against M. tuberculosis gene clusters using a collection of 50,000 chemicals with the profile. We compared the performance of different baseline models and implemented multi-label tasks in binary classification frameworks. Lastly, we applied the trained model to an externally curated drug set that had experimental results against M. tuberculosis genes to examine the effectiveness of our method. Overall, we demonstrate that our approach effectively created M. tuberculosis gene clusters, and the trained classifier is able to predict activity against essential M. tuberculosis targets with high accuracy. This work provides an analytical framework for modeling large-scale chemical-genetic datasets for predicting CGIPs and generating hypothesis about mechanism of action of novel drugs. In addition, this work highlights the importance of graph-based deep neural networks in drug discovery.

中文翻译:

从大规模化学-遗传相互作用谱中深度学习驱动的药物作用机制预测

化学-遗传相互作用分析是一种遗传方法,可量化一组特定基因产物耗尽的突变体对一组化合物的敏感性。随着人工智能的最新进展,可以利用化学-遗传相互作用谱(CGIP)来预测化合物的作用机制。这可以通过使用机器学习来实现,其中来自 CGIP 的数据与化学描述符一起被输入机器学习平台,以开发经过化学遗传学训练的模型。由于小分子可以被视为非结构数据,因此可以直接从化学结构中学习的图卷积神经网络可用于成功预测分子性质。另一方面,聚类分析,是深入了解高维化学遗传数据中基因产物之间潜在生物学关系的关键方法。在这项研究中,我们提出了一个基于结核分枝杆菌中构建的大规模化学遗传学数据集的综合框架,用于使用基于图的深度学习模型预测 CGIP。我们的方法分为三个部分。首先,通过根据基因产物将结核分枝杆菌基因与大肠杆菌(E.coli)中的同源基因进行匹配,我们将基因分组为具有不同生物学功能的簇。其次,我们使用定向消息传递神经网络来预测对结核分枝杆菌基因簇的生长抑制,使用具有特征的 50,000 种化学物质的集合。我们比较了不同基线模型的性能,并在二进制分类框架中实现了多标签任务。最后,我们将经过训练的模型应用于具有针对结核分枝杆菌基因的实验结果的外部策划药物组,以检查我们方法的有效性。总体而言,我们证明我们的方法有效地创建了结核分枝杆菌基因簇,并且经过训练的分类器能够以高精度预测针对基本结核分枝杆菌靶标的活动。这项工作提供了一个分析框架,用于对大规模化学遗传数据集进行建模,以预测 CGIP 并产生关于新药作用机制的假设。此外,这项工作强调了基于图的深度神经网络在药物发现中的重要性。最后,我们将经过训练的模型应用于具有针对结核分枝杆菌基因的实验结果的外部策划药物组,以检查我们方法的有效性。总体而言,我们证明我们的方法有效地创建了结核分枝杆菌基因簇,并且经过训练的分类器能够以高精度预测针对基本结核分枝杆菌靶标的活动。这项工作提供了一个分析框架,用于对大规模化学遗传数据集进行建模,以预测 CGIP 并产生关于新药作用机制的假设。此外,这项工作强调了基于图的深度神经网络在药物发现中的重要性。最后,我们将经过训练的模型应用于具有针对结核分枝杆菌基因的实验结果的外部策划药物组,以检查我们方法的有效性。总体而言,我们证明我们的方法有效地创建了结核分枝杆菌基因簇,并且经过训练的分类器能够以高精度预测针对基本结核分枝杆菌靶标的活动。这项工作提供了一个分析框架,用于对大规模化学遗传数据集进行建模,以预测 CGIP 并产生关于新药作用机制的假设。此外,这项工作强调了基于图的深度神经网络在药物发现中的重要性。我们证明我们的方法有效地创建了结核分枝杆菌基因簇,并且经过训练的分类器能够以高精度预测针对基本结核分枝杆菌靶标的活动。这项工作提供了一个分析框架,用于对大规模化学遗传数据集进行建模,以预测 CGIP 并产生关于新药作用机制的假设。此外,这项工作强调了基于图的深度神经网络在药物发现中的重要性。我们证明我们的方法有效地创建了结核分枝杆菌基因簇,并且经过训练的分类器能够以高精度预测针对基本结核分枝杆菌靶标的活动。这项工作提供了一个分析框架,用于对大规模化学遗传数据集进行建模,以预测 CGIP 并产生关于新药作用机制的假设。此外,这项工作强调了基于图的深度神经网络在药物发现中的重要性。这项工作提供了一个分析框架,用于对大规模化学遗传数据集进行建模,以预测 CGIP 并产生关于新药作用机制的假设。此外,这项工作强调了基于图的深度神经网络在药物发现中的重要性。这项工作提供了一个分析框架,用于对大规模化学遗传数据集进行建模,以预测 CGIP 并产生关于新药作用机制的假设。此外,这项工作强调了基于图的深度神经网络在药物发现中的重要性。
更新日期:2022-03-12
down
wechat
bug