当前位置: X-MOL 学术Methods › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
The Message Passing Neural Networks for Chemical Property Prediction on SMILES
Methods ( IF 4.2 ) Pub Date : 2020-07-01 , DOI: 10.1016/j.ymeth.2020.05.009
Jeonghee Jo 1 , Bumju Kwak 2 , Hyun-Soo Choi 3 , Sungroh Yoon 4
Affiliation  

Drug metabolism is determined by the biochemical and physiological properties of the drug molecule. To improve the performance of a drug property prediction model, it is important to extract complex molecular dynamics from limited data. Recent machine learning or deep learning based models have employed the atom- and bond-type information, as well as the structural information to predict drug properties. However, many of these methods can be used only for the graph representations. Message passing neural networks (MPNNs) [1] is a framework used to learn both local and global features from irregularly formed data, and is invariant to permutations. This network performs an iterative message passing (MP) operation on each object and its neighbors, and obtain the final output from all messages regardless of their order. In this study, we applied the MP-based attention network [2] originally developed for text learning to perform chemical classification tasks. Before training, we tokenized the characters, and obtained embeddings of each molecular sequence. We conducted various experiments to maximize the predictivity of the model. We trained and evaluated our model using various chemical classification benchmark tasks. Our results are comparable to previous state-of-the-art and baseline models or outperform. To the best of our knowledge, this is the first attempt to learn chemical stringsusing an MP-based algorithm. We will extend our work to more complex tasks such as regression or generation tasks in the future.

中文翻译:

用于 SMILES 化学性质预测的消息传递神经网络

药物代谢由药物分子的生化和生理特性决定。为了提高药物特性预测模型的性能,从有限的数据中提取复杂的分子动力学非常重要。最近的机器学习或基于深度学习的模型已经利用原子和键类型信息以及结构信息来预测药物特性。然而,许多这些方法只能用于图形表示。消息传递神经网络 (MPNN) [1] 是一个框架,用于从不规则形成的数据中学习局部和全局特征,并且对排列保持不变。该网络对每个对象及其邻居执行迭代消息传递 (MP) 操作,并从所有消息中获取最终输出,而不管它们的顺序如何。在这项研究中,我们应用了最初为文本学习开发的基于 MP 的注意力网络 [2] 来执行化学分类任务。在训练之前,我们对字符进行标记,并获得每个分子序列的嵌入。我们进行了各种实验以最大化模型的预测性。我们使用各种化学分类基准任务训练和评估我们的模型。我们的结果可与之前的最先进模型和基线模型相媲美或表现出色。据我们所知,这是使用基于 MP 的算法学习化学字符串的第一次尝试。将来我们会将我们的工作扩展到更复杂的任务,例如回归或生成任务。并获得每个分子序列的嵌入。我们进行了各种实验以最大化模型的预测性。我们使用各种化学分类基准任务训练和评估我们的模型。我们的结果可与之前的最先进模型和基线模型相媲美或表现出色。据我们所知,这是使用基于 MP 的算法学习化学字符串的第一次尝试。将来我们会将我们的工作扩展到更复杂的任务,例如回归或生成任务。并获得每个分子序列的嵌入。我们进行了各种实验以最大化模型的预测性。我们使用各种化学分类基准任务训练和评估我们的模型。我们的结果可与之前的最先进模型和基线模型相媲美或表现出色。据我们所知,这是使用基于 MP 的算法学习化学字符串的第一次尝试。将来我们会将我们的工作扩展到更复杂的任务,例如回归或生成任务。这是使用基于 MP 的算法学习化学字符串的第一次尝试。将来我们会将我们的工作扩展到更复杂的任务,例如回归或生成任务。这是使用基于 MP 的算法学习化学字符串的第一次尝试。将来我们会将我们的工作扩展到更复杂的任务,例如回归或生成任务。
更新日期:2020-07-01
down
wechat
bug