当前位置: X-MOL 学术arXiv.cs.CE › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A novel method for inference of chemical compounds with prescribed topological substructures based on integer programming
arXiv - CS - Computational Engineering, Finance, and Science Pub Date : 2020-09-29 , DOI: arxiv-2010.09203
Tatsuya Akutsu, Hiroshi Nagamochi

Analysis of chemical graphs is becoming a major research topic in computational molecular biology due to its potential applications to drug design. One of the major approaches in such a study is inverse quantitative structure activity/property relationships (inverse QSAR/QSPR) analysis, which is to infer chemical structures from given chemical activities/properties. Recently, a novel framework has been proposed for inverse QSAR/QSPR using both artificial neural networks (ANN) and mixed integer linear programming (MILP). This method consists of a prediction phase and an inverse prediction phase. In the first phase, a feature vector $f(G)$ of a chemical graph $G$ is introduced and a prediction function $\psi_{\mathcal{N}}$ on a chemical property $\pi$ is constructed with an ANN $\mathcal{N}$. In the second phase, given a target value $y^*$ of the chemical property $\pi$, a feature vector $x^*$ is inferred by solving an MILP formulated from the trained ANN $\mathcal{N}$ so that $\psi_{\mathcal{N}}(x^*)$ is equal to $y^*$ and then a set of chemical structures $G^*$ such that $f(G^*)= x^*$ is enumerated by a graph enumeration algorithm. The framework has been applied to chemical compounds with a rather abstract topological structure such as acyclic or monocyclic graphs and graphs with a specified polymer topology with cycle index up to 2. In this paper, we propose a new flexible modeling method to the framework so that we can specify a topological substructure of graphs and a partial assignment of chemical elements and bond-multiplicity to a target graph.

中文翻译:

一种基于整数规划的具有指定拓扑子结构的化合物推断新方法

由于其在药物设计中的潜在应用,化学图分析正成为计算分子生物学的主要研究课题。这种研究的主要方法之一是逆定量结构活性/性质关系(逆 QSAR/QSPR)分析,即从给定的化学活性/性质推断化学结构。最近,使用人工神经网络 (ANN) 和混合整数线性规划 (MILP) 提出了一种用于逆 QSAR/QSPR 的新框架。该方法由预测阶段和逆预测阶段组成。在第一阶段,引入化学图 $G$ 的特征向量 $f(G)$,并使用化学性质 $\pi$ 构造预测函数 $\psi_{\mathcal{N}}$ ANN $\mathcal{N}$。在第二阶段,给定化学性质 $\pi$ 的目标值 $y^*$,特征向量 $x^*$ 是通过求解从训练的 ANN $\mathcal{N}$ 制定的 MILP 来推断的,因此 $\psi_{ \mathcal{N}}(x^*)$ 等于 $y^*$ 然后是一组化学结构 $G^*$ 使得 $f(G^*)= x^*$ 被枚举为图枚举算法。该框架已应用于具有相当抽象拓扑结构的化合物,例如无环图或单环图以及具有指定聚合物拓扑且循环指数高达 2 的图。在本文中,我们为该框架提出了一种新的灵活建模方法,以便我们可以指定图的拓扑子结构以及化学元素和键多重性的部分分配给目标图。特征向量 $x^*$ 是通过求解从训练的 ANN $\mathcal{N}$ 制定的 MILP 来推断的,因此 $\psi_{\mathcal{N}}(x^*)$ 等于 $y^ *$ 然后是一组化学结构 $G^*$ 使得 $f(G^*)= x^*$ 由图枚举算法枚举。该框架已应用于具有相当抽象拓扑结构的化合物,例如无环图或单环图以及具有指定聚合物拓扑且循环指数高达 2 的图。在本文中,我们为该框架提出了一种新的灵活建模方法,以便我们可以指定图的拓扑子结构以及化学元素和键多重性的部分分配给目标图。特征向量 $x^*$ 是通过求解从训练的 ANN $\mathcal{N}$ 制定的 MILP 来推断的,因此 $\psi_{\mathcal{N}}(x^*)$ 等于 $y^ *$ 然后是一组化学结构 $G^*$ 使得 $f(G^*)= x^*$ 由图枚举算法枚举。该框架已应用于具有相当抽象拓扑结构的化合物,例如无环图或单环图以及具有指定聚合物拓扑且循环指数高达 2 的图。在本文中,我们为该框架提出了一种新的灵活建模方法,以便我们可以指定图的拓扑子结构以及化学元素和键多重性的部分分配给目标图。
更新日期:2020-11-19
down
wechat
bug