当前位置:
X-MOL 学术
›
arXiv.cs.LG
›
论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
ChemoVerse: Manifold traversal of latent spaces for novel molecule discovery
arXiv - CS - Machine Learning Pub Date : 2020-09-29 , DOI: arxiv-2009.13946 Harshdeep Singh, Nicholas McCarthy, Qurrat Ul Ain, Jeremiah Hayes
arXiv - CS - Machine Learning Pub Date : 2020-09-29 , DOI: arxiv-2009.13946 Harshdeep Singh, Nicholas McCarthy, Qurrat Ul Ain, Jeremiah Hayes
In order to design a more potent and effective chemical entity, it is
essential to identify molecular structures with the desired chemical
properties. Recent advances in generative models using neural networks and
machine learning are being widely used by many emerging startups and
researchers in this domain to design virtual libraries of drug-like compounds.
Although these models can help a scientist to produce novel molecular
structures rapidly, the challenge still exists in the intelligent exploration
of the latent spaces of generative models, thereby reducing the randomness in
the generative procedure. In this work we present a manifold traversal with
heuristic search to explore the latent chemical space. Different heuristics and
scores such as the Tanimoto coefficient, synthetic accessibility, binding
activity, and QED drug-likeness can be incorporated to increase the validity
and proximity for desired molecular properties of the generated molecules. For
evaluating the manifold traversal exploration, we produce the latent chemical
space using various generative models such as grammar variational autoencoders
(with and without attention) as they deal with the randomized generation and
validity of compounds. With this novel traversal method, we are able to find
more unseen compounds and more specific regions to mine in the latent space.
Finally, these components are brought together in a simple platform allowing
users to perform search, visualization and selection of novel generated
compounds.
中文翻译:
ChemoVerse:潜在空间的流形遍历以发现新分子
为了设计更有效的化学实体,必须确定具有所需化学性质的分子结构。使用神经网络和机器学习的生成模型的最新进展正被该领域的许多新兴初创公司和研究人员广泛使用,以设计类药物化合物的虚拟库。虽然这些模型可以帮助科学家快速产生新的分子结构,但挑战仍然存在于对生成模型潜在空间的智能探索,从而降低生成过程中的随机性。在这项工作中,我们提出了一种启发式搜索的流形遍历,以探索潜在的化学空间。不同的启发式和分数,例如 Tanimoto 系数、合成可访问性、绑定活动、和 QED 药物相似性可以结合起来,以增加生成分子所需分子特性的有效性和接近性。为了评估流形遍历探索,我们使用各种生成模型生成潜在化学空间,例如语法变分自动编码器(有和没有注意),因为它们处理化合物的随机生成和有效性。通过这种新颖的遍历方法,我们能够在潜在空间中找到更多看不见的化合物和更具体的区域进行挖掘。最后,这些组件汇集在一个简单的平台中,允许用户对新生成的化合物进行搜索、可视化和选择。我们使用各种生成模型生成潜在化学空间,例如语法变分自动编码器(有和没有注意),因为它们处理化合物的随机生成和有效性。通过这种新颖的遍历方法,我们能够在潜在空间中找到更多看不见的化合物和更具体的区域进行挖掘。最后,这些组件汇集在一个简单的平台中,允许用户对新生成的化合物进行搜索、可视化和选择。我们使用各种生成模型生成潜在化学空间,例如语法变分自动编码器(有和没有注意),因为它们处理化合物的随机生成和有效性。通过这种新颖的遍历方法,我们能够在潜在空间中找到更多看不见的化合物和更具体的区域进行挖掘。最后,这些组件汇集在一个简单的平台中,允许用户对新生成的化合物进行搜索、可视化和选择。
更新日期:2020-09-30
中文翻译:
ChemoVerse:潜在空间的流形遍历以发现新分子
为了设计更有效的化学实体,必须确定具有所需化学性质的分子结构。使用神经网络和机器学习的生成模型的最新进展正被该领域的许多新兴初创公司和研究人员广泛使用,以设计类药物化合物的虚拟库。虽然这些模型可以帮助科学家快速产生新的分子结构,但挑战仍然存在于对生成模型潜在空间的智能探索,从而降低生成过程中的随机性。在这项工作中,我们提出了一种启发式搜索的流形遍历,以探索潜在的化学空间。不同的启发式和分数,例如 Tanimoto 系数、合成可访问性、绑定活动、和 QED 药物相似性可以结合起来,以增加生成分子所需分子特性的有效性和接近性。为了评估流形遍历探索,我们使用各种生成模型生成潜在化学空间,例如语法变分自动编码器(有和没有注意),因为它们处理化合物的随机生成和有效性。通过这种新颖的遍历方法,我们能够在潜在空间中找到更多看不见的化合物和更具体的区域进行挖掘。最后,这些组件汇集在一个简单的平台中,允许用户对新生成的化合物进行搜索、可视化和选择。我们使用各种生成模型生成潜在化学空间,例如语法变分自动编码器(有和没有注意),因为它们处理化合物的随机生成和有效性。通过这种新颖的遍历方法,我们能够在潜在空间中找到更多看不见的化合物和更具体的区域进行挖掘。最后,这些组件汇集在一个简单的平台中,允许用户对新生成的化合物进行搜索、可视化和选择。我们使用各种生成模型生成潜在化学空间,例如语法变分自动编码器(有和没有注意),因为它们处理化合物的随机生成和有效性。通过这种新颖的遍历方法,我们能够在潜在空间中找到更多看不见的化合物和更具体的区域进行挖掘。最后,这些组件汇集在一个简单的平台中,允许用户对新生成的化合物进行搜索、可视化和选择。