当前位置: X-MOL 学术Phys. Rev. B › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Through the eyes of a descriptor: Constructing complete, invertible descriptions of atomic environments
Physical Review B ( IF 3.7 ) Pub Date : 2021-10-26 , DOI: 10.1103/physrevb.104.144110
Martin Uhrin

In this work we apply methods for describing three-dimensional images to the problem of encoding atomic environments in a way that is invariant to rotations, translations, and permutations of the atoms and, crucially, can be decoded back into the original environment modulo global orientation without the need for training a model. From the point of view of decoding, the descriptor is optimally complete and can be extended to arbitrary order, allowing for a systematic convergence of the fidelity of the description. In experiments on molecules ranging from 3 to 29 atoms in size, we demonstrate that positions can be decoded with a 97% success rate and positions plus species with a 70% rate of success, rising to 95% if a second fingerprint is used. In all cases, consistent recovery is observed for molecules with 17 or fewer atoms. Additionally, we evaluate the descriptor's performance in predicting the energies and forces of bulk Ni, Cu, Li, Mo, Si, and Ge by means of a neural network model trained on DFT data. When comparing to six machine learning interaction potential methods that use various descriptors and regression schemes, our descriptor is found to be competitive, in several cases outperforming well established methods. The combined ability to both decode and make property predictions from a representation that does not need to be learned lays the foundations for a novel way of building generative models that are tasked with solving the inverse problem of predicting atomic arrangements that are statistically likely to have certain desired properties.

中文翻译:

通过描述符的眼睛:构建原子环境的完整、可逆的描述

在这项工作中,我们将描述 3D 图像的方法应用于编码原子环境的问题,该问题对原子的旋转、平移和排列是不变的,并且至关重要的是,可以将其解码回原始环境模全局方向无需训练模型。从解码的角度来看,描述符是最优的,可以扩展到任意顺序,允许描述保真度的系统收敛。在对大小为 3 到 29 个原子的分子进行的实验中,我们证明可以以 97% 的成功率解码位置,并且可以以 70% 的成功率对位置加上物种进行解码,如果使用第二个指纹,则可以提高到 95%。在所有情况下,对于具有 17 个或更少原子的分子,观察到一致的恢复。此外,我们通过在 DFT 数据上训练的神经网络模型来评估描述符在预测块状 Ni、Cu、Li、Mo、Si 和 Ge 的能量和力方面的性能。当与使用各种描述符和回归方案的六种机器学习交互潜在方法进行比较时,我们发现我们的描述符具有竞争力,在某些情况下优于成熟的方法。从不需要学习的表示中解码和进行属性预测的综合能力为构建生成模型的新方法奠定了基础,该方法的任务是解决预测原子排列的逆问题,这些原子排列在统计上可能具有某些所需的属性。和 Ge 通过在 DFT 数据上训练的神经网络模型。当与使用各种描述符和回归方案的六种机器学习交互潜在方法进行比较时,我们发现我们的描述符具有竞争力,在某些情况下优于成熟的方法。从不需要学习的表示中解码和进行属性预测的综合能力为构建生成模型的新方法奠定了基础,该方法的任务是解决预测原子排列的逆问题,这些原子排列在统计上可能具有某些所需的属性。和 Ge 通过在 DFT 数据上训练的神经网络模型。当与使用各种描述符和回归方案的六种机器学习交互潜在方法进行比较时,我们发现我们的描述符具有竞争力,在某些情况下优于成熟的方法。从不需要学习的表示中解码和进行属性预测的综合能力为构建生成模型的新方法奠定了基础,该方法的任务是解决预测原子排列的逆问题,这些原子排列在统计上可能具有某些所需的属性。在某些情况下,其性能优于成熟的方法。从不需要学习的表示中解码和进行属性预测的综合能力为构建生成模型的新方法奠定了基础,该方法的任务是解决预测原子排列的逆问题,这些原子排列在统计上可能具有某些所需的属性。在某些情况下,其性能优于成熟的方法。从不需要学习的表示中解码和进行属性预测的综合能力为构建生成模型的新方法奠定了基础,该方法的任务是解决预测原子排列的逆问题,这些原子排列在统计上可能具有某些所需的属性。
更新日期:2021-10-26
down
wechat
bug