当前位置: X-MOL 学术npj Comput. Mater. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Machine learning in materials informatics: recent applications and prospects
npj Computational Materials ( IF 9.7 ) Pub Date : 2017-12-13 , DOI: 10.1038/s41524-017-0056-5
Rampi Ramprasad , Rohit Batra , Ghanshyam Pilania , Arun Mannodi-Kanakkithodi , Chiho Kim

Propelled partly by the Materials Genome Initiative, and partly by the algorithmic developments and the resounding successes of data-driven efforts in other domains, informatics strategies are beginning to take shape within materials science. These approaches lead to surrogate machine learning models that enable rapid predictions based purely on past data rather than by direct experimentation or by computations/simulations in which fundamental equations are explicitly solved. Data-centric informatics methods are becoming useful to determine material properties that are hard to measure or compute using traditional methods—due to the cost, time or effort involved—but for which reliable data either already exists or can be generated for at least a subset of the critical cases. Predictions are typically interpolative, involving fingerprinting a material numerically first, and then following a mapping (established via a learning algorithm) between the fingerprint and the property of interest. Fingerprints, also referred to as “descriptors”, may be of many types and scales, as dictated by the application domain and needs. Predictions may also be extrapolative—extending into new materials spaces—provided prediction uncertainties are properly taken into account. This article attempts to provide an overview of some of the recent successful data-driven “materials informatics” strategies undertaken in the last decade, with particular emphasis on the fingerprint or descriptor choices. The review also identifies some challenges the community is facing and those that should be overcome in the near future.



中文翻译:

材料信息学中的机器学习:最新应用和前景

在材料基因组计划的推动下,在其他领域,由于算法的发展和数据驱动工作取得的巨大成功,部分地推动了信息学战略在材料科学领域的形成。这些方法导致了替代的机器学习模型,该模型能够仅基于过去的数据进行快速预测,而不是通过直接实验或通过显式求解基本方程式的计算/模拟来进行快速预测。以数据为中心的信息学方法对于确定使用传统方法难以测量或计算的材料特性(由于涉及的成本,时间或精力)正变得有用,但是对于这些材料,已经存在或可以生成至少一部分子集的可靠数据关键情况。预测通常是插值的,涉及首先对材料进行数字指纹识别,然后进行指纹和目标属性之间的映射(通过学习算法建立)。指纹(也称为“描述符”)可能具有多种类型和规模,具体取决于应用程序领域和需求。预测也可能是外推的(扩展到新的材料空间中),前提是要适当考虑到预测的不确定性。本文试图概述在过去十年中成功实施的一些最新的数据驱动的“材料信息学”策略,尤其着重于指纹或描述符的选择。审查还确定了社区面临的一些挑战以及在不久的将来应克服的挑战。然后遵循指纹和目标属性之间的映射(通过学习算法建立)。指纹(也称为“描述符”)可能具有多种类型和规模,具体取决于应用程序领域和需求。预测也可能是外推的(扩展到新的材料空间中),前提是要适当考虑到预测的不确定性。本文试图概述在过去十年中成功实施的一些最新的数据驱动的“材料信息学”策略,尤其着重于指纹或描述符的选择。审查还确定了社区面临的一些挑战以及在不久的将来应克服的挑战。然后遵循指纹和目标属性之间的映射(通过学习算法建立)。指纹(也称为“描述符”)可能具有多种类型和规模,具体取决于应用程序领域和需求。预测也可能是外推的(扩展到新的材料空间中),前提是要适当考虑到预测的不确定性。本文试图概述在过去十年中成功实施的一些最新的数据驱动的“材料信息学”策略,尤其着重于指纹或描述符的选择。审查还确定了社区面临的一些挑战以及在不久的将来应克服的挑战。根据应用程序领域和需求的不同,也称为“描述符”的类型和规模可能很多。预测也可能是外推的(扩展到新的材料空间中),前提是要适当考虑到预测的不确定性。本文试图概述在过去十年中成功实施的一些最新的数据驱动的“材料信息学”策略,尤其着重于指纹或描述符的选择。审查还确定了社区面临的一些挑战以及在不久的将来应克服的挑战。根据应用程序领域和需求的不同,也称为“描述符”的类型和规模可能很多。预测也可能是外推的(扩展到新的材料空间中),前提是要适当考虑到预测的不确定性。本文试图概述在过去十年中成功实施的一些最新的数据驱动的“材料信息学”策略,尤其着重于指纹或描述符的选择。审查还确定了社区面临的一些挑战以及在不久的将来应克服的挑战。本文试图概述在过去十年中成功实施的一些最新的数据驱动的“材料信息学”策略,尤其着重于指纹或描述符的选择。审查还确定了社区面临的一些挑战以及在不久的将来应克服的挑战。本文试图概述在过去十年中成功实施的一些最新的数据驱动的“材料信息学”策略,尤其着重于指纹或描述符的选择。审查还确定了社区面临的一些挑战以及在不久的将来应克服的挑战。

更新日期:2017-12-14
down
wechat
bug