为了进一步说明机器学习的火热程度,我们借用Web of Science数据库,仅以主题含有“machine learning”关键词,同时限定研究领域为“Chemistry”,进行了近五年(以索引时间为准)的搜索,相关文章数量如图所示: 结果显而易见,仅主题与机器学习相关的“化学”文章是逐年上升,并且在近两年呈现爆发趋势。2021年截止10月13日,就已经达到了1962篇相关文章,看到这样的数据,难道你认为它还不火吗? 接下来,我们一起来看一下,机器学习在近些年在各大期刊中的表现,准备好了吗?不要眨眼哦,绝对会让你眼花缭乱,目不暇接……
01
Nature:贝叶斯反应优化作为化学合成的工具 在此,来自美国普林斯顿大学的Ryan P. Adams & Abigail G. Doyle等研究者报道了,贝叶斯反应优化框架和开源软件工具的发展,使化学家可以轻松地将最先进的优化算法集成到他们的日常实验室实践中。研究者收集了钯催化直接芳基化反应的大型基准数据集,对贝叶斯优化与人类决策在反应优化中的对比进行了系统研究,并将贝叶斯优化应用于两个真实世界的优化工作(光信和脱氧氟化反应)。https://www.nature.com/articles/s41586-021-03213-yShields, B.J., Stevens, J., Li, J. et al. Bayesian reaction optimization as a tool for chemical synthesis. Nature 590, 89–96 (2021). https://doi.org/10.1038/s41586-021-03213-y
02
Science:RNA结构的几何深度学习 在此,来自美国斯坦福大学的RHIJU DAS & RON O. DROR等研究者,通过引入一种机器学习方法,可以识别精确的结构模型,而无需假设它们的定义特征,尽管只使用18个已知RNA结构进行训练。由此产生的评分函数,即原子旋转等变评分器(ARES),大大优于以往的方法,并始终在社区范围内的盲RNA结构预测挑战中产生最好的结果。https://www.science.org/doi/10.1126/science.abe5650Kevin M. Weeks, Piercing the fog of the RNA structure-ome, Science, 373, 6558, (964-965), (2021)./doi/10.1126/science.abk1971
03
Nature Chemistry:利用集体知识确定金属-有机框架中金属阳离子的氧化态 在此,来自瑞士洛桑联邦理工学院的Berend Smit等研究者,建议使用机器学习模型,通过在剑桥结构数据库的化学名称中编码的化学家分配的任务,来自动分配金属-有机框架中的金属离子的氧化态。该方法中,只考虑金属中心周围的直接局部环境,研究表明,该策略对于实验的不确定性,如不正确的质子化,未结合溶剂或键长变化是稳健的。https://www.nature.com/articles/s41557-021-00717-yJablonka, K.M., Ongari, D., Moosavi, S.M. et al. Using collective knowledge to assign oxidation states of metal cations in metal–organic frameworks. Nat. Chem. 13, 771–777 (2021). https://doi.org/10.1038/s41557-021-00717-y
04
Nature Materials:从预测建模到机器学习和胶体自组装的逆向工程 在此,来自荷兰乌得勒支大学的Marjolein Dijkstra & 美国西北大学的Erik Luijten等研究者,讨论了用于设计通过自底向上自组装胶体和纳米粒子的软材料的计算机模拟方法和策略。研究者描述了用于研究胶体悬浮液自组装行为的模拟技术,包括晶体结构预测方法、相图计算和增强采样技术,以及它们的局限性。https://www.nature.com/articles/s41563-021-01014-2Dijkstra, M., Luijten, E. From predictive modelling to machine learning and reverse engineering of colloidal self-assembly. Nat. Mater. 20, 762–773 (2021). https://doi.org/10.1038/s41563-021-01014-2
05
Nature Catalysis:金属间化合物的主动学习,以指导发现用于CO2还原和H2演化的电催化剂 在此,来自美国卡耐基梅隆大学的Zachary W. Ulissi等研究者,提出了一种理论的、全自动的筛选方法,该方法结合了机器学习和优化来指导密度泛函理论计算,然后用于预测电催化剂的性能。研究者通过对31种不同元素的合金进行筛选,证明了这种方法的可行性,从而实现了对50%的d区元素和33%的p区元素的筛选。https://www.nature.com/articles/s41929-018-0142-1Tran, K., Ulissi, Z.W. Active learning across intermetallics to guide discovery of electrocatalysts for CO2 reduction and H2 evolution. Nat Catal 1, 696–703 (2018). https://doi.org/10.1038/s41929-018-0142-1
06
Nature Nanotechnology:实现纳米电子器件功能的深度学习方法 在此,来自荷兰特温特大学的Wilfred G. van der Wiel等研究者,提出了一种通用的深度学习方法,以有效优化复杂的多端纳米电子器件的预期功能。在此,研究者演示了在硅中掺杂原子无序网络中实现功能的方法。https://www.nature.com/articles/s41565-020-00779-yRuiz Euler, HC., Boon, M.N., Wildeboer, J.T. et al. A deep-learning approach to realizing functionality in nanoelectronic devices. Nat. Nanotechnol. 15, 992–998 (2020). https://doi.org/10.1038/s41565-020-00779-y
07
Nature Communications:基于机器学习的分子、过渡态和固体的无能量结构预测 在此,来自奥地利维也纳大学的O. Anatole von Lilienfeld等研究者的机器学习模型Graph-To-Structure(G2S),利用训练数据集中松弛结构之间的隐式相关性,在化合物空间中进行泛化,以推断样本外化合物的原子间距离,有效地实现了坐标的直接重构,从而绕过了常规的能量优化任务。收集的数值证据包括有机分子、过渡态和结晶固体的三维坐标预测。https://www.nature.com/articles/s41467-021-24525-7Lemm, D., von Rudorff, G.F. & von Lilienfeld, O.A. Machine learning based energy-free structure predictions of molecules, transition states, and solids. Nat Commun 12, 4468 (2021). https://doi.org/10.1038/s41467-021-24525-7
08
Science Advances:高性能有机光伏材料的机器学习辅助分子设计与效率预测 在此,来自中国科学院重庆绿色智能技术研究院的陆仕荣和肖泽云&重庆大学的孙宽等研究者,首先建立了一个包含超过1700份文献报道的供体材料的数据库。通过监督学习,该机器学习(ML)模型可以建立结构-属性关系,从而实现OPV材料的快速筛选。https://www.science.org/doi/10.1126/sciadv.aay4275W. Sun, Y. Zheng, K. Yang, Q. Zhang, A. A. Shah, Z. Wu, Y. Sun, L. Feng, D. Chen, Z. Xiao, S. Lu, Y. Li, K. Sun, Machine learning–assisted molecular design and efficiency prediction for high-performance organic photovoltaic materials. Sci. Adv. 5, eaay4275 (2019)
09
Angew:将机器学习应用于充电电池:从微观到宏观 在此,来自清华大学的张强等研究者,从微观到宏观综述了ML(机器学习)在可充电电池中的应用。具体来说,ML提供了一种策略,用于探索密度泛函理论计算的新泛函,以及分子动力学模拟的新势,这有望显著增强对界面和非晶结构的挑战性描述。https://onlinelibrary.wiley.com/doi/10.1002/anie.202107369Chen, X., Liu, X., Shen, X. and Zhang, Q. (2021), Applying Machine Learning to Rechargeable Batteries: From the Microscale to the Macroscale. Angew. Chem. Int. Ed.. https://doi.org/10.1002/anie.202107369
10
Advanced Materials:从化学成分预测准晶体的机器学习 在此,来自日本东京大学的Kaoru Kimura & 立川市统计数学研究所的Ryo Yoshida等研究者,研究表明新的准晶体的发现,可以通过一个简单的机器学习工作流来加速。根据已知的稳定准晶体、近似晶体和普通晶体的化学成分列表,训练了一个预测模型来解决三级分类任务,并与观察到的三元铝系统相图相比评估了其可预测性。https://onlinelibrary.wiley.com/doi/10.1002/adma.202102507Liu, C., Fujita, E., Katsura, Y., Inada, Y., Ishikawa, A., Tamura, R., Kimura, K., Yoshida 2102507, R., Machine Learning to Predict Quasicrystals from Chemical Compositions. Adv. Mater. 2021, 33, 2102507. https://doi.org/10.1002/adma.202102507
JACS:多Chevrel相硫属化合物的机器学习合成 在此,来自美国加州大学戴维斯分校的Jesús M. Velázquez & 美国科罗拉多州博尔德大学的Charles B. Musgrave等研究者,提出了一个可解释的机器学习描述符(Hδ),可以快速准确地估计分解焓(ΔHd),以评估CP的稳定性。为了开发Hδ,研究者首先使用密度泛函理论计算了438种CP成分的ΔHd。https://pubs.acs.org/doi/10.1021/jacs.1c02971Nicholas R. Singstock, Jessica C. Ortiz-Rodríguez, Joseph T. Perryman, Christopher Sutton, Jesús M. Velázquez, and Charles B. Musgrave, Machine Learning Guided Synthesis of Multinary Chevrel Phase Chalcogenides. Journal of the American Chemical Society 2021 143 (24), 9113-9122DOI: 10.1021/jacs.1c02971
13
Nano Letters:利用原子力显微镜数据的深度学习分析定量蛋白质自组织动力学 在此,来自美国橡树林国家实验室的Sergei V. Kalinin等研究者,利用高速原子力显微镜观察蛋白质,在无机表面的自组装动力学和由此产生的几何图形。利用无监督线性分解方法研究二维快速傅里叶变换、相关和对分布函数等经典宏观描述符的时间动力学,证明了静态有序相和动态无序相的存在,建立了它们的时间动力学。原文链接:https://pubs.acs.org/doi/10.1021/acs.nanolett.0c03447#参考文献:Maxim Ziatdinov, Shuai Zhang, Orion Dollar, Jim Pfaendtner, Christopher J. Mundy, Xin Li, Harley Pyles, David Baker, James J. De Yoreo, and Sergei V. Kalinin. Quantifying the Dynamics of Protein Self-Organization Using Deep Learning Analysis of Atomic Force Microscopy Data. Nano Letters 2021 21 (1), 158-165. DOI: 10.1021/acs.nanolett.0c03447
14
ACS Catalysis:基于机器学习的非贵金属电催化剂设计的潜在决定因素和新机制研究 在此,来自南京大学的Jia Li和刘建国等研究者,引入了机器学习,通过基于数据集的特征排序来提供洞见。以沸石咪唑骨架氧还原催化剂为例,计算结果表明,吡啶类氮与催化性能密切相关。https://pubs.acs.org/doi/10.1021/acscatal.1c01473Rui Ding, Yawen Chen, Ping Chen, Ran Wang, Jiankang Wang, Yiqin Ding, Wenjuan Yin, Yide Liu, Jia Li, and Jianguo Liu. Machine Learning-Guided Discovery of Underlying Decisive Factors and New Mechanisms for the Design of Nonprecious Metal Electrocatalysts. ACS Catalysis 2021 11 (15), 9798-9808 DOI: 10.1021/acscatal.1c01473
15
ACS Nano:高光谱扫描隧道光谱数据的机器学习揭示吸附原子阵列的化学键 在此,来自美国橡树林国家实验室的Zheng Gai和Sergei V. Kalinin等研究者,开发了一种基于机器学习的工作流,结合空间域的监督特征识别和能量域的无监督聚类,以揭示Co3Sn2S2切割表面吸附原子阵列电子结构依赖于结构变化的细节。https://pubs.acs.org/doi/10.1021/acsnano.1c02902#Kevin M. Roccapriore, Qiang Zou, Lizhi Zhang, Rui Xue, Jiaqiang Yan, Maxim Ziatdinov, Mingming Fu, David G. Mandrus, Mina Yoon, Bobby G. Sumpter, Zheng Gai, and Sergei V. Kalinin. Revealing the Chemical Bonding in Adatom Arrays via Machine Learning of Hyperspectral Scanning Tunneling Spectroscopy Data. ACS Nano 2021 15 (7), 11806-11816. DOI: 10.1021/acsnano.1c02902
16
ACS Energy Letters:通过机器学习揭示的应变-氧化还原解耦理解富镍阴极材料的介观尺度的降解 在此,来自上海交通大学的李林森&美国SLC国家实验室的Keeyoung Jung & Yijin Liu等研究者,通过纳米分辨率同步加速器光谱显微镜研究LiNi0.8Co0.1Mn0.1O2 (NCM811)阴极粒子,研究了局部氧化还原反应与晶格失配之间的关系。在基于机器学习的数据分类方法的帮助下,研究者确定了显示拉力-氧化还原解耦效应的局部区域,这可以归因于不同的副反应。https://pubs.acs.org/doi/10.1021/acsenergylett.0c02699Guannan Qian, Jin Zhang, Sheng-Qi Chu, Jizhou Li, Kai Zhang, Qingxi Yuan, Zi-Feng Ma, Piero Pianetta, Linsen Li, Keeyoung Jung, and Yijin Liu. Understanding the Mesoscale Degradation in Nickel-Rich Cathode Materials through Machine-Learning-Revealed Strain–Redox Decoupling.ACS Energy Letters 2021 6 (2), 687-693 DOI: 10.1021/acsenergylett.0c02699
17
Nano Energy:通过机器学习加速发现能源系统中的稳定尖晶石 在此,来自上海交通大学的李金金等研究者,开发了一种目标驱动的方法,使用机器学习(ML)来加速从元素周期表未知尖晶石的从头计算预测。https://www.sciencedirect.com/science/article/abs/pii/S2211285520312386#!Wang, Zhilong, Haikuo Zhang, and Jinjin Li. "Accelerated discovery of stable spinels in energy systems via machine learning." Nano Energy 81 (2021): 105665.
18
Joule:利用高通量机器人平台和机器学习阐明OPV材料的全部潜力 在此,来自德国巴伐利亚应用能源研究中心的Christoph J.Brabec等研究者,展示了一个名为“AMANDA Line One”的自动化平台,可在全设备水平上对OPV材料进行多目标评估。超过100种处理变化是自动筛选,这允许一个可靠的评价在效率和光稳定性。https://www.sciencedirect.com/science/article/pii/S2542435120306127#!Du, Xiaoyan, et al. "Elucidating the Full Potential of OPV Materials Utilizing a High-Throughput Robot-Based Platform and Machine Learning." Joule 5.2 (2021): 495-506.
19
Chem:主动学习可以加速反应能表面的从头开始的分子动力学 在此,来自美国麻省理工学院的Rafael Gómez-Bombarelli等研究者,报告了一个低成本的可转移的管道,这将从分子动力学开始加速了2000倍。它由高通量DFT计算、主动学习和迁移学习组成,基于神经网络训练高质量的反力场。https://www.sciencedirect.com/science/article/pii/S2451929420306410#!Ang, Shi Jun, et al. "Active learning accelerates ab initio molecular dynamics on reactive energy surfaces." Chem 7.3 (2021): 738-751.
20
Matter:机器学习金属-有机框架的量子化学性质加速材料发现 在此,来自美国西北大学的Andrew S. Rosen等研究者,展示了数千个MOFs的量子力学性质数据库,这是超过170年的计算时间的结果。有了这个新的数据库,研究者开发了机器学习模型,可以在几秒钟内预测MOFs的电子特性,而不需要昂贵的量子力学模拟和强大的超级计算机。https://www.sciencedirect.com/science/article/pii/S2590238521000709#!Rosen, Andrew S., et al. "Machine learning the quantum-chemical properties of metal–organic frameworks for accelerated materials discovery." Matter 4.5 (2021): 1578-1597.
21
Energy Storage Materials:用于能源材料超快速高精度筛选的深度学习 在此,来自上海交通大学的李金金等研究者,开发了一个深度学习模型,该模型可以预测更精确的Heyd-Scuseria-Ernzerhof (HSE06)带隙的毫秒数1503二元金属氧化物、氮化物、硫化物,平均绝对误差(MAE)为0.35 eV,平均平方误差(MSE)为0.21 eV,决定系数(R2)为0.98。https://www.sciencedirect.com/science/article/pii/S2405829721001483#!Wang, Zhilong, et al. "Deep learning for ultra-fast and high precision screening of energy materials." Energy Storage Materials 39 (2021): 45-53.
22
PNAS:Mott绝缘体NiO的神经形态学习 在此,来自美国罗格斯大学的Karin M. Rabe & 美国普渡大学的Zhen Zhang & Shriram Ramanathan等研究者,用典型的莫特绝缘体-氧化镍(NiO),在室温及以上的各种外部刺激下证明了非联想学习。https://www.pnas.org/content/118/39/e2017239118Zhang, Zhen, et al. "Neuromorphic learning with Mott insulator NiO." Proceedings of the National Academyof Sciences 118.39 (2021).
23
Environmental Energy Science:燃料电池用碱性阴离子交换膜的机器学习分析与预测模型 在此,来自苏州大学的严峰等研究者,首次提出了人工智能(AI)技术来预测燃料电池AEMs的化学稳定性。采用基于材料基因组学策略的Hammett取代常数对AEMs的化学稳定性进行量化,并采用决策树对AEMs进行分类。https://pubs.rsc.org/en/content/articlelanding/2021/ee/d1ee01170gZou, Xiuyang, et al. "Machine Learning Analysis and Prediction Models of Alkaline Anion Exchange Membranes for Fuel Cells." Energy & Environmental Science (2021).由于机器学习在材料领域刚刚兴起,化学、材料学专业设置相关课程的学校极少。网络上有大量机器学习的资料,但绝大多数面向数学与计算科学专业,学习难度大且与真实实验研究毫无关联,学完难以掌握与使用。华算科技推出了【机器学习+材料】零基础课程,针对零编程基础的化学、材料学工作者,先扎实学习当下最流行、与机器学习契合度最高的Python语言,再学习机器学习的基本算法,并对文献案例进行重现。课程包含大量实际操作内容,掌握编程神器Python与黑科技机器学习不再遥不可及。