当前位置 : X-MOL首页行业资讯 › 从此,“搬砖”将成为历史

从此,“搬砖”将成为历史

有机化学是最重要的基础学科之一,是制造物质的核心工具,是环境、材料、农业、生物和医药领域发展的根本要素。正如Phil Baran所说,“没有有机化学,我们大部分人会无家可归、挨饿或者死亡”,“它允许你扮演‘上帝’的角色,可以创造从未存在过的新物质”。


然而,由于有机化学的研究经常需要进行漫长的盲筛,许多“进展”都是一次又一次的“意外”发现,所以常有人嘲讽,有机化学是一门“体力”化学,教授一般都觉得自己做的是科学,而学生却普遍自嘲自己干的是“搬砖”。但是,回顾有机化学的发展进程,我不由得对前辈科学家肃然起敬,正是因为他们的艰苦探索,才造就了今日有机化学的辉煌成就。


对于一个发展不完善的学科,大量的筛选摸索是不可避免的。刚上大学时老师就告诉我,科研要经历99次失败才有1次成功。那么,有没有什么办法能让别人去经历那99次失败,由我来享受那1次的成功呢?这,是我学生时代的梦想。当然,这里的“别人”,不是指隔壁通风橱的那个倒霉师弟,而是机器人,更准确的说,是自动化。


在大多数人的印象里,化学实验室一般是这样的:

图片来源:UNIVERSEUM


或者是这样的:

图片来源:Benchtop Thoughts


可是,未来的实验室可能是这样的:

图片来源:ChemistryWorld


也可能是这样的:

图片来源:Nature


可以断言,现代有机化学的发展方向必然是自动化。


自动化的终极目标是建立无人实验室,彻底解放双手,概念非常诱人,一旦实现,必将对传统科研模式形成摧枯拉朽的冲击力,从此,“搬砖”将写进史书。目前,化学合成的自动化体系主要是基于连续流动和智能机器人技术而设计,其中连续流动技术的代表性报道有Martin Burke教授的block-by-block合成机器(Science, 2015, 347, 1221, 点击阅读详细)(下图A)、Pfizer的流动化学系统(Science, 2018, 359, 429, 点击阅读详细)(下图B),以及Leroy Cronin教授的Chemputer(Science, 2019, DOI: 10.1126/science.aav2211)。

图片来源:Science


Cronin教授的Chemputer。图片来源:Cronin Group


而以Andy Cooper教授的Robotic Chemists(下图)为代表的智能机器人也在有机合成领域掀起了一阵狂风。

图片来源:Nature


化合物的合成路径设计以前一直都依赖于经验丰富的化学家,对化学知识和实验经验要求很高,而利用人工智能,尤其是机器学习技术,可以分析已知的化学反应,学习其中的反应规律,从而可以更快设计出优异的合成路径。甚至有人断言,正如李世石不敌AlphaGo一样,由于人工智能对海量数据过目不忘,未来合成路径设计大师或许会成为历史。其中的代表作有Bartosz Grzybowski和Milan Mrksich教授开发的Chematica系统、Marwin Segler 和 Mark Waller教授发展的3N-MCTS“化学AlphaGo”(点击阅读详细)以及Leroy Cronin教授对化学反应的“数字化”描述尝试(点击阅读详细)。


但是无论是经验丰富的化学家,或是基于人工规则的Chematica等系统,还是基于神经网络结合蒙特卡洛树搜索的深度学习算法,一个无法逾越的鸿沟就是合成路径的可行性问题。直到今天,无论是药物还是材料开发,决速步骤并非合成路径设计,而是实际合成操作。过去的经验表明,即使是非常优秀的合成路径设计,其中的一个或多个反应在实际操作中也经常出现反应条件或者结果不理想的现象,最终导致合成计划的失败。即使通过修正方案完成了目标化合物的合成,也经常因步骤太繁琐、操作太复杂、产率太低或成本过高等原因而止步于论文发表,无法进行推广应用。简而言之,化学家和目前的人工智能技术即使可以解决如何将目标化合物拆解为简单易得的原料小分子的逆合成分析(Retrosynthesis analysis)的理论问题,目前也无法解决如何将原料小分子组装成目标化合物的正向反应预测(Forward reaction prediction)的实际问题。


最根本的原因在于化学家和人工智能赖以学习的基础——数据,存在严重的质量问题。


众所周知,商业化的数据库取材于期刊论文,数据质量和数量均不佳。Nature 曾有一份调查显示,90%的受访者认为存在可重复性危机,超过70%受访者表示曾经无法重复他人的实验,超过50%受访者表示曾经无法重复自己的实验(Nature, 2016, DOI: 10.1038/533452a)。

图片来源:Nature


如果可以建立一个标准化数据库,大量收集各类反应的标准化数据,则可以从根本上解决数据的质量和数量问题。构建标准化数据库的最佳方法就是通过高通量实验(HTE),在极短时间内完成大量实验和获得海量数据。由于是标准的代码和脚本控制,机器执行,人工操作的误差和错误基本上都可以避免,其数据的可靠性、可重复性和关联性将远远超出目前的水平。


尽管化合物的生物活性筛选早已进入自动化高通量筛选阶段,但化学合成至今仍然停留在劳动密集型时代,为了寻找可行的化学反应条件,化学家需要不断的试错,通过大量的重复性劳动来探索反应条件和验证合成路径。然而,即使是发展非常成熟的酰胺化、Suzuki或Buchwald-Hartwig反应,常用的反应条件也超过100种。对于大多数研究较少的反应,因为缺乏足够的反应条件和数据参考而不得不进行盲筛,但又往往因为变量太多而失败,以致于研究人员对新反应的应用推广普遍持保留态度,形成恶性循环。


受紧张的药物开发时间线的影响,需要快速合成目标化合物和推广新型反应,近十年来,世界最顶尖的几家制药公司开始研究高通量化学技术,其中发展较为成熟的是美国Merck、Pfizer、Lilly、GSK、Abbvie、Amgen、BMS和AZ建立的高通量实验平台,其中最主要代表是美国Merck(Science, 2015, 347, 49, 点击阅读详细)(Nature, 2018, 557, 228, 点击阅读详细)(Science, 2018, DOI: 10.1126/science.aar6236, 点击阅读详细),由于相关的进展都曾经在X-MOL报道过,详情就不再赘述,主要是从文献之外的角度对这些科研进展进行分析。

图片来源:Org. Process Res. Dev., 2019, DOI: 10.1021/acs.oprd.9b00140


首先,纵观各大药企,除了各自的高通量建设方案各不相同,即使是同一家公司,建立的高通量实验平台也有不同的针对性。尤其是药企里的MedChem和Process,由于对化学反应的要求不同,对高通量技术的运用方式也截然不同,基本上Process才建立高通量实验平台,而MedChem则倾向于利用高通量发展组合化学和平行合成。因为MedChem把化学当成验证猜想的工具,希望通过反应得到大量的类似物进行活性筛选,即使只得到1毫克的产物也无妨;而Process是希望以实用、安全和经济的方法完成大规模的反应,所以更加热衷于通过高通量筛选获得最佳的反应条件。


除了药企,也有部分高校在尝试发展高通量,其中的代表是普林斯顿、宾州州立和加州理工。然而,目前高通量在学术界的推广并不顺利。首先是成本问题,虽然高通量的性价比远远高于手工操作,但是前期投入高,回报周期长,启动难度很大。不过,最重要的还是人才和技术问题。由于技术不成熟,市面上非常缺少专门针对化学开发的高通量仪器,目前各大药企采购的大都是根据自身需求定制的仪器,换言之,高校即使有钱恐怕都很难确定采购方案;另外,运行高通量仪器最常见的不是机器大故障,而是多如牛毛的小问题。就像程序出错的原因一般都不是电脑硬件有问题而是代码有bug一样,每次使用高通量设备都需要专业人员首先精心设计整个流程,再编写代码、脚本或流程,保证每个环节都不出问题或者一旦出了问题有相应的解决方案。所以,推广到经费有限和人员流动性较高的普通公司和学术机构用于基础研究的难度很大。


虽然目前高通量实验技术存在许多挑战,但是瑕不掩瑜,其强大的功能和巨大的潜力,必将有效推动有机化学的发展与升级,而由此带来的人工智能,更是促进化学合成进入乐高积木时代的核心动力。


如果你也对高通量和人工智能感兴趣,是否想过中国有没有团队具有开展高通量和人工智能的资金和技术实力呢?如果有,你是否想要加入其中呢?如果是,以下是强行插入的植入式招聘广告。


诚邀各路英雄豪杰加入广州再生医学与健康广东省实验室,合作开展以前沿技术为基础的化学合成与应用研究,建设中国最先进的自动化高通量化学合成实验室


研究员简介



廖矿标课题组网站,点击访问


更多资料请参考X-MOL的相关报道:

Nature:如何获得碳氢键活化的奥运金牌

Nature:区域和立体选择性的三级C–H键官能化

从一个低级错误到两篇Nature

从两篇Nature的夹缝中“挤出”一篇Nature Chemistry


研究简介


我们技术平台的建设目标是科研人员可以通过设置任务一键执行,增加实验员的walk away time,这段时间可以用来分析数据、讨论结果或查阅文献,也可以去喝口水、吃点心或给重要的人发一条简讯,帮助实验员营造轻松的氛围,获得愉悦的心情与无尽的灵感。想了解更多关于技术平台的相关信息,请观看我们特别制作的视频。

HTE Workflow Showcase。视频来源:廖矿标课题组


我们希望将合成化学从以体力劳动为主的传统模式升级为以脑力劳动为主的现代模式,希望未来化学家不再把主要精力集中在如何合成分子的路径设计和实验操作中,而是将更多的时间用在思考如何发现新的化学反应,该合成哪些分子以及怎么利用这些分子解决实际问题。


应聘要求

应聘者需要提交一份未来研究或职业发展规划,我们期待应聘者有自己的想法、格局和战略眼光,我们的理念是招聘最杰出的人才来告诉我们应该做什么才能达成我们共同的目标,而不是招聘一批人来听我们的安排去做事。

薪资待遇

1. 我们不提供有竞争力的待遇,我们只提供有碾压性的薪酬。

2. 对于有突出科研能力和学科背景的应聘者,薪酬、经费面议。

3. 帮助申请黄埔区、广州市和广东省的科研经费和安家补贴及其他福利待遇。

4. 除博士后属于流动岗位,其他人员均为正式员工,工作期间表现优异者可按成果评为研究员、副研究员或助理研究员。


广州再生医学与健康广东省实验室


广州再生医学与健康广东省实验室(以下简称“再生医学省实验室”)成立于2017年12月22日,是广东省以培育创建国家实验室、打造国家实验室“预备队”为目标首批启动建设的四家省实验室之一,属事业单位性质。再生医学省实验室依托中国科学院广州生物医药与健康研究院和粤港澳地区优势科研单位,联合众多国内外顶尖科研力量,面向国家和广东省重大战略需求,瞄准干细胞与再生医学理论与技术的前沿研究、组织器官重塑研究、精准医学与临床前研究、再生应用研究等四大方向,立足国际化、高起点,全链条布局,通过国际一流领军人才团队和成果的引进以及国内相关单位的强强联合,建成国际领先水平的研究和开发高地、国际重要干细胞和再生医学临床研究基地、高端生物医药管理人才培养高地,构建华南乃至亚太地区再生医学治疗中心,努力跻身一流国家实验室。


我们手持化学这柄上古神器,又兼具自动化高通量的强大火力,除了做合成化学基础研究,还可以通过省实验室的高度国际化学科交叉平台,与生命科学家合作,研究并解决更具挑战性的化学难题,并通过发表高水平文章,传播前沿成果,增加知识积累,推动领域发展。


应聘请将(1)简历、(2)代表性论文原文、(3)研究总结和(4)未来研究规划,以“应聘职位+姓名”为邮件主题,发送至liao_kuangbiao@grmh-gdl.cn


如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

阿拉丁
英语语言编辑 翻译加编辑
专注于基础生命科学与临床研究的交叉领域
遥感数据采集
数字地球
开学添书香,满额有好礼
加速出版服务
编辑润色服务全线九折优惠
传播分子、细胞和发育生物学领域的重大发现
环境管理资源效率浪费最小化
先进材料生物材料
聚焦分子细胞和生物体生物学
“转化老年科学”.正在征稿
化学工程
wiley你是哪种学术人格
细胞生物学
100+材料学期刊
人工智能新刊
图书出版流程
征集眼内治疗给药新技术
英语语言编辑服务
快速找到合适的投稿机会
动态系统的数学与计算机建模
热点论文一站获取
定位全球科研英才
中国图象图形学学会合作刊
东北石油大学合作期刊
动物源性食品遗传学与育种
专业英语编辑服务
中科大
华盛顿
上海交大
德国
美国
中山大学
西湖大学
药物所
普渡大学
东方理工
ACS材料视界
down
wechat
bug