当前位置 : X-MOL首页行业资讯 › Chematica:化学合成的“骇客帝国”?

Chematica:化学合成的“骇客帝国”?

IT技术的进步,或许真的能改变一切,包括化学合成。有一款神奇的软件系统Chematica,包含上百万种已知分子和化学反应,听起来像是词典?NO NO NO,它还包含了信息间的联系和比对功能,就像化学世界的互联网一种。虽然很多有机合成化学家质疑Chematica的能力,但来自韩国蔚山国立科学技术研究所(UNIST)Bartosz Grzybowski教授坚信这款软件在未来将是设计合成路线必不可少的工具,它将开启一个化学合成的新纪元。


建议WIFI环境下观看视频


图片来源:ChemistryWorld


英国布里斯托尔大学(University of Bristol)的有机合成资深学者Varinder Aggarwal说:“计算机真的能判断出哪条路线管用?哪条路线高效?如果是真的,那将是个了不起的突破。”


从简单的原料开始合成一个复杂化合物是非常困难的,例如某个重磅药或一段DNA序列。研究者(俗称搬砖工)必须拼命回忆脑子里的反应或机理,再查阅大量文献,动用逆合成分析,写出一个有可能管用的路线。至于产率、成本、原料易得性等都来不及考虑太多,路线打通了再说(这段写的我都是泪~~)。


在这种工作模式下,研究者的记忆力对设计合成路线显得尤为重要。不过知识一旦生疏就会遗忘,一两年不用某个反应可能就忘了。


化学定向越野


在路线打不通的沮丧中,Chematica横空出世。过去15年间,Grzybowski和同事手动录入了1000万个分子和反应,并将它们彼此链接,成就了一款非常复杂的软件。Chematica看起来很像航线图,有中转,有枢纽。


这种网状布局使Chematica能够快速找到合理的路径,比从数据库或列表中搜索要节省时间。这就好比坐地铁时,地铁线路图要比地铁站名A-Z列表更好用一样。

Chematica给出的成本最优化的伐地那非合成路线,用到的反应跨越半个世纪。图片来源:Wiley


化学家只需把目标分子输入Chematica就能得到基于成本、底物易得性、步骤数筛选出的反应路线,这一切仅仅需要数秒钟。每一步反应及产物都会基于两个方程进行评分:反应评分函数化合物评分函数。如果涉及的化学反应很难操作,反应评分就会变低;如果涉及的化合物结构比较简单或常见,化合物评分就会较高,反应路线也就显得更合理。这些评分函数使Chematica能够评估每条路线,将那些明显不可行的去掉。


步步为营


有人认为Chematica的算法和下棋程序类似,不过Grzybowski觉得这个类比不够准确。他认为下棋时,由于落子不悔的规则,你只需瞻前,无需顾后。合成路线设计则复杂得多。


领导“Dial-a-molecule”网站的Richard Whitby认为准确、高质量的数据是关键的基础。他举例说,逆合成分析工具ARChem和SynChem效果不是太好,因为它们的数据来源是Reaxys。Whitby称,“这些数据充满错误和缺陷,ARChem和SynChem以此为基础,给出的建议就会很愚蠢。”(小编:谨代表Whitby个人观点)


让软件接受并运用化学反应规则也非常重要。这里不得不提有机合成大师E J Corey在20世纪70年代开发的LHASA(Logic and Heuristics Applied to Synthetic Analysis),该软件中写入了很多化学规则。但很可惜Corey组只录入了300个规则,这显然不够。


继续前进


Grzybowski用自动化平台开发了另一款软件:Syntaurus。过去十年间,Grzybowski团队已经手动编码了20000条化学规则。这些规则涉及不能共存的基团、保护基策略、甚至键长键角的细微差别等。

如果不能依靠机器学习,这将是个大麻烦。化学规则的数据量可能比《大英百科全书》还多。

Syntaurus只用了几个小时就找出了epicolactone最佳合成路线

来源:ChemistryWorld


最近的研究中,Grzybowski证明了Syntaurus的潜力。该程序成功给出了epicolactone的全合成路线,该物质2012年提取自真菌中,是结构复杂的天然产物。合成化学家花了将近三年时间设计了一条生物合成路线(点击阅读相关),而Syntaurus只花了几个小时。


回应质疑


对Chematica和Syntaurus的质疑声音当然没有消失。Aggarwal说,“下一步的打算应该是让计算机合成相当复杂的分子,在实验室中验证。如果复杂分子也能成功,那我必须承认这些软件是有用的。”


Whitby则乐观得多,“只要你真的去用Chematica,就很可能收获有意义的结果,这一点我们非常确信。”


不过Grzybowski则宣布Syntaurus接受了Aggarwal的挑战(复杂分子),并且已经取得成功。尽管他本人对该项目守口如瓶,他的团队还是透露Syntaurus可以给出一种重磅药的最短、最便宜的合成路线,实验室已经验证过。


氘评:

Syntaurus的真正价值还有待进一步检验。但利用计算机服务化学研究、推动化学进展是大势所趋。化学知识进一步积累,计算机对化学知识检索、整理能力的进一步提升,未来真的有可能实现“天下无不可合成之分子”。



参考文献:

1. M. Kowalik et al., Angew. Chem. Int. Ed., 2012, 51, 7928 (DOI: 10.1002/anie.201202209)

2. E. J. Corey et al., JACS, 1972, 94, 421 (DOI: 10.1021/ja00757a020)

3. S. Szymkuć et al., Angew. Chem. Int. Ed., 2016, 55, 5904 (DOI: 10.1002/anie.201506101)


编译自:

http://www.rsc.org/chemistryworld/2016/08/chematica-syntaurus-revolutionary-computer-program-synthetic-pathway-software


(本文由氘氘斋供稿)


问题讨论

  • 目前来看计算机辅助合成路线设计仍然只是“辅助”,计算机和化学家的头脑相比,还缺乏什么呢?


下方留言评论,参加讨论



如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

阿拉丁
动态系统的数学与计算机建模
热点论文一站获取
购书送好礼
天然纤维材料
口腔微生物
英语语言编辑翻译加编辑
材料学领域约200份+SCI期刊
定位全球科研英才
中国图象图形学学会合作刊
东北石油大学合作期刊
动物源性食品遗传学与育种
专业英语编辑服务
左智伟--多次发布
多次发布---上海中医药
广州
天大
清华
清华
北大
西安电子
中科院
南科大
ACS材料视界
down
wechat
bug