打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
90%的实验都白做了?!
userphoto

2022.12.26 北京

关注
    经典的有机合成依赖于大量的反应条件筛选,而化学信息学的发展将有助于更高效的进行反应探索。虽然我们可以从Reaxys和Web_of_Science上面检索得到大量的数据,但是这些报道的数据可能存在一定的误差,并且绝大多数属于正例——这些数据鲜有失败的实验结果,导致很严重的样本不平衡,这些问题极大的增加了构建数据集的难度。      
    2021年,Tim Cernak、Abigail G. Doyle和Richmond Sarpong合作在Nature Reviews Methods Primers上发表了关于计算机科学如何辅助合成设计的综述,系统阐述了计算机在预测反应性,优化反应条件以及合成路线设计等方向的应用。(点击文末查看原文跳转)
    上图是一个基础的实验优化系统的逻辑图,首先由高通量反应器进行一系列反应以获得数据,接着在线监测产物的光谱数据,使用支持向量机对数据进行划分,得到的数据集用以训练模型,进而重新设计实验,如此循环,直到得到优化后的实验条件。
    为了让计算机能够识别分子的结构,一般使用SMILES式来进行存储与识别,而这只是自动化合成的第一步。
    自动化合成的核心是利用工作流串联各个系统,使得机器能够自动化的完成识别、分析、优化等一系列操作。这一工作流包含了高度智能的逆合成分析系统,自动合成设备,数据分析与模型训练系统,目前已经能够以较高的产率(高于人工合成)得到一些路线较为简单的药物,还没有对于复杂药物高产率合成的报道。
    而在2019年发表在Science的Cronin教授的研究成果使用化学编程语言驱动的“Chemputer”,能够完成从化学信息提取到产物合成的一系列流程。
    Chemputer的设计逻辑如下,将常规的反应操作转化为语句,从而用代码指导自动化合成仪器。
    不过目前来看,自动化合成还只限于简单分子和较常规的合成步骤,还并不能完全代替人工操作。
    除了自动化合成外,我们更关注的是计算机技术如何辅助合成工作。很多时候,我们在实验室里设计一个反应,花费了数天的时间去尝试、分离,也不过是探索了这个空间中的寥寥数点,事实上,即使是做方法学研究,尝试数十个乃至上百个条件,对于该反应的整个化学空间而言也不过是沧海一粟。
    一个对于Suzuki–Miyaura反应的研究表明,使用3456个反应构成的训练集训练出的神经网络在1728个反应的测试集中的方均根误差仅为11%。利用机器学习模型对反应空间中未探索的部分进行评分,选出下一批得分最高的候选对象,并对照真实产率进行模型评估。 
   初始随机猜测的平均产率为39%,标准差(s.d.)为27%,如图c中的黄色条形(Bar)所示。绿条表示机器学习算法选择的100个后续反应。例如,第一批100个反应的平均产率为85%,s.d.为14%。后续的实验包括了更高比例从非活性区域选取的样本。这些结果表明,只需要进行总反应数的10%,我们就可以使用机器学习模型预测其余90%的结果,而无需进行实验。(Perera, D. et al. A platform for automated nanomole-scale reaction screening and micromole-scale synthesis in flow. Science 359, 429–434 (2018).

更多内容点击下方链接阅读!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
Nature | 突破优化合成反应瓶颈,机器学习提供新思路!
【Nature 封面论文】机器学习掀起材料革命,人工智能或将颠覆人类科研方式
人工智能和机器学习在药物发现中的应用
复旦大学、中国科学院团队综述,化学机器学习:基础知识和应用
Nat. Commun.| 从化学反应文本表示中探究实验过程
AI击败化学家?——《Nature》封面文章报道机器学习方法,或掀起化学科研革命
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服