打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【化学信息学】不对称催化对映选择性的整体预测
userphoto

2022.08.17 北京

关注

近期,来自美国犹他大学的Matthew S. Sigman课题组在Nature上发表题为"Holistic prediction of enantioselectivity in asymmetric catalysis"的研究论文,用回归分析预测不对称催化反应的对映选择性及解释潜在的分子机理。

背景——

在不对称催化中,底物,亲核试剂或者催化剂结构的微小变动都可能会对反应的对映选择性产生很大影响。当化学研究者遇到不熟悉的反应时,往往是通过底物的相似性搜索找到报道过的反应条件。但是,由于相似性搜索并没有从机理上考虑反应的可行性,这种尝试很多时候会失败。为此,作者希望构建一个研究反应机理与反应结果关系的模型,从而可以回答以下问题:(1)是否可从机理出发来研究泛化能力;2)能否用数据驱动的workflow结合分子描述来给多样化的反应构建一个统计模型;3)从某些反应上观察到的条件能否用来预测其它反应。这样的workflow可以合理的解释为什么特定的条件对某些广泛的反应类型是有效的,同时可以定量的把学到的化学知识迁移到样本以外的预测。分子描述符对于阐述有机反应机理有其独特的作用。通过整合QSAR,分子力学和DFT方法衍生的分子描述符,可以建立反应之间的泛化关系。而且,通过测试模型在新的反应类型上的预测表现,可以验证统计模型的机理迁移能力。

1. 应用机理迁移的workflowa. 机理迁移。BINOL衍生的磷酸催化的亚胺的亲核加成反应作为例子。b. 预测的工作流程。1、收集数据;2、计算分子描述符;3、构建回归模型;4、知识迁移预测。揭示不同反应成分在过渡态和对映选择性的相互作用。统计模型学到的导致对映选择性的机理知识可以迁移到训练集以外的反应。

——反应平台选择——

作者选择BINOL衍生的磷酸(尤其是3/3′号位携带芳香性官能团的)催化的亚胺的亲核加成反应作为proof-of-concept的例子。因为该反应广泛应用于不对称催化,数据来源广泛。作者从发表的论文中收集到了367个反应作为总的数据集。根据亚胺的过渡态构型,分为E/Z-亚胺。其中E/Zee值分别为+/-模型不能预测产物的手性,但可以判断反应是以E还是Z型机理进行。同时,作者通过DFTM06-2X/def2-TZVP)优化过的结构来计算反应涉及到的亚胺、亲核试剂、催化剂和溶剂的分子描述符。值得注意的是,由于不同反应成分的结构差异较大,选取的分子描述符也是有较大差异的。比如,对于反应物和催化剂,Sterimol (Sterimol描述符有LB1B5三个参数,分别代表取代基的长度,最小和最大宽度)、键长、分子振动频率和强度、NBO电荷、极化率、HOMOLUMO等描述符而对于结构上差异很大的溶剂,则更多采用分子大小、杂原子的数目等二维拓扑描述符。而浓度和分子筛等则可用分类描述来表示。

——全面的模型发展——

如图2所示,作者首先采用多重线性回归对367个反应找出描述符与实验测定的%ee值之间的相关性。根据

,其中e.r.表示enantiomeric ratio,找出预测的与实际的的相关性。模型将亚胺、亲核试剂、催化剂和溶剂四个组分的贡献分布在6个描述符中(只保留贡献最大的这几项),R20.88其中'NBON的权重最大,表示亚胺的NBO描述符对对映选择性的结果影响最大。

2. Comprehensive model development. a. 涵盖367个反应数据的回归模型,’sol’代表溶剂项,’NBON和'NBOC’  是亚胺的自然键轨道(natural bond orbital, NBO)成分。LS是亚胺的最小取代基的位阻描述符,'H–X–CNu’则是亲核试剂的键角,Lcat则是催化剂的2号位取代基的长度。+/-%ee分别表示采用E/Z-亚胺过渡态。b. 通过leave-one-reaction-out (LORO) 测试模型的机理迁移能力c. 回归方程各项的可视化和解读。

——趋势分析——

尽管图2描述了一般情况下的总的机理概述的影响,作者最后想达到的目的是识别潜在的分子机理。于是作者将反应分为E/Z-亚胺(204/147)两个不同数据集,分别训练构建两个回归模型。对于E-亚胺模型,亚胺倾向于采用一个与合适大小的催化剂取代基的排斥能最小的排列方式。比较令人惊讶的是,亲核分子的空间构型对立体选择性结果影响很小。而且,亲核试剂的LUMO和催化剂P-O不对称伸缩振动的强度表明催化剂和亲核试剂的氢键作用对结果是有负面影响。对于Z-亚胺模型,催化剂的Sterimol描述符的B1 (描述取代基的最小宽度)和亚胺的NBO轨道(特别是描述近端位阻与亚胺的N端取代基的排斥能)是Z-过渡态亚胺构型形成的关键的催化剂-底物相互作用。E/Z-模型最大的不同是Z-模型包含了亲核试剂的位阻描述符(B5Nu),在回归方程中的比重相当大。这表明亲核试剂越大,与催化剂取代基的排斥能越大,从而导致了Z-产物比例越少。

3. Development of focused correlations. a. E-亚胺的回归模型包含204个反应。’CI’和 'PEOE5’是溶剂的描述符,'B5PGLl是亚胺的位阻描述符,LUMO表示亲核试剂的LUMOLcat则是催化剂的2号位取代基的长度。'iPOas是催化剂P-O不对称伸缩振动的强度,'AREA’表示远端的取代基与磷酸中心的角度。b. E-亚胺模型的可视化解释,可以看出位阻和电子效应对E-亚胺过渡态的形成都很重要,而且在合理范围内,催化剂和亚胺取代基越大,+% ee值越大。c. Z-亚胺回归模型包含147个反应,'NBOH’ and 'NBOPG是亚胺的NBOLS是亚胺的最小取代基的位阻描述符。'B5Nu是亲核试剂Sterimol描述符的B5项,'B1cat是催化剂的Sterimol描述符的B1项。d. Z-亚胺模型的可视化解释,描述催化剂和亚胺位阻项的重叠强化了相似的相互作用。然而,Z-亚胺模型强调了来自亲核试剂的位阻项对-% ee的影响。

——模型预测能力评估——

作为workflow的最后一步,作者探究了模型的迁移能力即当反应成分不同于训练模型时,模型的预测结果是否还可靠。这样的话,模型就可以预测出新亚胺、亲核试剂或者催化剂对反应结果的影响。评估的策略是:首先用comprehensive模型来预判反应的机理通道。然后再用具体的E/Z-模型来精炼预测结果。这两个层次的workflow可以避免先验的机理假设。Comprehensive模型并不给出具体的立体化学结果,但可以通过图4的简单模型来确定产物的构型。这里是假设胺产物是由(R)-CPA催化通过E或者Z过渡态得到的。若用(S)-CPA则结果相反。

第一个case study,作者探究了enecarbamates(一种不在训练集中的亲核试剂)和苯甲酰亚胺(在训练集中)的15种加成反应。先用comprehensive模型,得到平均

0.37 kcal mol−113个反应预测误差在5% ee之内),且立体都准确预测为R,说明该策略可以泛化到新的亲核试剂。当使用E-亚胺模型时时,误差为0.24 kcal mol−1(所有反应预测误差都在5% ee之内)。

第二个case study,作者探究了H8-BINOL催化的炔基酮亚胺的加氢反应。这个例子的预测更难,因为亚胺和催化剂都不在训练集中。类似第一个例子的分析,Z-亚胺机理模型的误差为0.30 kcal mol−113个反应预测误差在2% ee之内)。

最后一个case study,作者探究了苯甲酰亚胺和硫醇的加成反应。该反应此前曾被报道用来预测高选择性手性催化剂(详情请查看【化学信息学】机器学习驱动的高选择性手性催化剂预测)。作者把涉及到的该反应的成分都移除出训练集,然后重新训练模型来预测Denmark等人的选择性最好的催化剂的结果。comprehensive模型,误差为0.65 kcal mol−126个反应预测误差在5% ee之内)。E-亚胺模型误差则为0.67 kcal mol−125个反应预测误差在5% ee之内)。通过以上例子可以看出,大多数情况下E/Z-模型可以给出更准确的预测,但是comprehensive模型能确定是采用哪个方程来解释结果。

4. 样本外预测的workflow: 先用comprehensive model预测E or Z-过渡态,再分别用E/Z-模型refine预测结果。a. 样本外的预测。右上分别为Enecarbamates与苯甲酰亚胺的加成反应,以及炔基酮亚胺的加氢反应。b. 样本外的预测。苯甲酰亚胺和硫醇的加成反应。

——小结——

总的来说,本文的作者介绍了一种预测对映选择性和分子机理的workflow ,通过训练模型,复杂的反应条件可以用来解释反应对映选择性的结果。作者可以用一个模型来关联和预测对映选择性,这表明过渡态的特征在一系列反应中都是类似的,所以结果可以迁移到差异较大的反应条件中(从三个case study可以看出模型的泛化能力是很不错的)。当然,本文还只是用BINOL作为例子,目前还不知道对于数据量更少的其它催化剂,模型的效果如何,但确实值得期待一个可以泛化到所有常见催化剂的模型。

参考文献:

Reid, J.P., Sigman, M.S. Holistic prediction of enantioselectivity in asymmetric catalysis. Nature 571, 343–348 (2019)

doi:10.1038/s41586-019-1384-z

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
Chem. Sci.:北卡罗来纳大学教堂山分校Alexanian课题组实现可见光/钴催化的(杂)芳基卤化物的酰胺化
每周一个有机反应机理(七)
【基础操作】投反应如何加料?
偶联反应
Friedländer(弗里德兰德)合成喹啉反应——邻氨基苯甲醛或酮和含有羰基亚甲基原子团醛或酮生成喹啉衍生物的反应机理
常见光催化剂
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服