打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Nat. Mach. Intel. | 智能与模拟计算双驱动加速PROTAC药物研发
userphoto

2022.09.16 韩国

关注

蛋白降解靶向嵌合体(PROTACs)作为一种新兴的治疗策略,通过招募泛素-蛋白酶体系统降解致病靶蛋白,具有攻克“不可成药”靶点的巨大潜力。然而,PROTAC分子三元组结构特性导致其较高的分子量进而使其成药性的优化变得极具挑战。中山大学国家超算广州中心杨跃东教授联合星药科技研发团队,依托“天河二号”借助超算、AI和生物制药的交叉研究背景,充分结合基于强化学习的分子生成和基于物理的分子模拟技术,在短短49天内就发现了具有高降解活性及高药代性能的新型先导化合物,并完成湿实验验证。该研究对PROTAC设计以及成药性优化具有重要意义,相关成果于9月15日正式发表在国际权威期刊《Nature Machine Intelligence》。

突破 “不可成药”靶点,PROTAC理性设计存在挑战

自2001年首次对蛋白分解靶向嵌合体(PROTACs)进行概念验证以来,PROTACs已成为通过泛素-蛋白酶体系统选择性降解靶蛋白的有效工具。PROTACs包含三个部分:一个针对靶蛋白质(POI)的配体(亦称弹头),一个招募E3泛素连接酶的配体,以及一个连接两个配体的化学连接体。由于这种双功能结构,PROTACs有能力同时结合靶蛋白和E3泛素酶,形成一个三元复合物,促进靶蛋白的多泛素化和降解。因此,PROTACs只需要短暂地与目标蛋白结合就能诱导泛素化和降解。此外,由于PROTACs不需要占据可药用的活性位点,因此有可能利用目标蛋白的所有表面结合位点以调节“不可成药”靶点。然而,PROTAC的设计和优化仍需要基于经验主义的反复迭代优化,这种开发策略存在严重的局限性。

在PROTACs的开发过程中,最棘手的是如何选择合适的连接基团形成合适的PROTAC活性三元复合物从而发挥降解活性和靶点选择性。由于三元结构的复杂性和动态性,连接基团的设计往往是一个艰巨的挑战。连接基团的长度、组成、柔性、连接位点都会对结果造成巨大影响。另外一个设计挑战则来自于PROTAC分子往往不符合口服药物常见的性质。作为一种多组分分子,其较大的分子量导致其相比于传统小分子有着溶解度差、渗透性差、生物利用度低以及不可预测的Hook效应等问题,从而阻碍了PROTACs的临床转化。如何在有限的条件下理性优化PROTAC分子以克服这些缺点,是目前该领域的重大难题。

基于PROTAC-RL优化方法,

仅49天发现新型先导化合物

为了解决这一问题,研究团队提出了一种基于深度生成模型的PROTAC理性设计算法——PROTAC-RL。该模型以一对E3配体和弹头作为输入,输出设计好的连接物,并在强化学习(Reinforcement Learning, RL)的引导下生成具有特定性质的PROTAC分子。具体而言,研究团队首先用Transformer神经网络预训练了一个连接子生成模型。为了克服PROTAC训练数据少的问题,该模型先使用了大量与PROTACs具有相似化学空间的类PROTAC分子做预训练,再通过真实的PROTACs及增强数据进行了模型微调。随后将训练好的模型结合到一个具有经验奖励功能的记忆式强化学习模块中,以产生具有更好药代动力学属性的PROTACs。作为概念验证,研究团队选择了BRD4作为靶蛋白并生成了5000余个PROTACs,依托超算通过机器学习打分器和分子动力学模拟方法对这些虚拟分子进行了进一步聚类和筛选。根据合成可及性,研究者最终挑选、合成并实验测试了6个PROTACs,其中3个显示了对BRD4的抑制性活性。其中一个先导化合物同时显示出对肿瘤细胞系的高抗增殖效力,并在小鼠中表现出良好的药代动力学(图1)。基于国家超算广州中心生物医药应用平台、大规模并行分子动力学模拟方法以及用于深度学习模型训练的海量GPU算力,整个过程仅消耗了49天,证明了超算、深度学习和分子动力学的结合能够促进高效的理性PROTAC设计和优化。

图1. PROTAC-RL流程示意图

对比实验显示,

PROTAC-RL模型的复现率、新颖性上表现优越

PROTAC-RL模型由两部分组成,基础生成模型Proformer和成药性强化学习模型RL。在评估Proformer的工作中,研究人员首先将PROTAC数据集以8:1:1的比例进行切分,分别用于训练、验证和测试。对于弹头和E3配体的每个测试对,生成10个候选PROTACs,并使用复现测试集真实PROTACs的百分比(复现率)来评估性能。研究者将Proformer与其他最先进的片段连接方法进行了比较,包括基于图学习的方法Delinker、基于序列的方法Syntalinker、以及它们在PROTAC训练集上的重训练版本。如图2-A所示,Proformer达到了43.0%的复现率,明显优于现存最好的基线方法。其生成的分子相比于其他方法也和PROTAC的真实化学空间更加相近(图2-B)。消融实验(图2-C)再一次证明模型设计的合理性。配合强化学习后,PROTAC-RL模型生成的分子打分也远高于其他模型变体(图2-D)。在一个挑选的案例中,PROTAC-RL模型可以随着目标分数设定的不同生成出特定性质的连接基团(图2-E&F)。总的来说,与其他方法相比,PROTAC-RL模型在复现率、有效性、独特性和新颖性等表现上都有着优越的表现。

图2. PROTAC-RL与最新预测方法的比较结果以及消融实验的结果。

针对BRD4进行PROTAC设计,

确认了6个候选分子进行合成和验证

BRD4是一种表观遗传调节因子,在癌症发展过程中起着关键作用。虽然利用PROTAC进行BRD4研究的工作很多,但目前仍未有一款候选药物成功推入临床,这主要是由于其药代动力学和毒性的问题。为了验证PROTAC-RL在药物实践开发中的性能,作者利用PROTAC-RL生成了5000余个具有较好药代动力学的虚拟分子,经过机器学习筛选,分子动力学模拟评估,结构聚类,可合成性分析及专利检索,最终确认了6个候选分子进行合成和验证。

研究者首先利用免疫印迹实验检测其蛋白质降解能力。其中化合物1、2和3显示了降低了BRD4蛋白的活性。研究者们进一步研究化合物1、2和3对Molt4细胞的体外抗增殖作用。如图4A~C所示,这些化合物对Molt4细胞系显示出不同程度的抗增殖活性,其中化合物1、2和3的IC50值分别为116nM、5.1μM和21μM。除了活性之外,研究人员进一步评估了化合物1对hERG通道的抑制作用,发现化合物1对hERG的抑制作用很低,仅为27.4μM,证明其无显著心脏毒性。此外,化合物1表现出良好的理化性质,logS为1.42,logD为3.27。

由于PROTAC-RL主要用于优化PROTAC的药代动力学特性,我们在动物模型上进一步测试了化合物1,将化合物1给小鼠腹腔注射(2mg/kg)。三次给药的半衰期相似,约为2.22小时(图4D)。腹腔给药在初次给药时达到194纳克/毫升的血浆浓度峰值(Cmax)。这比阳性参考化合物dBET6有明显优势,dBET6的Cmax只有176纳克/毫升,半衰期为0.52小时。这些结果证明化合物1是一个强有力的BRD4降解剂,且具有良好的药代动力学。

图3:生物活性测试和药代动力学测试。

总结

本研究报告了一个自动化的计算框架,该框架结合了强化学习驱动的深度生成模型、机器学习和分子动力学模拟,用于合理地设计和优化PROTACs。在一项针对BRD4靶点的案例研究中,研究团队在49天内以50%的成功率发现了三个具有良好的降解效应的PROTAC分子,其中一个具有良好的药代动力学性质,进一步证明了将超算、人工智能驱动的计算策略与实验相结合是获得有效候选药物的重要手段。

参考资料

Zheng, S., Tan, Y., Wang, Z. et al. Accelerated rational PROTAC design via deep learning and molecular simulations. Nat Mach Intell (2022). 

https://doi.org/10.1038/s42256-022-00527-y

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
【深度学习】基于深度学习和分子模拟加速PROTAC的理性设计
PROTAC—小分子化合物蛋白降解技术 |
PROTAC酪氨酸激酶 BRD4/小分子靶向诱导蛋白降解技术PROTAC技术
PROTAC靶向蛋白降解技术浅析(转)
PROTAC 降解剂化合物库 | MedChemExpress
JCIM|RJT-RL:一种基于化合物的可逆树表示和深度强化学习的分子设计方法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服