打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
JACS Au|基于深度学习发现用于寡核苷酸递送的细胞穿膜短肽

2021年10月6日,Journal of the American Chemical Society Au杂志发表文章,介绍了一种利用深度学习设计细胞穿膜肽(CPPs)的方法。

以下是全文内容。

1.研究背景

将治疗性大分子输送到细胞内靶点是一个主要的挑战。例如,二胺吗啉代寡核苷酸(PMOs, >6500 Da)是合成的反义寡核苷酸,能与核酸强结合。Exondys 51 (eteplirsen)是2016年首个获得批准的PMO疗法,是治疗杜氏肌营养不良症(DMD)的一项突破,通过改变表达抗肌萎缩蛋白的mRNA的剪接过程起作用。PMO必须到达靶组织的细胞核,才能达到其遗传靶点并发挥其治疗作用。尽管一些反义寡核苷酸已获得美国FDA的批准,但这些合成生物聚合物临床进展的主要障碍是它们的细胞渗透性差。

通过共价附着于细胞穿膜肽(CPPs)传递PMO已经被广泛研究。CPPs是一类能携带大分子物质进入细胞的短肽,其穿膜能力不依赖经典的胞吞作用,它们的长度一般不超过30个氨基酸且富含碱性氨基酸,氨基酸序列通常带正电荷。CPPs可以通过共价连接或在带负电荷的寡核苷酸情况下通过形成非共价纳米颗粒复合物来增强传递。由于膜亲和和有效质子化的差异,聚精氨酸多肽被证明比其他阳离子残基更能促进细胞吸收,但聚精氨酸 PMO-CPPs 临床转化的主要挑战之一是它们在体内由肽部分引起的毒性。

尽管人们对CPPs进行了广泛的研究,但由于研究结果不一致,其结构-功能关系仍不清楚,这使得独特的高活性CPPs的合理设计面临挑战。这些实验的不一致部分是由于CPPs的性能依赖大分子物质、细胞类型和处理条件,这意味着没有普遍适用的CPPs。

作者报告了一种基于深度学习模型发现CPPs的方法,并从中挑选出了一个短肽P6,只含有一个精氨酸残基。肽P6具有广泛的体外治疗指标和能够传递阴离子酶的细胞质。最后,PMO−P6能够在单次静脉给药后恢复体内蛋白质合成,且没有肾脏毒性。这些结果表明使用长序列PMO−CPPs训练的机器学习模型可以设计优化精氨酸数量更低的短序列CPPs(<20个残基),且能够以高效和最小的毒性将PMO输送到动物细胞的细胞核。

2.结果

2.1 基于机器学习的模型设计

为了生成序列,作者重新利用了之前为设计核靶向非生物微蛋白而开发的机器学习模型,以优化短CPPs。如图1A所示该模型包括起始序列的生成、活性预测器和用于改进序列活性的优化器。

模型使用由600个独特的PMO−肽偶联物组成的嵌合文库进行训练,并在基于活性的试验中进行测试,PMO传递到细胞核会产生荧光,通过流式细胞术测量(图1B,C)。该模型通过增加预测活性,同时最小化长度和精氨酸含量来优化序列,以减轻潜在的细胞毒性。输出的是数百个全新设计的序列,其中包含了具有广泛预测活性的非自然氨基酸。作者之前的研究结果显示,高活性序列长度达到40 ~ 80个残基。在这项工作中,作者证明了机器学习策略可以用于预测PMO传递的高活性、短序列(<20个残基)。

图1:在长序列(>20个残基)上训练的深度学习模型可以用于预测高活性短序列(<20个残基)。(A)设计CPPs模型方案。(B) PMO−CPP共轭物的结构。(C)用于量化PMO传递活性的基于活性的体外试验示意图。为了产生荧光输出,PMO−肽必须进入细胞,逃离核内体,并定位到细胞核,PMO在那里实现外显子跳跃活动。

2.2 数据增强利于发现更短序列CPPs

由于原始模型使用的是由长序列(>40个残基)组成的训练数据集,作者使用数据增强来规避序列长度不平衡的弊端,并在短(<20个残基)CPP序列空间中外推预测活性。作者前期实验研究得到的数据集平均序列长度为41个残基,92%的序列长度大于20个残基。在这里,作者打算设计有20个或更少残基的序列(图2A)。

为了达到这一目标,在训练数据集中,作者将20个或更少留数的序列复制了9次,从而在期望的设计空间中显示了模型10x个序列(图2B)。这种数据增强是为了确保模型是在一个类似的序列空间中训练的,其中包含来自增强数据集的较短序列和来自训练数据集中已经存在的更高活性的较长序列。这种方法需要注意的是,在较短的序列空间中序列的多样性没有改变,尽管长度域已经向下移动到较短的残基。

图2:数据增强改进了20个或更少残基序列的设计发现。(A)训练数据集中653个序列中有601个序列大于20个残差(散点图)。剩余数小于或等于20的序列的期望设计空间用橙色表示。(B)序列的长度分布的原样和10倍增加序列的20余位或更少。(C) 10倍CNN模型集合预测了验证(蓝色)、测试(橙色)和实验(绿色)数据集序列的平均荧光强度(MFI)。

2.3 验证预测

作者让模型生成了长度逐步增加的最高预测活性序列(从5到20个残基),从中作者选择了13个序列进行分析,并选择了7个序列进行实验验证(图3)

这些序列包含0或1个精氨酸残基,与未偶联的PMO相比,预测活性增加4-11倍。值得注意的是,这些序列是阳离子序列,包含几个赖氨酸残基以及非天然残基 β-丙氨酸 (B) 和 6-氨基己酸 (X) 的延伸烷基骨架。可以看到,预测活性有明显的随长度增加的趋势。预测序列包含相似的共同基序,这表明该模型一致地将这些基序识别为高预测活性的潜在驱动因素。作者选择其中7个序列进行实验验证,通过对它们的长度排序并选择每一个其他序列(P1-P7,图3B)。

然后使用 HeLa 654 增强型绿色荧光蛋白 (EGFP) 检测验证 PMO-CPP 构建体,如图1C所述。传递的 PMO 量与功能性 EGFP 表达量相关,通过流式细胞术定量。该测定直接告知内化到这些细胞核中的 PMO 的数量。作为阳性对照,作者使用与 Bpep 结合的 PMO,Bpep 是一种高精氨酸含量的肽,其序列为 RXRRBRRXRRBR,已被广泛研究用于 PMO 递送。

被选中的结构在18-mer,P6之前表现出活性的长度依赖性增加。如图3A进行的 EGFP 测定中测量的外显子跳跃活性的分析表明,PMO-P6 是表现出最高活性的缀合物,相对于未缀合的 PMO 增加了 23 倍。这种活性与标准结合物 PMO-Bpep(增加 24 倍)的活性相当,同时仅包含 1 个精氨酸残基。与数据集相比,很明显 P6 更短,精氨酸残基更少,同时比数据集中的任何序列具有更大的活性(图 3C)。虽然具有最少数量的精氨酸残基,但预测序列仍然是聚阳离子的,并且都包含一个寡聚赖氨酸 N 端。PMO 与这 7 种预测肽的偶联物中表现第二和第三好的是 PMO-P4 和 PMO-P5,其活性相对于未偶联的 PMO 分别增加了 8 倍和 9 倍。其余的偶联物显示出 6 倍或更低的增加。

图3:GAN结构(A);CGAN结构(B)

2.4 丙氨酸突变揭示了序列−活性关系

作者利用丙氨酸扫描发现,P6的C端半胱氨酸残基是该肽高实验活性的部分原因。P6 和 P5 的序列分别是表现最好的和次好的,除了少数位于 C 末端的氨基酸外,它们的序列是相同的;P6 包含一个 KXXC 主题,而 P5 包含一个 MG 主题。尽管有这种相似性,P6 的活性比 P5 高出近 3 倍。

作者假设 KXXC 基序或该基序内的特定残基的存在可能是 P6 活性的原因。为了验证这一假设,作者用丙氨酸残基替换了 KXXC 基序中的每个残基,并完全删除了 KXXC 基序(P8-12,图4)。将每个P6类似物偶联到PMO后,作者进行了HeLa 654 EGFP检测,以检测PMO传递的活性。PMO−P8到PMO−P11的活性表明,在KXXC基序不同位置的丙氨酸突变中,只有最后位置的半胱氨酸突变导致活性显著但不完全下降。这一观察结果表明,虽然PMO−P6的高活性不完全是由C端半胱氨酸引起的,但C端半胱氨酸有助于摄取。

作者观察到与PMO−P8相似的截断序列的活性下降,仅略高于PMO−P5,这再次表明半胱氨酸残基是最关键的C末端残基。作者假设阳离子基序可能是PMO−P6活性增强的原因,包括在N端出现的戊氨酸链或单个精氨酸残基。并用1、2或3个赖氨酸取代丙氨酸残基,以及单个精氨酸残基(P13−P19,图5)。作者观察到,当N -末端的赖氨酸残基被丙氨酸残基取代时,对活性有显著影响。基序中多于一个赖氨酸的突变将活性降低到近5倍(PMO−P16至PMO−P18),唯一的精氨酸残基的突变(PMO−P19)也是如此。

结果表明,虽然没有单一的残基对P6的高活性负有责任,但阳离子残基可能对活性的贡献最大。然而,尽管P5和P6的阳离子序列相似,但它们的活性却存在巨大差异,这表明P6的高活性依赖于其独特的序列。

图4:含cys的氨基己酸C端对pmo−P6活性的影响较小。(A) P6,突出KXXC C端残基。B为丙氨酸,X为6-氨基己酸。(B) EGFP测定的各种突变序列的活性,报告为相对于PMO单独的荧光。如图所示是一个具有代表性的实验,其生物学复制显示在支持信息中。(C) B部分活性对应的Ala突变序列表,以及每个序列相对于PMO单独的净电荷和活性。

图5:序列-活性研究揭示了PMO-P6递送效果对赖氨酸残基的依赖性。(A) P6,突出阳离子N端残基。B为丙氨酸,X为6-氨基己酸。(B) EGFP测定的各种突变序列的活性,报告为相对于PMO单独的荧光。如图所示为具有代表性的试验,支持信息中显示了生物学重复。(C) B部分活性对应的Ala突变序列表,以及每个序列相对于PMO单独的净电荷和活性。

2.4 活性和毒性的浓度反应

PMO-P6及其截断衍生物PMO−P12具有浓度依赖性的活性,但在体外仍是无毒的。作者通过测量体外活性和毒性的浓度−反应进一步研究了这两个序列(图6A,B)。通过测量每个偶联物在HeLa 654细胞中沿浓度范围(0.1 ~100μM)的EGFP荧光,计算出半最大有效浓度(EC50)。PMO−P6的EC50值为4μM,在25μM时活性达到PMO的40倍。PMO-P12的EC50为7μM,在50μM时活性达到30倍。因此,PMO−P6比其截断的衍生品PMO−P12略显活跃。

然后,作者测量了PMO-P6和PMO-P12毒性的浓度反应。采用乳酸脱氢酶(LDH)释放试验评估膜毒性细胞上清中检测到的胞质LDH表明膜渗透。毒性以细胞与洗涤剂十二烷基硫酸钠(SDS)充分溶解的百分数表示。

研究首先检测了用于浓度-反应活性试验的HeLa 654细胞的细胞上清,在测试的浓度下没有发现毒性,这表明观察到的传递活性不是由于膜的渗透作用。然后,作者分析了肾上皮细胞(TH1 RPTEC)中更广泛的浓度范围,因为多阳离子序列有时会导致体内肾毒性。作者测试的PMO−P6的浓度范围在1 ~ 200μM之间,PMO−P12的浓度范围在5 ~ 400μM之间(图6A、B)。在100μM浓度下,PMO−P6的半数致死浓度(LC50)被观察到,在50μM浓度下,毒性可以忽略不计。PMO−P12的LC50为220μM,当浓度低于100μM时,毒性可以忽略不计。

这些数据表明,这些结构在体外的活性和毒性之间存在一个较大的浓度窗口,PMO−P12的体外窗口略大,为30,而PMO−P6的体外窗口为25。PMO-P6 C端KXXC基序的消除略微降低了活性,这表明PMO-P12的毒性较小,而机器学习设计的PMO-P6更有效。

图6:PMO−P6和PMO−P12诱导浓度依赖性的活性,在体外具有低毒性。在HeLa 654细胞中使用不同浓度的EGFP测定活性,并以相对于单独PMO的荧光表示。使用不同浓度的LDH释放试验测定TH1 RPTEC细胞的毒性,以LDH释放量相对于SDS完全溶解的细胞的百分比表示。

2.5 吸收机制

作者使用化学内吞抑制剂研究了 PMO-P6 和 PMO-P12 的细胞进入机制。作者使用一组化学内吞抑制剂:Chlorpromazine, Cytochalasin D, Wortmannin, EIPA, 和Dynasore。研究了 HeLa 654 细胞中 PMO-P6 和 PMO-P12 的内化机制。

图7表明网格蛋白介导的内吞作用可能是占主导地位的吸收机制。PMO-P6和PMO-P12通过相似的机制进入HeLa 654细胞,可能是受体介导的内吞作用。

图7:PMO−P6和PMO−P12通过类似的机制进入细胞。该图显示了内吞抑制剂使用PMO−P6和PMO−P12传递PMO的效果。

2.6 递送阴离子

除了递送反义寡核苷酸外,P6还可以递送一种阴离子的活性酶。白喉毒素a (DTA)是白喉毒素的一段21 kDa的阴离子蛋白,含有毒素的催化结构域,但缺少进入细胞的部分一旦进入细胞质,这种毒素会抑制蛋白质的合成并杀死细胞。

3.总结

设计细胞穿透肽传递特定的大分子物质是一个长期的挑战。在这里,一个在较长的序列(>20个残基)上训练的机器学习模型,推动了一个短的、低精氨酸含量的肽(<20个残基)的发现,该肽能有效地将PMO输送到细胞的细胞核。这种18-mer阳离子肽(P6)在其序列中含有一个精氨酸残基,可在体内传递PMO。

需要注意的是,这里使用的机器学习模型是用由长序列组成的PMO−CPP库训练的,其中绝大多数是已知CPPs的线性组合。然而,由于作者的模型能够外推训练集以外的预测,我们能够产生独特的短,低精氨酸肽,以前没有遇到过。在预测肽段的实验验证过程中,设计有效CPP序列的挑战变得显而易见。研究观察到18个残基的活性呈长度依赖性增加。而P5(C-terminus: MG)和P6 (C-terminus: KXXC)这两种仅在C-末端区域存在差异的预测肽段的实验活性却有显著差异,前者的活性约为后者的三分之一。数据增强能够略微提高活性预测的准确性,但需要更多的工作来更准确地设计和预测独特的反义传递短肽。

本文讨论的设计策略有望用于生成能够将除反义寡核苷酸以外的大分子输送到细胞中的肽序列,并且可能适用于具有合适训练数据集的其他功能肽的设计。 改进 PMO-CPPs数据库合成和测试以访问更广泛的序列和活性可能是改进机器学习引导的高效肽序列发现的一种策略。

参考资料

Eva M. López-Vidal,Carly K. Schissel, Somesh Mohapatra, Kamela Bellovoda, Chia-Ling Wu, Jenna A. Wood, Annika B. Malmberg, Andrei Loas, Rafael Gómez-Bombarelli, Deep Learning Enables Discovery of a Short Nuclear Targeting Peptide for Efficient Delivery of Antisense Oligomers , Journal of the American Chemical Society Au.

https://doi.org/10.1021/jacsau.1c00327

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Nat. Chem. | 通过深度学习设计靶向核的非生物微蛋白
抗菌肽和细胞穿膜肽——本是一对好CP(cationic peptide)
如何深入研究一个基因家族!
如何通过CHIP-seq分析鉴别基因启动子和增强子
植物环肽生物活性及其作用机制研究进展
生物活性肽:功能性化妆品的应用和相关性(上)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服