打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
改变5'UTR结构,控制翻译效率

大家好,我是荷锄。春雨新绿,阳光明媚,困于家中,无可奈何。相信很多朋友也是如此,那就让我们继续在mRNAFactory系列中(第7篇),纸上谈兵,闭门造车

mRNA技术,打个不恰当的比喻,就是我们输入一段代码,让细胞自己生产蛋白,整个流程大致可以分为“代码设计”,“传输代码”,“识别代码”。现在很多关注点,都聚焦在“传输代码”上面,毋庸置疑,输送是非常关键的,尤其是高效特异性的靶向输送,但输送不是目的,最关键的是这段代码到底能不能高效地在细胞内被识别。这就好比,你用宝马拉了一个脑子不怎么灵光的年轻人到厂里,干起活来磕磕绊绊的,倒不如让老师傅骑着他的自行车过来。所以说,一切的源头在代码设计,即mRNA序列设计,序列设计又包括5'UTR,CDS序列,3'UTR,而其中对翻译效率影响最大的当属5'UTR序列。只有了解5'UTR是如何发挥作用的,我们才能设计出高性能的序列。那么,今天就让我们一起来看看,mRNA 5'UTR序列到底是如何来影响蛋白翻译效率的?

翻译起始

真核生物翻译起始是一个非常复杂的过程,涉及多种翻译起始因子。从油管上面找到一个讲解细致的视频,大家可以仔细看看,看完基本上对翻译起始会有一个大致整体的了解。


简单来说,mRNA翻译起始过程由募集核糖体和扫描起始密码子构成,一旦找到起始密码子,翻译便延伸下去。43S前翻译起始复合物由40S小亚基,eIF3,eIF1, eIF1A,eIF5,eIF2-GTP-met-tRNA组成。真核生物翻译起始因子eIF4F是一个蛋白复合物,介导将核糖体募集到mRNA的过程,包括识别帽子结构(eIF4E),解开5'UTR二级结构(eIF4A),桥连核糖体和mRNA(eIF4G),与PABP相互作用首尾环化mRNA(eIF4G),提高eIF4A解旋酶活性(eIF4B)。43S前翻译起始复合物PIC(43S pre-initiation complex)和eIF4F起始因子复合物的结合是翻译起始的主要限制性因素。除细胞内外各种因素通过对eIF4F活性的控制影响翻译起始速率,mRNA 5'UTR二级结构会影响核糖体的募集过程和起始密码子的扫描过程,因此5'UTR对于蛋白翻译效率来说是非常重要的。

Kozak理论

二级结构稳定性和AUG位置影响翻译

在上世纪八九十年代,Kozak做了一系列跟真核细胞mRNA翻译起始相关的研究,发现经典的Kozak序列(ACCGCCAUGG),证实核糖体扫描机制等一系列研究成果。在1986KozakPNAS发表文章Influences of mRNA secondary structure on initiation by eukaryotic ribosomes,设计各种发卡结构插入到报告质粒起始密码子AUG上游,证实mRNA5'UTR发卡结构会影响翻译效率。他发现,在Cos7细胞中,当mRNA 5'UTR区域存在中度稳定性的发卡结构-30kcal/mol)—即便起始密码子AUG位于发卡结构中且形成配对碱基,对翻译效率不会造成影响;然而,当mRNA 5'UTR区域存在高度稳定性的发夹结构-50kcal/mol)—即便高度稳定性的发卡结构远离帽子结构或者起始密码子,会导致翻译效率减少85%-95%。此外,他还发现,如果5'UTR区域中第一个起始密码子背景序列是翻译起始所偏好的(比如CCACCATGG),那么不管第一个起始密码子是处于单链状态还是配对状态,翻译都不会从下游ATG起始,也就是说,上游ATG的存在,不管是否被包含到发卡结构内,都会抑制翻译从下游ATG起始

当存在高度稳定的发卡结构时(发卡结构不靠近起始密码子ATG)抑制蛋白翻译。
上游AUG(开放阅读框外)抑制翻译起始,无关是否形成发卡结构

二级结构稳定性和距Cap位置影响翻译

1989年,KozakMolecular and Cellular Biology发表文章Circumstances and mechanisms of inhibition of translation by secondary structure in eucaryotic mRNAs,通过兔子网状细胞体外翻译系统,进一步探讨mRNA二级结构稳定性和距离Cap的位置对翻译效率的影响。当发卡结构(-30 kcal/mol)距离Cap结构12nt抑制40S核糖体结合到mRNA上然而,当相同稳定性的发卡结构远离Cap结构 52nt对于翻译没有影响。这表明翻译对于mRNA核糖体结合位点处是否存在二级结构非常敏感,但是一旦40S核糖体结合到mRNA上,它便有能力穿越发卡结构。如果二级结构极度稳定-61 kcal/mol),距离帽子结构72nt,虽然不会影响40S核糖体亚基结合到mRNA上,但是,40S核糖体亚基会停滞在发夹结构的5'端,无法穿过。同时,他还发现80S核糖体能够解开二级结构,即便这个二级结构稳定性极高,对于40S核糖亚基来说,无法穿越。只有当5'UTR和3'UTR形成碱基配对时,才会抑制翻译,5'UTR和CDS区或者3'UTR和CDS区形成双键时,不会抑制翻译,因为80S核糖体熔解发夹结构的能力要强于40S核糖体亚基

只有当配对碱基处于非编码区时,互补配对的序列才会抑制翻译效率

二级结构和5'UTR长度影响翻译

1988年KozakMolecular and Celluar Biology发表文章Leader length and secondary structure modulate mRNA function under conditions of stress,在COS细胞中,发现5'UTR长度会影响蛋白翻译效率。在已注释的脊椎动物mRNA序列,75%的mRNA 5'UTR长度范围在20-100bp,25%的mRNA 5'UTR长度范围在100-300bp,而mRNA 5'UTR长度达到1000bp是非常罕见的。当时并不知道5'UTR长度和翻译效率之间的关系,Kozak发现携带存在二级结构的SV40 5'UTR 的mRNA,转染细胞后,其翻译效率对于渗透压非常敏感。在等渗培养基中,发卡结构的存在不会影响mRNA翻译效率,但是,在高渗培养基中(120-150mM NaCl),发卡结构的存在会完全中止蛋白质的合成。如果在mRNA 5'UTR区域中的二级结构上游插入一段非结构化的序列,翻译效率会得到显著提升,提升的程度跟插入的长度成正比例但是,如果在二级结构下游插入一段非结构化的序列,并不能中和发卡结构引起的翻译抑制效应。

在高渗培养基中,mRNA前导序列长度的增加会减弱发夹结构引起的翻译效率抑制效应。

beta/alpha-globin UTRs

1994年,KozakJ Mol Biol发表文章Features in the 5' non-coding sequences of rabbit alpha and beta-globin mRNAs that affect translational efficiency,利用兔子网状细胞体外翻译系统,首次发现alpha-globin mRNAs 和beta-globin mRNAs 5'UTR区域影响其翻译效率。beta-globin mRNAs具有非常高的翻译效率,而且并不会因为5'UTR序列碱基发生替换而减弱翻译效率,说明beta-globin mRNAs 5'UTR序列并不存在特殊的结构基序。但是,如果碱基的替换(引入富含GC的序列),形成靠近Cap 的二级结构,则会导致翻译效率的减弱。beta-globin mRNAs高效的翻译需要适当长度的5'UTR序列,缩短beta-globin mRNA的5'UTR序列会降低翻译效率。研究人员还发现,在体外翻译系统中beta-globin 5'UTR序列翻译效率强于alpha-globin 5'UTR序列,这可能是由于在beta-globin 5'UTR序列中,靠近5'末端缺乏二级结构,而在alpha-globin 5'UTR序列中存在二级结构。

beta-globin 5'UTR序列变化对翻译效率效率的影响
兔子alpha-globin 5'UTR可能形成的二级结构。

钱永健的发现

2006年钱永健RNA上发表文章Control of mammalian translation by mRNA structurenear caps,在Kozak的理论基础上,在哺乳动物细胞中(Cos细胞),进一步探讨mRNA5'UTR二级结构稳定性,与Cap之间的距离以及GC含量对蛋白翻译效率造成的影响

二级结构设计

设计7种不同的发卡结构,热力学稳定性在-10 kcal/mol到-50kcal/mol之间。每一种发卡结构被放置在距离Cap结构的位置范围+1,+4,+7,+10,+13,+16,甚至更远的+31,+46。为测试发卡结构GC含量对翻译效率的影响,设计4种发卡结构,插入CAA基序维系长度并且维持其热力学稳定性在-30 kcal/mol。CAA基序被认为无法形成二级结构,因此设计完全由CAA组成的序列作为无二级结构的对照组。预测的热力学稳定性可以通过试验测定的mRNA的熔解曲线来确定,趋势基本保持一致。

可以插入到双荧光报告系统质粒中的发卡结构

发夹结构稳定性和位置对翻译效率的影响

发卡结构稳定性距离Cap的位置会对翻译效率造成极其显著的影响。当发卡结构稳定性大于-35kcal/mol,翻译完全被抑制,跟Cap的距离已经无关。发卡结构稳定性从-25kcal/mol增加到-35kcal/mol时,翻译效率会发生断崖时下降。当发卡结构稳定性小于-35kcal/mol,翻译效率跟距离Cap的位置明显的相关性,例如,发卡结构距离帽子9个碱基的差异可以造成翻译效率50倍的差异。

从不同稳定性发卡结构的平均翻译水平来看,当发卡结构稳定性处于-10 kcal/mol—-20 kcal/mol时,翻译效率不会随着稳定性发生改变;到稳定性从-25 kcal/mol增加到-40 kcal/mol时,翻译效率会发生急剧下降。此外,当发夹结构(小于-35kcal/mol)所处位置的平均翻译水平来看,发夹结构距离帽子位置从0到+10时,翻译效率发生线性增加;发卡结构位置超过+10时,翻译效率开始下降。

发卡结构GC含量对翻译效率的影响

设计一组不同GC含量的发卡结构,但是维持长度和稳定性不变(-30kcal/mol),可以看出,随着发卡结构中GC含量的增加,翻译效率发生下降。GC含量52%的发卡结构和GC含量92%的发夹结构在翻译效率上相差18倍,而且通过RT PCR可以确定这种差异并不是由于细胞RNA的丰度差异造成的。

发卡结构GC含量对于哺乳动物翻译系统具有非常显著的影响,更加重要的是,这种影响独立于发夹结构稳定性和位置对翻译效率施加的影响。由GC键构成的发卡结构要比由AU键构成的更加难以熔解,因此每个碱基的局部稳定性也会对翻译效率造成影响。当一个稳定性高于-50kcal/mol的发夹结构依然可以高效起始翻译,只要其GC含量很低;一个稳定性差但是含有高GC含量的发夹结构也可能会抑制翻译。

在Cos7细胞中,5'UTR发卡结构中的GC含量影响翻译效率

与天然5'UTR翻译效率比较

测定α-globin 5' UTR和β-globin 5' UTR翻译效率,结果发现在活细胞中,α-globin 5' UTR拥有最高的翻译效率,这与1994年Kozak在体外系统得到的结果是相反的(β-globin 5' UTR翻译效率要高于α-globin 5' UTR)。而且,还可以发现,globin UTRs翻译效率要远远高于研究人员设计的一系列含有发卡结构UTR的,这可能是由于globin UTRs中发夹结构稳定性非常低(-8.4kcal/mol—-2kcal/mol)。

α-globin 5' UTR和β-globin 5' UTR在活细胞中的翻译效率和体外系统中的翻译效率是相反的

改变发卡结构,调控翻译效率

从前面的数据可以看出,当发夹结构稳定性在-25kcal/mol时,从+1移动到+10,就可以将翻译效率提升50倍之多。研究人员提出改变RNA二级结构来控制基因表达的策略,在低表达的报告系统中,由于RNA发卡结构靠近帽子结构,阻碍了翻译前起始复合物结合到帽子上面,从而无法起始翻译。如果内源性的mRNA序列可以与报告系统中mRNA序列发生配对,下移二级结构的位置,使得翻译前起始复合物可以结合到帽子上,从而启动蛋白翻译。

改变发卡结构,调控翻译效率

BNT162b2和mRNA-1273 5'UTR设计

实际上,5'UTR序列主要有2个功能:提升mRNA稳定性和起始翻译。在mRNA疫苗的研发过程中,有4种优化5'UTR序列的策略第1种,也是最为简单的,直接选取在人体细胞内表达效率极高的基因的5'UTR,例如human α-globin genes的5'UTR。第2种病原体mRNA自身的天然5'UTR。这两者方法基于一个推断——经过天然选择优化出来的5'UTR在肌肉细胞中肯定可以发挥作用。第3种是通过对数富集的方式来实现5'UTR的系统演化,实际上这种方法最早用于3'UTR的筛选。第4种,通过深度计算模型从海量的数据库中进行高通量筛选。但是,从疫苗研发的速度来说,最快捷的方式便是最前面两种方式,后面两种方式需要耗费的大量的时间,有一定的技术难度【1】

BNT162b2直接选取human α-globin mRNA的 5'UTR,并且将起始密码子ATG的原始背景序列(ACCATG)替换为Kozak保守序列(GCCACCATG)。选取在人体细胞内表达效率极高的基因的5'UTR还有一个好处就是在5'UTR区域不会存在干扰翻译起始的上游AUG(Upstream AUG)。

Moderna 自己设计开发多种 5'UTR序列,mRNA-1273来自Immunomodulatory Therapeutic mRNA Compositions Encoding Activating Oncogene Mutation Peptides专利中的V1-UTR序列。V1-UTR序列由两个元件构成,第一元件来自modified polynucleotides for the prodution of secreted proteins专利中的5'UTR-001序列,紧跟其后的第二个元件由CCCCGGCGCC序列组成。

mRNA-1273 -5'UTR序列来源

比较Pfizer和Moderna 5'UTR序列的二级结构,可以发现,BNT162b2 5'UTR序列在起始密码子附近不存在二级结构,Moderna’s mRNA-1273 5'UTR序列在起始密码子附近有一个非常独特的二级结构。并不是很清楚mRNA-1273 5'UTR序列处的二级结构是否会抑制蛋白翻译效率,如果从接种剂量来判断,那BNT162b2 human α-globin 5'UTR序列翻译(30 µg/dose)显然是优越于mRNA-1273 5'UTR序列的(100 µg/dose)。

两款mRNA疫苗5'UTR序列的结构差异

从前面的一系列研究可以发现,二级结构对于翻译的影响是非常复杂的,并不能简单的认为5'UTR存在二级结构或者根据稳定性高低就此来判断对翻译的抑制效应。例如8.6%的高表达核糖体蛋白基因在起始密码子附近的二级结构稳定性高于或者等于mRNA-1273 5'UTR的,所以说,mRNA-1273 5'UTR处的二级结构是否是造成其较低翻译表达效率的原因是需要进一步的试验数据来论证的。

起始密码子AUG附近分布序列的MFE

总结

通过上面的一系列研究,我们可以看出5'UTR二级结构稳定性,距离Cap的位置,距离起始密码子ATG的位置,GC含量,会对蛋白翻译效率造成非常显著的影响。如果说序列设计是mRNA技术的源头,那么5'UTR序列当属序列设计中最关键的部分。我们前面介绍过CDS序列密码子优化策略mRNA序列设计|如何进行密码子优化,目前已知的一系列免费网站服务,实际上已经基本上可以满足需求,而且密码子优化对翻译效率的影响显然没有5'UTR序列显著和深远。从辉瑞和Moderna两款疫苗的5'UTR设计可以看出,要想设计出表达性能优于天然human α-globin 5'UTR的人工合成序列,难度很高。尽管Moderna拥有自己的AI团队序列优化|Moderna公司AI团队开发新算法挖掘mRNA优化序列,而且做出了一些相关的东西,但是基本上属于雷声大,雨点小,优化效果堪忧,通过AI技术来优化表达元件序列的路还很长。从另外一方面来看,在现阶段,对于国内mRNA新药研发公司来说,不管是骨架序列设计,还是递送系统利用已有的普通元件,在短时间内拼凑出一辆可以在大马路上跑起来的五菱宏光远远比起耗费巨资打磨豪华宝马来得更为急迫。你首先得Work,能够跑起来,才能更从容不迫地去考虑提升性能的事情


1. Detailed Dissection and Critical Evaluation of the Pfizer/BioNTech and Moderna mRNA Vaccines

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
CDS序列
信使核糖核酸(mRNA)的结构与功能
漫谈mRNA疫苗(一):基本结构
发现蛋白质合成相关的新因子——消除核糖体碰撞的复合体解开mRNA的坚固结构—
驾驭基因表达调控(5)如何设计沉默效率更好的 siRNA?
基因的启动子序列,你是怎么找到的?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服