打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
RNAi、TALEN、CRISPR:一文教你做出正确选择

科研小助手原创

如需本文参考文献请在公众号内回复“160310”或者在文章末尾的留言区留下您的邮箱,小编看到之后会通过邮箱发给您哦~

研究基因功能最常用的方法便是减少或者阻断基因的正常表达,然后进行表型分析,从而研究其功能。十几年来,RNAi一直是实验室的首选技术,其也是这一领域的王者。然而新兴技术的涌现(尤其是基于CRISPR的技术)正在逐渐瓦解RNAi的统治地位。日新月异的技术发展为生物学研究提供了越来越大的助力,但也给研究者们带来了一个有些纠结的问题,“到底应该选择那一种技术呢”。本文主要介绍了这几种技术的利弊并且教你如何正确选择适合你的技术。

RNAi

RNAi是在研究秀丽新小杆线虫(C. elegans)反义RNA(antisense RNA)的过程中发现的,由dsRNA介导的同源RNA降解过程。1995年,Guo等发现注射正义RNA(sense RNA)和反义RNA均能有效并特异性地抑制秀丽新小杆线虫par-1基因的表达,该结果不能使用反义RNA技术的理论做出合理解释。直到1998年,Fire等证实Guo等发现的正义RNA抑制同源基因表达的现象是由于体外转录制备的RNA中污染了微量dsRNA而引发,并将这一现象命名为RNAi。
此后dsRNA介导的RNAi现象陆续发现于真菌、果蝇、拟南芥、锥虫、水螅、涡虫、斑马鱼等多种真核生物中,并逐渐证实植物中的转录后基因沉默(posttranscriptional gene silencing, PTGS)、共抑制(cosuppression)及RNA介导的病毒抗性、真菌的抑制(quelling)现象均属于RNAi在不同物种的表现形式。
1992年,罗马诺(Romano)和Macino也在粗糙链孢霉中发现了外源导入基因可以抑制具有同源序列的内源基因的表达。
1995年,Guo和Kemphues在线虫中也发现了RNA干扰现象。
1999年,Hamilton等首次在PTGS植株中发现了长度为25nt的RNA中间产物。2000年,Zamore和Hammond等使用体外培养的果蝇细胞进行研究发现,外源性dsRNA通过耗能过程降解成21-23nt的小干扰RNA(small interfering RNA, siRNA)引发RNAi。
2000年,Wianny和Svoboda等分别证实在小鼠胚胎细胞和卵母细胞中dsRNA能引发RNAi效应。2001年,Elbashir等证实21nt的siRNA可在避免激活dsRNA依赖的蛋白激酶(dsRNA-dependent protein kinase, PKR)和2',5'-寡聚腺苷酸合成酶(2',5'-oligoadenylate synthetase, 2',5'-OAS)信号转导途径的同时,有效抑制人胚肾293细胞、Hela细胞等哺乳动物细胞中目的基因的表达。
2002年,Brummelkamp等首次使用小鼠H1启动子构建了小发卡RNA(small hairpin RNA, shRNA)表达载体pSUPER,并证实转染该载体可有效、特异性地剔除哺乳动物细胞内目的基因的表达,为利用RNAi技术进行基因治疗研究奠定了基础。
2006年,安德鲁·法厄与克雷格·梅洛(Craig C. Mello)由于在RNAi机制研究中的贡献获得诺贝尔生理及医学奖。

1
RNAi作用机制

病毒基因、人工转入基因、转座子等外源性基因随机整合到宿主细胞基因组内,并利用宿主细胞进行转录时,常产生一些dsRNA。宿主细胞对这些dsRNA迅即产生反应,其胞质中的核酸内切酶Dicer将dsRNA切割成多个具有特定长度和结构的小片段RNA(大约21~23 bp),即siRNA。siRNA在细胞内RNA解旋酶的作用下解链成正义链和反义链,继之由反义siRNA再与体内一些酶(包括内切酶、外切酶、解旋酶等)结合形成RNA诱导的沉默复合物(RNA-induced silencing complex,RISC)。RISC与外源性基因表达的mRNA的同源区进行特异性结合,RISC具有核酸酶的功能,在结合部位切割mRNA,切割位点即是与siRNA中反义链互补结合的两端。被切割后的断裂mRNA随即降解,从而诱发宿主细胞针对这些mRNA的降解反应。siRNA不仅能引导RISC切割同源单链mRNA,而且可作为引物与靶RNA结合并在RNA聚合酶(RNA-dependent RNA polymerase,RdRP)作用下合成更多新的dsRNA,新合成的dsRNA再由Dicer切割产生大量的次级siRNA,从而使RNAi的作用进一步放大,最终将靶mRNA完全降解。

2
RNAi的脱靶效应

Off-target effects(脱靶效应)最早由Dharmacon科学家Jackson和他的同事们提出(Fedorov,Y.,et al. 'Off-targeting By siRNA Can Induce Toxic Phenotype.' RNA Accepted (2006).)。他们给细胞转染特定基因的单条siRNA后运用全基因组芯片检测技术鉴定表达上调/下调1.5到3倍的靶基因数量。研究人员发现在这种情况下有大量的基因被非特异性的调控着。siRNA正义链和反义链与脱靶基因的互补水平有高有低,并且每条siRNA所引发的脱靶基因表达谱也不尽相同,反映了序列依靠性的脱靶效应。
简单来说,Off-target效应就是指干扰shRNA序列进入了microRNA途径,通过microRNA途径,其可以不受完全互补的限制而调控大量靶基因的表达。原本需要19~23nt的RNA序列完全互补才能发生干扰作用,而如果进入microRNA途径,只需要11~15nt互补就可以产生干扰效果,这使得siRNA可能与非靶基因结合而导致非靶基因沉默,造成脱靶。
如果脱靶干扰的部分基因,正好与目的基因位于同一信号通路中,或者与目的基因的生物学功能相似,那么,如果因脱靶而干扰了其它基因,亦会造成和目的基因受到干扰后相同的细胞表型改变。而实际上,可能选择的这条shRNA序列并没有对目的基因造成有效干扰,或者虽然干扰了目的基因,但是并不会引起预期的细胞表型改变。
基于以上原因,自从Off-target效应被发现并被研究者们广泛认同后,越来越多的杂志要求研究者们在投稿时需要有相应的对照来说明Off-target效应。即您需要有相关对照或者实验来说明,您所获得的实验结果,不是由于Off-target效应而产生的。

TALEN

TALENs中文名是转录激活因子样效应物核酸酶,TALENs是一种可靶向修饰特异DNA序列的酶,它借助于TAL效应子一种由植物细菌分泌的天然蛋白来识别特异性DNA碱基对。TAL效应子可被设计识别和结合所有的目的DNA序列。对TAL效应子附加一个核酸酶就生成了TALENs。TAL效应核酸酶可与DNA结合并在特异位点对DNA链进行切割,从而导入新的遗传物质。
最早关于TALE蛋白的研究始于AvrBs3,其特异识别DNA碱基的特性直到2009年才首次得到应用。该应用研究发表在Science杂志上。同年人们彻底搞清了TALE的识别规则,并且在随后的2014年CELL杂志上发表了其特异识别的原理。自TALE序列被完全解译以后,其应用逐渐普及开来。
自TALEN技术正式发明以来,TALEN的特异性切割活性在酵母、拟南芥、水稻、果蝇及斑马鱼等多个动植物体系和体外培养细胞中得以验证。2013年,首尔国立大学化学系和国家基因工程创新举措研究中心的Kim课题组建立了一个全基因组规模的TALEN体系。他们系统地选取了人类基因组中高度特异性的序列作为靶点以避开脱靶效应。通过高通量克隆体系,一次性构建了近2万个编码蛋白基因的TALEN质粒。这项研究中,他们以一种巧妙的方式优化了TALEN质粒的结构,以检测插入靶点后质粒对应位置上eGFP的表达的方式检测TALEN靶点插入成功率。通过研究不同间隔序列下特定靶点插入效率,从而得出最佳TALEN体系结构。
2014年2月,北京大学生命科学学院魏文胜课题组依托于一种自主研发的TALE蛋白组装技术完成了全部TALE元件的解码工作。
2010年至今,TALEN技术已被全球范围内各实验室使用。服务公司更如雨后春笋般大量涌现,如GeneCopoeia等。

1
TALEN结构

典型的 TALEN由一个包含核定位信号(Nuclear localization signal, NLS)的N端结构域、一个包含可识别特定DNA序列的典型串联TALE重复序列的中央结构域,以及一个具有FokI核酸内切酶功能的C端结构域组成。不同类型的TALEN元件识别的特异性DNA序列长度有很大区别。一般来说,天然的TALEN元件识别的特异性DNA序列长度一般为17-18bp;而人工TALEN元件识别的特异性DNA序列长度则一般为14-20bp。

图1,TALEN的结构。(A)与靶点DNA(灰色显示,PDB ID:3UGM)结合的TALE蛋白。每一个独立的TALE重复序列元件包含33到35个氨基酸残基,这些TALE重复序列元件能够通过两个高变异度的残基(即重复可变双残基,RVD,棍状显示)来识别一个单一的碱基对。(B)TALE核酸酶(TALEN)形成二聚体结合DNA的动画演示。TALEN目标位点由两个TALE结合位点组成,这两个位点间通过不同长度的间隔区序列(12-20bp)分开。TALE可以被设计成仅仅识别左半侧位点或右半侧位点。图片来源: Thomas Gaj, Charles A. Gersbach, and Carlos F. Barbas III. (2013) ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in Biotechnology, 31(7): 397-405.

2
技术的原理与步骤

TALEN技术的原理并不复杂,即通过DNA识别模块将TALEN元件靶向特异性的DNA位点并结合,然后在FokI核酸酶的作用下完成特定位点的剪切,并借助于细胞内固有 的同源定向修复(HDR)或非同源末端连接 途径(NHEJ)修复过程完成特定序列的插入 (或倒置)、删失及基因融合(图2)。

图2,TALEN进行基因组编辑的原理。利用位点特异性核酸酶可以进行基因组编辑,而核酸酶诱导的DNA双链断裂(DSB)可由同源定向修复(HDR)或非同源末端连接途径(NHEJ)来修复。(A)在供体质粒(donor plasmid)暴露出延长的同源臂(homology arm)的情况下,HDR可能导致插入的单个或多个转基因发生改变或取代原有的基因。(B)在缺失供体质粒的情况下,NHEJ介导的修复会产生小的插入或删失突变,并可能导致目标基因被破坏;在有双链寡核苷酸或线状供体质粒存在的情况下,这些DNA片段可能通过NHEJ介导的连接反应插入;同时诱导两个DSB的产生则会引起删失、插入和易位突变。图片来源:Thomas Gaj, Charles A. Gersbach, and Carlos F. Barbas III. (2013) ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in Biotechnology, 31(7): 397-405.

TALEN技术的核心原理就是在同一个蛋白(TALEN)上有序地实现引导进入细胞核、靶位点DNA的特异性识别和靶位点DNA的切割这三个不同的功能,这一点在上述TALEN典型结构一节中已作了较为详细的描述。在具体操作中,例如在实验室条件下,实现TALEN的关键就在于完成DNA的特异性识别功能,一般说来分为两个步骤。图3与图4分别以“铂金门”TALEN构建系统(Platinum Gate TALEN construction system)和商业化的easyT体系为例,展示了实验操作中TALEN元件的构建。

图 3,“铂金门”TALEN构建系统TALEN元件构建操作示意图。步骤一,四个或更少的组件被连接到阵列质粒(array plasmid)上;步骤二,构建好的阵列随后被连接到哺乳动物表达载体中;白色和粉色的长方形分别表示在BsaI和Esp3I限制性内切酶切割后留下的粘性末端;蓝色字母代表RVD,红色字母代表non-RVD变化,黄色长方形代表后一半重复。图片来源:Tetsushi Sakuma, Hiroshi Ochiai, Takehito Kaneko, Tomoji Mashimo, Daisuke Tokumasu, et al. (2014) Repeating pattern of non-RVD variations in DNA-binding modules enhances TALEN activity. Science Report, 3(3379): 1-8.

图 4,“easyT” TALEN构建系统TALEN元件构建操作示意图。(A)包含一个长度为18.5个组件的TALE重复元件的TALEN体系示意图。该TALE重复元件由20个单体单位(monomer unit)组装而成。单体单位的边界在组装过程中发生了移位。(B)TALEN克隆示意图。第一步,由四个单体通过连接反应组装成4聚体;第二步,4聚体(4-mers)进行PCR扩增,琼脂糖凝胶电泳,胶回收并浓缩;最后,在第二次连接反应中,4聚体被组装到TALEN骨架质粒(backbone plasmid)上;黄色和蓝色箭头分别表示4聚体扩增时的正向引物与反向引物。图片来源:Tomonori Katsuyama, Arslan Akmammedov, Makiko Seimiya, Samuel C. Hess, Cem Sievers and Renato Par. (2013) An ef?cient strategy for TALEN-mediated genome engineering in Drosophila. Nucleic Acids Research, 41(17): e163-171.

构建TAL靶点识别模块

TAL的DNA特异性识别单位是间隔32个恒定氨基酸残基的二联氨基酸。二联氨基酸与AGCT这4个核苷酸碱基有一一对应的关系:腺嘌呤(A)由NI识别、胸腺嘧啶(T)由NG识别、鸟嘌呤(G)由NN识别,而胞嘧啶(C)则由HD识别。实验操作中,我们通过 靶位点的DNA序列可以反推能特异性识别这一序列的二联氨基酸序列,从而构建TAL靶点识别模块。

TAL靶点识别模块的克隆与表达

根据之前对TALEN结构的介绍,我们需要将上一步骤中根据目标DNA序列构建好的一对TAL靶点识别模块与N端的核定位序列、C端的FokI酶连接起来,才能得到一个完整的TALEN元件。一般来说,我们可以采用专门用于构建TALEN的真核表达载体体系,将一对特异性的TAL靶点识别模块克隆进该载体中,再通过转染等方式导入细胞内。这种体系一般由供体质粒(donor plasmid,提供单基、二联及三联等类型的TAL模块)和骨架质粒(backbone plasmid,用于构建TALEN并表达构建好的TALEN)两类质粒构成,常用的TALEN体系有RCIscript-GoldyTALEN和pC-GoldyTALEN、TAL5-BB和pTAL6-BB及pCS2TAL3-DD和pCS2TALE-RR等。

CRISPR/Cas9

CRISPR/Cas9 是细菌和古细菌在长期演化过程中形成的一种适应性免疫防御,可用来对抗入侵的病毒及外源DNA。CRISPR/Cas9系统通过将入侵噬菌体和质粒 DNA的片段整合到CRISPR中,并利用相应的CRISPR RNAs(crRNAs)来指导同源序列的降解,从而提供免疫性。

1
CRISPR/Cas系统元件与特征

CRISPR/Cas系统最早是在细菌的天然免疫系统内发现的,其主要功能是对抗入侵的病毒及外源DNA。1987年大阪大学(OsakaUniversity)的研究人员在E.coliK12的碱性磷酸酶基因附近发现了成簇的规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeat, CRISPR),其结构如图5所示,目前普遍认为有40%的细菌基因组具有这样的结构。


图5,CRISPR的结构(以嗜热链球菌LMD-9基因组CRISPR1/Cas系统的位点为例)。(上)Cas基因由蓝色表示,包括广泛存在的cas1和cas2,II类系统特征基因cas9和csn2。重复间隔物阵列(CRISPR)由黑色表示。(下)CRISPR的重复序列(repeat)和间隔物序列(spacer)分别用黑色菱形、灰色长方形表示。缩写:L,前端;T,末端重复;数字代表间隔物序列被获取的顺序。图片来源:Rodolphe Barrangou and Philippe Horvath. (2012) CRISPR: New Horizons in Phage Resistance and Strain Identification. Annual Review of Food Science, 3: 143-162.

CRISPR/Cas系统由CRISPR序列元件与Cas基因家族组成。其中CRISPR由一系列高度保守的重复序列(repeat)与同样高度保守的间隔序列(spacer)相间排列组成。而在CRISPR附近区域还存在着一部分高度保守的CRISPR相关基因(CRISPR-associated gene, Cas gene),这些基因编码的蛋白具有核酸酶活性的功能域,可以对DNA序列进行特异性的切割。

2
CRISPR/Cas系统工作原理

CRISPR/Cas作为原核生物中普遍存在的一种系统,最初的功能就是识别外源性入侵的核酸序列,并对其进行特异性降解,以达到抗病毒的作用。这一过程分两步进行——crRNA的合成及在crRNA引导下的RNA结合与剪切,具体机制如图6所示,包含crRNA的生物学合成和RNA的结合与剪切两大步骤。


图6,CRISPR抗病毒运行机制。(上)crRNA和Cas蛋白的生物学合成:Cas基因转录为mRNA,随后翻译为Cas蛋白,Cas蛋白可以形成CASCADE复合体(抗病毒防御的CRISPR相关复合体)。CRISPR重复间隔物阵列转录为全长的前体crRNA(pre-crRNA),随后经过加工成为crRNA。这些crRNA包含部分的重复间隔序列。(下左)间隔物(spacer)获取:噬菌体的原间隔物序列,一般在PAM(原间隔物模块)的旁边,可由Cas蛋白识别,并产生一个新的重复间隔物单元,插在原有的重复间隔物阵列前端。(下右)干扰:由crRNA介导的CASCADE核糖核蛋白复合体识别入侵的同源序列,在PAM附近的原间隔物序列处将这些双链DNA(dsDNA)截断。图片来源:Rodolphe Barrangou and Philippe Horvath. (2012) CRISPR: New Horizons in Phage Resistance and Strain Identification. Annual Review of Food Science, 3: 143-162.

crRNA的生物学合成

CRISPR区域第一个重复序列上游有一段CRISPR的前导序列(Leader sequence),该序列作为启动子来启动后续CRISPR序列的转录,转录生成的RNA被命名为CRISPRRNA(简称crRNA)。

RNA的结合与剪切

CRISPR/Cas系统中crRNA与tracrRNA(反式激活的crRNA)形成嵌合RNA分子,即单向导RNA(Single guide RNA, sgRNA)。sgRNA可以介导Cas9蛋白在特定序列处进行切割,形成DNA双链断裂(Double-Stranded Break, DSB),完成基因定向编辑等的各类操作。

3
不同类型的CRISPR/Cas系统

根据功能元件的不同,CRISPR/Cas系统可以分为I类系统、II类系统和III类系统。这三类系统又可以根据其编码Cas蛋白的基因不同而分为更多的亚类。不同类型CRISPR/Cas系统完成干扰的步骤也有所不同(图7)。


图7,三种不同的CRISPR/Cas干扰系统作用步骤。CRISPR/Cas系统根据分类有三种,其共同特点是都具有DNA区域(蓝色)、靶向crRNA(红色)和原间隔物模块(PAM,绿色)。在I类系统(A)中,入侵的DNA有Cascade:crRNA复合体识别,PAM模块则能促进外源性DNA的识别,随后核酸酶Cas3被募集并将目标DNA降解。在II类系统(B)中,只需要单独的Cas9蛋白即可完成干扰,并不依赖一个多蛋白复合体,Cas9和反式激活的crRNA(tracrRNA)、前crRNA(pre-crRNA)形成复合体,该复合体促使RNA酶III将前crRNA加工为成熟的crRNA。在III类系统(C)中,一个多蛋白复合体(Csm或Cmr)或Cas6促进前crRNA转化为成熟的crRNA,最终导致目标DNA的降解。图片来源:Hagen Richter, Lennart Randau and André Plagens. (2013) Exploiting CRISPR/Cas: Interference Mechanisms and Applications. International Journal of Molecular Science, 2013, 14, 14518-14531.

I类和III类CRISPR/Cas系统进行干扰时只需要crRNA和Cas蛋白两种元件的参与,而II类CRISPR/Cas系统包括crRNA、tracrRNA和Cas蛋白三种元件。其中II类CRISPR/Cas系统最先在改造后用于小鼠和人类基因组编辑,同时也是目前研究最为充分的系统。根据Cas蛋白的类型不同分为三个亚类:II-A类含有Cas1、Cas2、Cas9和Csn2样蛋白;II-B类含有Cas1、Cas2、Cas4和Csx12样Cas9四种蛋白;II-C类则有Cas1、Cas2及Cas9三种蛋白。此外,II类CRISPR/Cas系统也是目前最常用于人工基因组编辑的CRISPR/Cas系统,其靶向基因组编辑的步骤如图8所示。


图8,利用一段小向导RNA(sgRNA):Cas复合体系统靶向基因组编辑的步骤。将编码密码子优化的Cas9(红色)序列、一段核定位序列(NLS)和一段包括目标靶序列的小向导RNA(sgRNA,黄色)序列同时构建在一个质粒中,再将质粒转染进目标细胞。一个有功能的sgRNA:Cas9干扰复合体会在细胞内完成组装,该复合体会在PAM结构的上游目标DNA序列上诱导产生一个双链断裂(DSB),而DSB则能被宿主细胞的DNA修复系统、同源重组系统(HR)和非同源末端连接途径(NHEJ)修复。HR系统以宿主的等位基因为模板复原野生型序列,将序列恢复为断裂前的状态;而容易出错的NHEJ系统则会在目标位点(灰色)引入插入和删失。使用一段合成的供体DNA模板与Cas系统质粒共转染,可以诱导HR(蓝色),提高编辑效率。图片来源:Hagen Richter, Lennart Randau and André Plagens. (2013) Exploiting CRISPR/Cas: Interference Mechanisms and Applications. International Journal of Molecular Science, 2013, 14, 14518-14531.

最后附一张表格来指导各位如何选择各项技术!


其实小编最后想说一句,只有最适合自己和实验的技术才是最好的技术,并不一定要用到最新最高大上的技术,所以各位也不用刻意追求使用这些最新最前沿的技术,但是了解一下总是好的,万一以后用着了呢=_=!


参考文献:

1. Boettcher M, McManus MT. Choosing the Right Tool for the Job: RNAi, TALEN, or CRISPR. Molecular cell 2015; 58:575-585.

2. Lagana A, Shasha D, Croce CM. Synthetic RNAs for Gene Regulation: Design Principles and Computational Tools. Frontiers in bioengineering and biotechnology 2014; 2:65.

3. Gaj T, Gersbach CA, Barbas CF, 3rd. ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in biotechnology 2013; 31:397-405.
4. Sakuma T, Ochiai H, Kaneko T et al. Repeating pattern of non-RVD variations in DNA-binding modules enhances TALEN activity. Scientific reports 2013; 3:3379.

5. Katsuyama T, Akmammedov A, Seimiya M, Hess SC, Sievers C, Paro R. An efficient strategy for TALEN-mediated genome engineering in Drosophila. Nucleic Acids Res 2013; 41.

6. Barrangou R, Horvath P. CRISPR. New Horizons in Phage Resistance and Strain identification. Annu Rev Food Sci T 2012; 3:143-162.

7. Richter H, Randau L, Plagens A. Exploiting CRISPR/Cas: Interference Mechanisms and Applications. Int J Mol Sci 2013; 14:14518-14531.

8. 部分资料参考自网络

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
基因编辑简史
基因编辑热点研究方向全面盘点,一文带你了解基因魔剪的前世今生
基因“剪刀” 如何撬动几十亿美元大市场
一文带你读懂基因编辑技术「建议收藏」
Crispr/Cas9原理实及实验流程笔记
CRISPR/Cas9技术详解,简单易懂
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服