打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Nat Genet文献精读:教你分析高通量筛选数据的思路

——日读一帖,解螺旋大V团队伴你科研路

作者:螺丝钉W

解螺旋出品

  解螺旋今天与大家分享的内容源于在解螺旋lncRNA俱乐部分享过的、来自NAT GENET的相关文献(IF=29.648)(索要原文请在解螺旋公众号中回复0507),对lncRNA感兴趣的小伙伴,欢迎仔细品读。加入lncRNA俱乐部可以加解螺旋助手为好友并提出您的要求(助手微信号:helixlife0)。

摘要翻译

  lncRNA可充当基因调控元件,对外界刺激产生应答,调节基因活性。但这种活性的调节范围和功能尚不清楚。作者使用108个具有不同外界刺激的人的组织标本,采用超高密度阵列,对56个细胞周期相关基因的启动子进行筛选。鉴定了216个可能编码lncRNA的转录区域,RT-PCR验证了他们中的一些分子在细胞周期循环过程中周期性的表达。提示这些分子在肿瘤中的表达改变,与特定的致癌刺激、干细胞分化或DNA损伤有关。在CDKN1A启动子区,DNA损伤诱导了5个lncRNA分子的表达。将其中的一个lncRNA命名为PANDA,其诱导表达具有p53依赖性。PANDA与转录因子NF-YA相互作用,抑制了促凋亡基因的表达;PANDA缺失导致人成纤维细胞对阿霉素诱导的细胞凋亡更加敏感。以上结果表明,启动子表达的lncRNA在细胞生长控制方面有广泛的作用

研究思路

  研究者最开始通过对56个基因的启动子区域进行筛选,获得216个转录本;然后通过大量的生物信息学分析,证实了他们都是lncRNA。然后通过gene module map将范围缩小到60个转录本(都与细胞周期或ESC相关),然后通过阿霉素刺激细胞模型,缩小到几个转录体,最后由于PANDA 的表达变化是最强的(40倍),将研究的重点放在了PANDA上

筛选细胞周期相关的lncRNA的流程图

推荐理由

  一般来说,如果要进行lncRNA的芯片筛选,会获得海量数据。如何分析这些数据?

  有时候,我们可以委托公司或者有生物信息学背景的人来做,但委托者更多还是依赖我们的思路来做。因此提出分析的思路是最为关键的。

  “这篇文章之所以很有借鉴意义,是因为大多数CNS级别的文章,对于怎样通过筛选获得候选分子,介绍得语焉不详。而是重点就筛到的候选分子,对其功能做了大量的研究工作。这篇文章正好反其道而行之,对于PANDA的功能做得不多。反而着重介绍了如何筛选研究对象并逐步缩小范围,最后就感兴趣的lncRNA(PANDA进行深入研究。”

研究内容

第一步 筛选转录起始位点(TSS)的RNA

  在转录起始位点附近,RNA聚合酶常常可以产生20-200nt的转录产物,被称为启动子相关小RNAs(RASRs)。这些分子是有功能的,还是仅仅是转录副产物,不得而知。

  作者就聚焦TSS区附近转录的非编码RNA进行筛选和分析。在做筛选时,作者证实了绝大多数(41/56)的exon 1 都能被检测到,说明3’bias 现象不存在(分辨率是5个nt,很可能出现5个T的探针。如果出现5个T的探针,和RNA的3’poly A 区域容易形成互补,即是所谓的3‘bias 现象)。

  首先,用来源于各种干扰下的人类细胞,包括细胞周期同步改变、DNA损害、分化刺激、致癌的刺激,进行复瓦市微阵列,总共选取了56个基因,研究位置在9p21区(此区域包括p16、p14、p15)的25 kb 分辨率5nt 、 TSS上游10kb、TSS下游2kb。

  调用算法峰值寻找统计上最明显的信号,并找到至少有50kb的连续区域。最后确定了216个离散的转录区域,平均每个样本中有73个不与细胞周期基因重叠的转录区。平均长度234nt。171个在TSS的5’端,40个在内含子区,5个在TSS的3’端下游。

(1)CHIP-chip检测结合EpiGRAPH分析,证实这216个转录区是普遍转录的。

(2)CSF验证结合BLAST分析,这些分子不编码蛋白。

(3)另外,这些转录产物都不含有miRNA前体,小核仁RNA等。

  以上特征,与lncRNA相符。

  将这些杂交信号与TSS做对比,发现一个高峰,正在TSS下游与exon1对应。并且发现在TSS上游4~8kb处富集非编码RNA。

第二步:证明这些候选lncRNAs具有生物学功能

  在这216个转录产物中,有92个转录产物至少有2倍或以上的表达变化。这些发生变化的转录产物大部分参与了干细胞通路(40个)、浸润性乳腺导管癌(35个)。进一步分析,发现干细胞和肿瘤干细胞所引起的lncRNA的变化具有极大的相似性。最后,通过GO 分析,发现这216个转录产物可以分成三个簇,主要参与的细胞周期、自我更新和肿瘤发生。


第三步:了解lncRNA的作用机制是顺式还是反式

lncRNA与同源mRNA间的表达是否有关?

  17组全基因组表达测序,计算lncRNA和mRNA的相关皮尔森系数。发现无关,推测lncRNA不起顺式作用。

  已有报道发现lncRNA可以发挥顺式作用,即指上游的lncRNA转录后,通过调控其下游的mRNA(lncRNA的位点loci与mRNA靠得很近)的转录。但是通过筛选及分析发现lncRNA与其附近的mRNA 之间的表达没有相关性,因此排除了顺式作用。

lncRNA与别处的基因表达是否相关?

  针对每一个lncRNA,研究者都选取了一组mRNA(入组mRNA 条件是与该特定的lncRNA的表达呈现正相关或者负相关),通过分析这个gene module map,发现多个lncRNA与多种生物学途径紧密相关,包括细胞周期、DNA重组、RNA 剪切、DNA 损伤应答等。



第四步:验证lncRNA在细胞周期、ESC分化、癌症和DNA损伤反应中表达

  作者挑选了60个lncRNA进行研究(如何挑选的未明确说明,估计是针对上面的gene module map 进行挑选的。挑选的基因都是与细胞周期,ESC 相关)

  qRT-PCR验证了60个lncRNA在不同的情况下有不同的表达方式和作用。在Hela细胞和fibroblast 细胞中,这些lncRNA的表达,都呈现出一个随时间而变动的调控方式(即随着时间的变动,都有峰值出现,而且这些峰值往往和细胞周期相对应)。提示这些lncRNA参与了细胞周期的变化。

  通过ESC (有干性,未分化)和 fetal pancreas(分化终末细胞)的比较,显示出这些lncRNA在分化的过程中,受到显著地调控。

  类似地,可以发现正常地乳腺组织和转移性乳腺癌组织中,lncRNA的表达也呈现显著地差异。

  从这一步开始,研究者已经把筛选到的216个转录体,缩减到60了。而且这60个都是和ECS及细胞周期相关的。研究内容已经开始越来越聚焦了,为后面focus 到 PANDA 打下了基础。

第五步:聚焦其中一个lncRNA验证其功能

  接下来作者就锁定目标了。通过共表达图谱预测到一些lncRNA和DNA损伤有关。阿霉素刺激的胎儿肺成纤维细胞,有12个lncRNA的表达出现至少2倍的改变。其中,2个位于p53目标基因CDKN1A (也叫p21)的TSS的5’端,这两个lncRNA与CDKN1A mRNA 相似的地方是,都可以受到阿霉素刺激的调控(阿霉素刺激是研究DNA损伤的经典方法),提示这两个lncRNA参与了DNA损伤反应。将60个lncRNA放在胎儿肺成纤维细胞模型中,阿霉素刺激24h,观察他们的表达情况,发现CDKN1A上游的一些lncRNA反应迅速明显。在这些lncRNA中,CDKN1A-4845 的表达高达40倍(文中之后将其称为PANDA),提示这条lncRNA可能在DNA损伤反应中起到重要的作用。

  以上说明CDKN1A区域的lncRNA可能在DNA受损反应下与p21相互作用。


  最后,siRNA的方法对PANDA进行功能验证。

  PANDA,一种长链非编码未经剪切的1.5kb lncRNA,由CDKN1A的反义链转录,动力学比CDKN1A更快。

  • 功能缺失和互补实验表明,PANDA在DNA损伤是依赖于p53的感应。

  • 敲除CDKN1A或PANDA对彼此的DNA损伤反应无影响,说明他们的作用是平行的。

  • PANDA通过将转录因子NF-YA与靶基因启动子隔离,阻滞凋亡基因表达,增强细胞存活。


在CDKN1A位点的编码和非编码mRNA协调DNA损伤反应的模式图

作者背景

  通讯作者供职于斯坦福大学,主要研究基因在空间与时间上的功能,目前主要的研究方向是这些基因如何在lncRNA的调控之下,进行表达和发挥功能。


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
IncRNA系列:lncRNA的生物学功能(二)
lncRNA究竟是大腕还是龙套:解读lncRNA
《相约2015NSFC》之疾病相关lncRNA研究策略
曾以为它们毫无价值,现如今才发现它们性命攸关
写国自然缺素材?来篇55分的综述帮你总结lncRNAs的基因调控及其生物学功能
长链非编码RNA/LncRNA的研究,读这一篇文章就足够了!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服