打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
都说lncRNA只有部分具有polyA尾结构,请证明

通常大家提到转录组测序,指的是mRNA-seq,在测序文库构建的实验阶段我们有两个选项:

  • 去除rRNA
  • 富集polyA

因为真核生物的mRNA都是有polyA尾巴结构,示意图如下:

但是慢慢的科研热点转到了lncRNA,虽然lncRNA只有部分具有polyA尾结构,但也意味着公共数据库里面海量的mRNA-seq表达矩阵里面,都是可以提取到lncRNA部分,新的分析图表就出来了。在很多综述或者教程都可以看到对lncRNA的这样的总结:

  • 1.长度在200-100,000nt
  • 2.没有编码蛋白质潜能
  • 3.具有细胞或组织类型特异性
  • 4.表达量和保守性比mRNA低
  • 5.部分lncRNA不含有polyA尾巴
  • 6.部分也会翻译小肽段

既然都说lncRNA只有部分具有polyA尾结构,我这里出一个学徒作业,希望大家可以下载人和鼠的gtf文件,以及转录本fasta序列文件,自己去探索一下:

gtf文件记录了多少个基因,多少个是蛋白编码基因多少个是lncRNA呢?其中各自的具有polyA尾结构的比例是多少呢?

可以使用R,SHELL,PYTHON或者PERL等多种编程语言完成这个探索任务,更多习题见:生物信息学编程实战

习题目录

  • 01:生信编程思维讲解
  • 02: hg19基因组序列的一些探究
  • 03: hg38每条染色体的基因、转录本分布
  • 04: 多个同样行列式文件的合并
  • 05: 根据GTF画基因的多个转录本结构
  • 06: 下载最新版的KEGG信息,并且解析好
  • 07: 写超几何分布检验
  • 08: ID转换
  • 09: R语言爬虫
  • 10: R语言shiny
  • 11: 用Biostrings包来处理fasta序列
  • 12: 根据指定染色体及坐标得到序列
  • 13: JSON 数据的格式化
  • 14: fasta 数据处理
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
TBtools | 地球最友好的 GFF3/GTF 序列提取工具
lncRNA鉴定专题-样本和测序要求
TBtools | 多图合一至强版教程!进化树 + Motifs + 结构域 + 启动子 + 基因结构 + ....
基于gff3/gtf文件-批量提取启动子或CDS序列-任何人都可以
【解螺旋·科研热点】秘密知多少(lncRNA系列一)推荐!
LncRNA:从“转录噪声”到科研高地的逆袭
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服