打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
使用cell ranger进行单细胞转录组定量分析

在RNA_seq数据的定量分析中,都是首先将reads比对到参考基因组,然后再使用定量软件进行定量,比如经典的hisat+stringTie的分析策略,对于单细胞转录组而言,其定量的原理也是一样的,只不过由于引入了UMI标签的设计,在定量时需要考虑相同UMI标签来自同一个转录本,直接使用传统的分析软件就不合适了。

官方提供的cell ranger软件不仅提供了数据拆分,也提供了定量等分析内容。

定量的前提都是需要将reads比对到参考基因组上,对于比对而言,第一步都是先对参考基因组建立索引,官网提供了人和小鼠的参考基因组供下载,网址如下

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

对于其他物种,我们只需要有基因组的fasta文件和转录本的gtf文件,就可以自定义参考基因组,步骤如下

1. 对GTF文件进行过滤

在原始的GTF文件中,会包含非常多类型的基因,可以通过mkgtf子命令,筛选其中感兴趣的基因,用法如下

cellranger mkgtf hg38.ensembl.gtf hg38.ensembl.filtered.gtf --attribute=gene_biotype:protein_coding

通过attribute属性来筛选,上述例子中只筛选出蛋白编码基因对应的记录。

2. 建立索引

通过mkref子命令来建索引,用法如下

cellranger mkref --genome=output_genome --nthreads=10 --fasta=input.fa --genes=input.gtf

genome参数指定输出结果的目录,建好索引之后的目录结构如下

.├── fasta│   ├── genome.fa│   └── genome.fa.fai├── genes│   └── genes.gtf├── pickle│   └── genes.pickle├── reference.json└── star

可以看到,cell ranger对基因组建立了STAR的索引,然后通过STAR将reads比对到参考基因组上。

定量分析通过count子命令实现,用法如下

cellranger count --id=sample345 --transcriptome=database_path --fastqs=fastq_path --sample=mysample \

id参数指定输出目录的名字,transcriptome参数指定基因组索引所在目录,fastqs指定mkfastq命令产生的序列文件所在目录,sample参数指定需要分析的样本,在fastq_path下对应一个子目录。

count子命令不仅可以进行定量分析,还提供了聚类,PCA, tSNE等一系列分析结果,输出结果目的录下文件很多,在后续我们会详细解读该命令的输出结果。

·end·

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
使用velocyto进行bam转loom吐血踩坑记录
CellRanger走起(三) 使用初探
10X单细胞测序分析软件:Cell ranger,从拆库到定量
单细胞工具箱|Cell Ranger-V6.0 开启单细胞之旅(上)
专门分析10x genomic公司的单细胞转录组数据的软件套件
转录组分析学习笔记(持续补充)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服