这一篇真的是耽误很久了,接上回(PySCENIC(一):python版单细胞转录组转录因子分析),我们继续完成pySCENIC的分析!本来想这一节可视化也讲了,但是不着急,我发现有些伙伴没搞明白原由,或者太会“衣来伸手饭来张口”,所以这里着重整理了需要下载的文件!!!
觉得小编内容有用的、有意思的,点赞、分享、关注一下呗!
❝1、《KS科研分享与服务》公众号有QQ交流群,但是进入门槛是20元,请考虑清楚。群里有推文的注释代码和示例数据,付费内容半价,还可以与大家交流。
2、单细胞转录组全流程代码需收费,收费代码包含公众号付费内容,也有很多新增加的内容。需进群或者需单细胞代码的小伙伴请添加作者微信了解,请备注目的,除此之外请勿添加,谢谢!
3、付费文章集合有打包价哦!
详情请联系作者:
❞
上一节说了pySCENIC的分析环境配置及安装,除了这些,还有一些必要条件,例如相关文件的下载,一些数据转化等等。
为了减轻大家的负担,文件我已经下载好了,包括人的、鼠的,以及转化文件的py脚本,已上传QQ群文件,群成员可在群里免费获取!
假设你完成了上面的步骤,那接下来的分析至少在代码上很简单,三个步骤,可能会等待一段时间,尤其是第一、二步骤,不过相比于R简直是神速。注意:建议还是用服务器(别开玩笑用免费的2G内存的服务器😂),除非你的数据不大可用≥64G内存的本机。
分析第一步:GRN---运行完得到sce.adj.csv文件
pyscenic grn --num_workers 10 \
--sparse \
--method grnboost2 \
--output sce.adj.csv \
sce.loom \
hs_hgnc_tfs.txt
#这一步的目的
#推断转录因子与提供的表达矩阵基因的共表达模块,基于grnboost2,R中时GENIE3
还是强调一句,学会自己解决问题,有些参数的意思可查询帮助文档,用下面的help命令就可以看,英文不好就翻译一下,没啥毛病。
#查看帮助函数,看看各个参数的具体解释
pyscenic grn --help
参考基因组的情况根据实际情况自行下载,当然我下载的也可以用,具体深入的原理有兴趣的可以去了解,我只是参考文献使用的!数据库更新了,用之前的文件会出错!
鼠的下载地址:
https://resources.aertslab.org/cistarget/databases/mus_musculus/mm10/refseq_r80/
人的下载地址:
https://resources.aertslab.org/cistarget/databases/homo_sapiens/hg38/refseq_r80/
分析第二步:RcisTarget---运行完得到sce.regulons.csv文件
pyscenic ctx --num_workers 10 \
--output sce.regulons.csv \
--expression_mtx_fname sce.loom \
--all_modules \
--mask_dropouts \
--mode "dask_multiprocessing" \
--min_genes 10 \
--annotations_fname motifs-v9-nr.hgnc-m0.001-o0.0.tbl \
sce.adj.csv \
hg38__refseq-r80__10kb_up_and_down_tss.mc9nr.genes_vs_motifs.rankings.feather
#这一步的目的
#进行TF-motif富集分析,识别直接靶标
#得到转录因子(TF)与其对应的直接作用的靶点,称为regulon(每一个regulon是1个TF和其调控的靶基因)
分析第三步:AUCell---运行完得到sce_SCENIC.loom文件,即分析结果
pyscenic aucell --num_workers 3 \
--output sce_SCENIC.loom \
sce.loom \
sce.regulons.csv
#这一步的目的
#使用AUCell对每个细胞的每个regulon活性进行评分。
以上就是pyscenic的分析内容了,可视化紧接着就来了,这次不会太久,也许就是明天,记得关注点赞。
联系客服