打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
转录组不求人系列(八):edgeR分析转录组测序数据及差异基因筛选

转录组差异基因分析有很多包,常见的或者公认的却只有这么几种,edgeR包介绍完之后,我想所有人应该能够轻松应对普通转录组的差异分析了。

还是利用上节的数据:

setwd("F:/生物信息学")A <- read.csv("GSE169758_markdup.featco.2.counts.csv",header = T,row.names = 1)

安装并加载R包:

BiocManager::install('edgeR')library(edgeR)

edgeR包的应用很广,可应用于基因、外显子、转录本的差异表达。edgeR还有个功能是可以分析没有生物学重复的样本,从帮助文档查看获取合适的方法,当样本没有重复,但是想看差异的时候可以试试。但是还是建议所有的生物学实验都设置重复!!!

edgeR需要传入的数据也是row counts。指定分组:

group <- rep(c('Mcc', 'Pan'), each = 6)

构建 DGEList 对象:

dgelist <- DGEList(counts = A, group = group)

过滤低质量count 数据,并对数据进行标准化:

keep <- rowSums(cpm(dgelist) > 1 ) >= 2 #方法的选择依据具体情况dgelist <- dgelist[keep, , keep.lib.sizes = FALSE]norm <- calcNormFactors(dgelistmethod = 'TMM')#方法的选择依据具体情况

差异表达分析,首先根据分组信息构建分析矩阵,分组这里要注意,一定是Control在前,处理组在后。

design <- model.matrix(~group)

估算表达离散值并进行拟合,拟合方法有很多选择:

dge <- estimateDisp(norm, design, robust = TRUE)fit <- glmFit(dgedesignrobust = TRUE)df <- topTags(glmLRT(fit), n = nrow(dgelist$counts))df <- as.data.frame(df)

最后得到差异基因列表:

将结果保存,可以手动筛选或者和上节一样代码筛选:

write.csv(df, file='df.csv')

至此,普通转录组差异分析三大R包全部介绍完毕,接下来会说一些细节的问题,包括基因注释等等。当然还有大家最关心的数据可视化,力求用最好的方法和图形呈现转录组数据结果,让你的paper大放异彩!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
R语言利用edgeRpackage进行基因差异表达分析举例
Bulk RNA-seq | 第4期. 差异分析三巨头,该了解一下了
TCGA数据库的利用(三)—差异表达分析!
使用 R 语言 edgeR 包对RNA
RNA-seq数据| edgeR、limma、DESeq2三种差异表达包比较
简单使用DESeq2/EdgeR做差异分析 – 生信笔记
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服