打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
R语言GEO数据处理(六)

# 5. 差异分析 -----------------------------------------------------------------

library(limma)

design=model.matrix(~group_list)

fit=lmFit(exp2,design)

fit=eBayes(fit)

deg=topTable(fit,coef=2,number = Inf)

colnames(deg)

#probe_id列,把行名变成一列

library(dplyr)

deg <- mutate(deg,probe_id=rownames(deg$probe_id));head(deg)

#symbol列,去重复

deg <- inner_join(deg,ids,by="probe_id");head(deg)

deg <- deg[!duplicated(deg$symbol),]

#标记上下调基因

logFC=0.1  #变化超过2倍的视为差异基因

P.Value = 0.01  #P值小于等于0.01视为显著

k1 = (deg$P.Value < P.Value)&(deg$logFC < -logFC)

k2 = (deg$P.Value < P.Value)&(deg$logFC > logFC)

change = ifelse(k1,"down",ifelse(k2,"up","not"))

deg <- mutate(deg,change);head(deg)

table(deg$change)

#ENTREZID列,用于富集分析

library(ggplot2)

library(clusterProfiler)

library(org.Hs.eg.db)

s2e <- bitr(deg$symbol,

            fromType = "SYMBOL",

            toType = "ENTREZID",

            OrgDb = org.Hs.eg.db)#人类

deg <- inner_join(deg,s2e,by=c("symbol"="SYMBOL"));head(deg)

write.csv(deg,file = "mydata.csv",row.names = T)

save(group_list,deg,logFC_t,P.Value_t,file = "mydata.Rdata")

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
HNSCC数据分析-GSE2379-GPL830-GPL91
skr!GEO芯片数据的探针ID转换
芯片数据和RNA
表达矩阵可视化大全
生信人的20个R语言习题及其答案
数据挖掘:从表达谱芯片原始数据(CEL)到探针注释
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服