打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
多个探针对应一个基因,取平均值或者最大值

这么简单的问题,总是有人问,而且总是有人不搜索就到处问,本来我是很生气的,后来想一想,应该是我们没有教会大家搜索,也不能全部怪新手。

以前我都是建议大家取最大表达值探针来作为基因的表达量,其实最大值也好,平均值也罢,中位值也好,都是有各自的优缺点。 而且芯片探针这种落后的技术,在这些地方本来就不准确,纠结这种细节意义不大。

平均值代码我给大家一个示范。

  1. BiocInstaller::biocLite('CLL')

  2. BiocInstaller::biocLite('hgu95av2.db')

  3. library('hgu95av2.db')

  4. library(CLL)

  5. data(sCLLex)

  6. sCLLex=sCLLex[,1:8] ## 样本太多,我就取前面8个

  7. group_list=sCLLex$Disease

  8. exprSet=exprs(sCLLex)

  9. exprSet=as.data.frame(exprSet)

  10. exprSet$probe_id=rownames(exprSet)

  11. head(exprSet)

  12. probe2symbol=toTable(hgu95av2SYMBOL)

  13. dat=merge(exprSet,probe2symbol,by='probe_id')

  14. results=t(sapply(split(dat,dat$symbol),function(x) colMeans(x[,1:(ncol(x)-1)])))

如果你看着这个代码,却不知道如何修改成最大值,median等,说明你应该是要好好学习编程了。

请学会搜索,3000篇员原创教程为你而发!!!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
生信人的20个R语言习题及其答案
R语言20练习题【完整版】
你肉眼能看几万个基因名字判断有没有重复的基因?
GEO数据挖掘流程——代码版(方便抄袭)
生信人的R使用
limma对基因芯片数据基因差异表达分析
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服