打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
富集分析

两类富集分析

  • A:差异基因富集分析(不需要表达值,只需要gene name)
  • B: 基因集(gene set)富集分析(不管有无差异,需要全部genes表达值)

A:差异基因富集分析(不需要表达值,只需要gene name)


-----------富集什么-----------
  • 最常用的基因注释工具是GOKEGG注释,这基本上是差异基因分析一定做的两件事。GO可以在GO:BP(生物过程),GO:MF(分子功能),GO:CC(细胞组分)三个方面分别进行注释,用的比较多的是GO:BP,但其他两方面也很重要。

  • 外还有一个软件不得不提,那就是IPA(Ingenuity pathway analysis),这是一个收费软件,有基本版和高级版。我个人觉得它的upstream regulator analysis还是很不错的。分子激活功能等也可以用用。另外一个就是它内置的热图功能。高级版我没用过,但是知道可以导出一些数据等。

--------什么是富集(原理)--------

富集的统计学基础是超几何分布,简单来说根据下面的Fisher精确检验(Fisher exact test)公式,对每个GO或KEGG term计算一个p值
p=(M/K)[(N-M)/(n-k)]/(N/n),其中
N:所有gene总数
n:N中差异表达gene的总数
M:N中属于某个GO term的gene个数
k: n中属于某个GO term的gene个数
p:表示差异表达gene富集到这个GO term上的可信程度

  • 当p<0.05或0.01,则认为差异表达gene显著到这个GO term上(自己定义p值)

  • 意义:提供的信息更集中,更有意义

---------------拿什么来富集---------------

得到的差异表达基因列表就可以,也就是说不需要其他的值

---------------用什么工具富集--------------

只能说实在是太多太多了。。。。但是用的时候要小心,因为你多用几个工具,即使设定同样的p值也会发现结果有出入,有时还差异挺大。

1 按使用方式来说(简单度)有3种

  • (1)在线版:最主流的就是DAVID,各种级别杂志总见其身影,使用非常简单,不再赘述。另外还有GatherGOrilla,revigo,还有很多很多我就不在贴了。网页版有网页版的好处,可以先大概看下自己筛选的genes。另外很多工具有很好的可视化功能,自己一一去探索吧。

  • (2)客户端版:IPA(IPA不是用的GO和KEGG数据库)和FUNRICH,后者更新速度很慢,但里面有好玩又实用的功能,并且可以加载自己的数据。

  • (3)R包:介绍一个就行了,那就是Y叔的clusterProfiler,我论文中的富集功能很多都是用这个包做的(还有的用了IPA)。


B: 基因集(gene set)富集分析(不管有无差异,需要全部genes表达值)


  • 好处:可以发现被差异基因舍弃的genes可能参与了某重要生理过程或信号通路(参看这里)   
  • 工具:GSEA
  • 使用方法:R(还是clusterProfiler)或客户端

作者:Y大宽
链接:https://www.jianshu.com/p/5505e2106be0
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
使用clusterProfiler进行GO、KEGG富集分析(有参情况)
GO、KEGG富集分析(一)有参情况
GO分析和KEGG分析都是啥?
3+经典非肿瘤生信套路,值得收藏学习!
「学转录组入门生信」第四周根据差异基因进行富集分析及解读
基因(蛋白)功能注释分析和功能富集分析(GO、KEGG)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服