打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
公共数据库挖掘必备(2)—芯片差异分析神器

在上一期的推文中,小编为大家介绍了如何分析meQTL,帮助了一些被GWAS数据困扰,无法对显著的SNP位点功能进行解释的同学们,让他们对自己的研究有了一些新的思路,小编是非常开心的。由于在公共数据库的资源中包含了大量的芯片数据,所以今天小编为大家介绍两款差异分析的软件,基本上可以满足大家对于芯片差异分析的所有要求。这两个软件就是TranscriptomeAnalysis ConsoleGeneSpring

由于大家对于Gene Expression Omnibus数据库了解很多了(GEOhttps://www.ncbi.nlm.nih.gov/gds/),我就在此处不多讲了。此外,还有一个很大的表达数据库,是ArrayExpress(https://www.ebi.ac.uk/arrayexpress/),大家如果需要寻找感兴趣的疾病数据,不防来这个数据库里搜索一下,记得要一起下载好芯片的注释文件。小编尝试过,数据还是非常丰富的。

  

A.       TranscriptomeAnalysis Console

首先,为大家介绍的差异分析软件是Transcriptome Analysis Console。这款软件是由ThermoFish公司开发,和GeneSpring相比,最大的优点就是完全免费,理论上来说也更加适用于Affymetrix的芯片。这个软件可以处理的数据包括:GeneArrays, 3‘Expression Arrays, Exon Arrays, miRNA Arrays等。此处,我们以AffymetrixmiRNA 4.0版本的芯片为例。其分析流程如下图所示:

 

1.       首先大家需要注册一个登录账户,并且下载好你将要分析的芯片的注释;

 

2.       .CEL的芯片数据导入,选择ImportCEL Files

 

3.       Condition中可以标记样本的不用处理,此处选择Comparison,对于有多种不同亚分组的样本,也可以对样本进行进一步分类;在Summarization中需要选择你所研究的不同物种,我们是小鼠的样本,所以选择MouseOnly

4.       在这一步就可以对你的数据进行一个基本的分析了,如PCA,Signal Box Plot, Probe intensities,这些数据可以帮助你对于芯片测序的基本结果有一个大体上的了解;

5.       点击RunAnalysis,就可以得到差异基因,并且生成所需要的图,你所需要做的就是将图和结果导出来就可以了。

 

B.       GeneSpring

对于GeneSpring的强大,小便就不重复了,大量文献中芯片差异分析都是用的这个软件,该软件是由安捷伦公司开发的。此处小编给大家做一个使用的介绍。

1.        在导入.CEL文件时,要确定软件是否可以识别你的芯片,如果不行就尝试以下两种办法,1是下载的column中查找,如果还没有就要在公共数据库中下载你的芯片的注释信息,普遍来说,注释信息作者都会和数据一起上传。此处为大家讲解如何自己建立一个注释信息的平台。

2.        选择AnnotationCreateTechnologyCustomfrom file选项。之后选择物种,并且导入你所要研究的芯片表达信号矩阵和注释矩阵。此处需要注意的是,表达矩阵和注释矩阵需要修改为可以识别的格式。

3.        Text qualifer选择双引号,数据会将文件自动分开,其余选项默认就可以。之后的标题格式调整也不需要做任何修改。

4.        定义信号行,操作如下图所示。之后是对注释文件的读取,默认参数,一路Next就好。

 

5.        将定义的信息和矩阵的信息对应起来,不同信息类型仔细分类,记得检查它们是一一对应的。

6.        此时注释文件平台就搭建好了,现在要做的就是导入你的数据了。点击Project,New Experiment

7.        如果你使用的数据是GEO下载的数据,就不需要标准化了。如果是新的数据,还有必要做一次标准化的处理。

8.        之后就是在Workflow中的ExperimentGrouping对样本进行分类,定义CASE/CONTROL,求差异,画图。

相对于GeneSpring来说,TranscriptomeAnalysis Console有两个优势。第一就是这个软件是免费使用的,下载好注册后就可以使用了;第二就是在软件中就可以下载好芯片注释文件,对于GeneSpring来说,很多的注释文件都需要人工的导入其中,比较繁琐。但是就功能来说,两个软件都是非常强大的。更多的功能还需要你去仔细研究。


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
找差异分子案例实践——万能芯片数据分析(五)
大数据系列-找差异分子案例操作实践(四)
手把手教你GEO数据库表达谱差异基因分析(下):GEO2R
一文解决GEO芯片数据分析80%的工作!建议收藏!
circRNA-seq分析的一般流程
领视频:富集分析 寻找差异分子案例实践——操作&答疑【沙龙第十期】
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服