如需转载请注明来源:解螺旋·医生科研助手
·导语·
在大数据的时代背景下,高通量测序技术及基因芯片技术的快速发展,使得基因数据呈井喷之势。而GEO作为世界上最大的免费的储存基因表达的数据库,包含了大约16亿个测量值,这些输入的数据很多还没有被破解,只是以原始资料存在,研究者可进一步挖掘其中包含的生物信息。
今天老谈以“肠癌”为例,带大家走上寻宝之路,教教大家如何在GEO数据库上找到宝贝。(回复“热图”,可查看基因芯片数据分析的文章)
1、打开NCBI官网:www.ncbi.nlm.nih.gov。
2、搜索GEO的数据库,找到GEO DataSets。
3、搜索肠癌“Colorectal Cancer”,即可获得所有肠癌的芯片数据。
4、选择需要研究的芯片点击进入,例如我们搜索了一个II期肠癌的芯片数据库。
5、直接点击进入后,会获得该基因芯片的结果,并进入分析工具的页面。
6、在Data AnalysisTools中可以进行进一步的数据分析,例如将原有样本群按照自己需要的分类再进行细分,并可筛选需要了解的某基因的表达谱。例如,如果要找耐药相关的基因,P-gp可介导肠癌多药耐药,那我们就要从P-gp入手,搜索该芯片中P-gp的表达谱。
7、获得表达谱信息之后,在链接中可以发现Profile neighbors,即表达谱相近的基因,这就是我们需要寻找的与P-gp相关的有可能共表达的基因了。同样,通过GEO Profiles的搜索,也同样可以得到所有芯片数据中该基因的表达谱情况,并根据需求进行查找可能的共表达基因。
8、对所有该基因的表达谱分析后,同样可以获得可能的信号通路。
9、点击后,可直接转入Flink显示可能的通路,使用极方便。
联系客服