打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
下载TCGA数据的工具
生信人

共同学习生物信息学知识,共同探究生物奥秘。

1、TCGA简介

美国政府发起的癌症和肿瘤基因图谱(Cancer Genome Atlas,TCGA)计划,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症(近期目标为50种包括亚型在内的肿瘤)的基因组变异图谱绘制出来,并进行系统分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后可以勾画出整个新型“预防癌症的策略”。

TCGA 使命:提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力

TCGA 目标:完成一套完整的与所有癌症基因组改变相关的“图谱”。


2、下载数据工具介绍

TCGA数据源大部分都是公开的,如何有效的进行收集和预处理 是一个头疼 的问题。

首先下载数据的方法有如下几种

官网、cBioPortal、ICGC、TCGA-Assembler、GenePattern

3、工具使用详解

(1)直接去官网下载。这个具体参考其官网的操作文档就可以啦。

(2)cBioPortal


点击下载数据按钮之后,可以按照目前研究的癌症的类型和发表的年代进行选择,然后选择相应的数据类型,比对snp突变,拷贝数变异和表达谱数据等。


这个工具最好的地方在于 ,你可以选择你感兴趣的基因,然后点击submit提交,坐等下载就可以啦。当然这个工具还是支持一些在线分析的。

(3)ICGC


ICGC 可以在搜索框中直接搜索你感兴趣的癌型。然后回车,选择相应的数

据。


选择相应的数据,然后点击下载。


然后选择想要下载的数据类型。


然后坐等下载,就可以啦。

(4)TCGA-Assembler

可以使用TCGA-Assembler这软件去下载TCGA的数据http://www.compgenome.org/TCGA-Assembler/。TCGA-Assembler不但可以很方便的下载数据,还能对数据进行初始化处理,非常方便。下载完后,我们使用首先要安装一些依赖包。通过下面的命令:
install.packages(c('HGNChelper', 'RCurl', 'httr', 'stringr', 'digest', 'bitops'), dependencies=T)

安装完了依赖包,我们进入刚才下载的TCGA-Assembler的目录,使用setwd(C:/Users/cloud/Desktop/TCGA-Assembler)设置TCGA-Assembler的目录为工作目录,接下来,我们就可以下载数据了。我们需要下载什么数据,就选择相应的脚本。具体代码见丁香网有具体的讲解

(5)GenePattern。小编没有具体用过,大家伙自己去尝试吧。

这些工具使用起来还是有其局限性,都不能够轻易获取每个癌症类型的二维数据矩阵(例如基因为rows,样本为columns)。

参考资料

http://www.cbioportal.org/public-portal/cgds_r.jsp

http://dcc.icgc.org/download/current

http://www.compgenome.org/TCGA-Assembler/ 

http://www.broadinstitute.org/cancer/software/genepattern/download/index

http://www.dxy.cn/bbs/topic/31315813

http://emuch.net/html/201403/7089959.html

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
2600多个基因组!Nature发布迄今最全癌症基因图谱,有望提前数十年识别出肿瘤突变
ICGC数据库SNP突变数据挖掘
TCGA癌症基因组图谱
ICGC是什么鬼?
6篇Nature齐发!癌症研究和云计算的里程碑
UCSC XENA - 集大成者(TCGA, ICGC)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服