打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
新年迎财神的正确方式

初五迎财神,晦气去去去,事业顺顺顺,运道旺旺旺,新年发发发!

最骚不过中西合璧呀!


要说生物医学界的财神,个人以为TCGA数据库算一个,毕竟给广大人民群众带来了无数的数据和文章!今天就给大家扒拉扒拉TCGA数据库的正确打开方式。TCGA,The cancer genome altas,https://cancergenome.nih.gov/


TCGA的里蕴藏着大量的数据,但是如何获取这些数据,成为了第一道门槛。之前给大家介绍过生信人开发的简易TCGA数据下载的小工具这么好用的TCGA数据下载工具?!,工具还是相当给力的,但是如若要进一步筛选想要的样本,又或者说有些肿瘤的数据下不下来(比如AML的),那还是得用到TCGA自带的下载工具。


我们首先在TCGA网站里勾选好想要下载什么样的样本,以及数据类型(比如是RNA-seq的count数据,或者是临床信息)


选好之后下载Manifest


然后打开GDC Apps下载TCGA官方的下载工具


解压之后就这么一个文件,我们把刚才下载的Manifest也保存在这个文件夹里


打开命令提示符cmd


然后在DOS界面里进入到刚才那个文件夹,我是放在D盘里的,所以先输入D:进入D盘,如果放到E盘里就输入E:


如果是放到C盘里,就输入CD..,退回到C盘的最初目录


接下来复制这个文件夹的地址(在地址栏右键鼠标)


粘贴过来之后


改成下图这样,cd\表示进入该目录


然后输入以下命令:

gdc-client download -m gdc_manifest.2018-02-20.txt

即可开始下载

其中gdc_manifest.2018-02-20是那个manifest的名字,但是切记要加上文件后缀——.txt


下载好的文件就在当前文件夹里了

觉得这个方法太复杂了?好吧,教你个傻瓜的。。

UCSC Xena (https://xenabrowser.net/heatmap/)


先选数据集


输入感兴趣的基因列表


我比较憨,我对自己芯片结果里所有的差异基因都感兴趣,所以我就把整个差异基因的Gene list搬运到了这里。右边这个表可以和左边的一毛一样,也可以随便填一下。


数据量大了,自然就会很卡,毕竟1000X1000的矩阵。。。所以最好还是悠着点,不要像我这样划船不靠桨全靠浪。


右上角可以下载数据结果,也可以下载热图的PDF,和基因表达数据的矩阵文件


在弹出无数次的以下页面后,我终于把自己浪死了!


所以还是不要用力太猛,悠着点,我们减少点基因数量重新来过。。。


下载的PDF结果


TSV文件刚包含了基因表达信息和对应的样本信息矩阵,走过TCGA分析流程的童鞋就会知道,能一下子得到这下面这张表格是多么方便的一件事情!节省了多少工作量!


好了!今天两个TCGA的工具——TCGA自带下载工具GDC Apps和UCSC Xena就介绍到这里了!祝大家文章基金全都有,金银财宝滚滚来!


关注后获取《科研修炼手册》1、2、3、4、5、6,基金篇精华合集

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
TCGA数据库33种癌症临床数据、mRNA表达矩阵全部下载,可直接获取矩阵
使用gdc-client批量下载TCGA数据
可能是最适合初学者的TCGA官网下载和表达矩阵整理教程
常用生物信息数据库的使用(一)
TCGA越来越火,但问题是……你连脚本是啥都不知道
用命令行下载TCGA癌症数据
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服