打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
去TCGA看表型,来CistromeCancer挖机制 | RNA-seq和ChIP-seq的完美结...

小丫改进了讲解方式,先铺垫背景,提出问题,然后讲解决方案,最后举出实际应用案例。


看效果,求反馈。






从基础研究人员到临床医生,TCGA,无人不知无人不晓。


没听说过TCGA?你一定错过了这些:《TCGA教程大合集:不会编程是常态,但永远难不倒努力前行的临床医生




TCGA能回答什么问题?


  1. 基因在哪个癌症里变异(mutation/deletion/amplification)频率高、表达量高

  2. 基因的哪个结构域经常出现变异?

  3. 哪些基因跟它一起/不一起变?有没有可能是合成致死基因对

  4. 这个基因的变异/高低表达影响了生存期吗?

  5. 基因的蛋白质水平和翻译后修饰水平有木有变化?



回答这些问题有什么用?如果不知道,你需要看这篇:《课题设计:收不完的病人查不完的房,临床医生如何快速地设计一个靠谱的课题?



从TCGA看到突变和表达差异,推测功能,做实验看到表型,证明了功能,能发paper;想发分,要做机制








基因通过怎样的调控机制发挥功能?


转录调控是机制研究的永恒主题。从转录调控这个最核心的调控机制入手,回答这个问题,无非是谁调控了它,它又调控了谁的问题。



哪个蛋白质调控我感兴趣的基因?》给出了研究某个基因受谁调控的策略和方法:


  • Plan A:基于大量ChIP-seq公共数据挖掘

  • Plan B:motif分析预测

  • Plan C:ATAC-seq结合motif分析




转录因子调控了谁?》给出了从基因组水平找靶基因的策略和方法:


  • Plan A:RNA-seq。直接调控?间接调控?傻傻分不清

  • Plan B:ChIP-seq。最直接,最有效,与RNA-seq整合分析更准确

  • Plan C:ATAC-seq motif分析。没有ChIP级别抗体,也能准确找到靶基因

  • Plan D:基于motif预测,这是个垫底儿的



上面这两套策略挖掘了转录因子和靶基因之间的关系,怎样才能把TCGA数据分析或实验发现的表型跟这些机制结合起来呢?下面回答本篇的核心问题:








怎样把TCGA中看到的表型跟转录调控联系起来?



Cistrome家族的新成员——CistromeCancer解决了这个问题,文章发表于2017年11月的Cancer Research。




CistromeCancer,http://cistrome.org/CistromeCancer/,整合了Cistrome Data Browser的23000套ChIP-seq和DNase/ATAC-seq,以及TCGA 33个癌症类型10000个肿瘤患者的RNA-seq、WGS、WES、DNA甲基化和生存数据,把转录因子在各种癌症中的靶基因,以及各种癌症中enhancer的分布情况清晰直观的呈现出来。从近距离调控到远距离调控,一网打尽。



RNA-seq和ChIP-seq还有另外一种整合方式——BETA,同样出自Cistome。



小美女介绍CistromeCancer的功能和用法的视频。



用TCGA的RNA-seq算出表达相关性高(包括正负相关)的基因,用ChIP-seq找TF结合在哪些基因附近,综合考虑以上两条证据,准确预测靶基因。




功能一:点击进入Cancer Transciption Factor Targets,搜索转录因子的名字,就会看到它在哪个癌症中表达量高(RPKM,绿色方块),更active(Expression Ratio,紫色方块),靶基因预测更可信(TF ChIP-seq prediction power,青色方块)。


下方红色方块矩阵列出ChIP-seq找到的靶基因,能看到哪些癌症类型中靶基因多,哪个靶基因跟TF表达变化趋势一致(方块呈红色),哪些相反(方块呈蓝色),ChIP-seq regular potential score越高,方块越大。





功能二:计算两个TF的靶基因有多少是重叠的,推测它俩的关系。




上面两个功能是CistromeCancer特有的


下面两个功能其他工具也有,在这里一站解决,很贴心的设计。



功能三:生存分析




功能四:肿瘤跟normal对比表达量RPKM




另外,CistromeCancer还有一个enhancer功能模块,用H3K27ac的ChIP-seq数据和DNase-seq数据标出了TCGA每个癌症类型的enhancer分布,改天详细介绍其应用。







用CistromeCancer阐释调控机制的案例


研究一个转录因子,用TCGA数据推测出它是原癌基因,想知道它发挥作用的机制。通过回答下面两个问题来阐释这个转录因子的作用机制:


  1. 它的靶基因参与哪些生物学通路?

  2. 它跟哪些转录因子的binding profile相似?



这篇文章还很贴心的举了两个应用案例,Figure和结果描述都可以放到research paper的正文里。



例子一


FOXM1在大多数癌症中都高表达(下图中的a),高表达FOXM1的乳腺癌患者预后较差(b)。FOXM1跟MYBL2, EZH2, E2F1, E2F2, E2F8, CBX3, TTF2, BRCA1,NCAPG, SSRP1, LIN9的靶基因有很大重叠(c)。其中FOXM1、E2F1、MYBL2的重叠最多,推测这3个转录因子在癌症中形成了regulatory module(d)。


这跟已有的报道一致:FOXM1在癌症相关生物学过程中高表达,包括细胞增殖、细胞周期、DNA损伤修复。


FOXM1的靶基因包括细胞周期调控因子cyclin B1和CENP-A,这与很多癌症类型中发现它们是FOXM1的靶基因一致。





例子二


STAT4在一种肾癌(KIRC)中高表达,高表达STAT4的患者预后差。STAT4的靶基因在KIRC中也都高表达,而且靶基因富集在免疫相关的功能,例如T-细胞激活、白细胞激活、免疫应答,这跟已知的STAT4的免疫相关功能一致。


同样有免疫细胞特异活性的IRF4,情况却不同。IRF4及其靶基因在结直肠腺癌(COAD-READ)中下调表达,高表达IRF4的患者预后更好。


用计算肿瘤免疫渗透的计算方法TIMER分析后发现,跟正常组织相比,KIRC的CD8 T细胞水平高,COAD-READ的CD8 T细胞水平低。CD8 T细胞的量跟KIRC中的STAT4和COAD-READ中的IRF4呈正相关。这表明KIRC中的STAT4和COAD-READ中的IRF4的转录活性影响的是免疫细胞的水平,而不是肿瘤细胞本身。










其他跨项目的整合分析(点击蓝色字,链接到技术贴):


TCGA  GTEx

GE-mini,用GTEx的健康人数据做为TCGA癌症样本的对照,在手机App上检索某个基因在癌症和normal中的表达量差异,发生差异表达的器官一目了然;


GTEx TCGA SRA

recount2,用GTEx、TCGA的RNA-seq和表型数据训练模型,建立方法,能够实现用RNA-seq数据预测表型。


GTEx ENCODE

eGTEx项目,打算把GTEx跟ENCODE整合起来,建立基因型、基因表达和疾病的联系。




本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
RNA-seq这样画图,国自然必得A
嘉因公众号目录
科学网
肿瘤表观遗传的好用数据库,快来看看吧
关于增强子,你想知道的都在这里
转录调控武器 (一):ChIP-seq修炼秘籍
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服