打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
再次把Cell爆文的思路、方法用到自己的课题上

文末有【彩蛋】

CNS上的一些文章就是测测序、分析分析,用钱砸出来的吗?没钱不行,可是光有钱就行吗?Data driven,PLOS ONE的赶脚;我们崇尚hypothesis driven。我的课题要做成hypothesis driven,不要data driven。真实世界哪分得那么清楚?


今天小丫跟大家分享一篇典型的data driven + hypothesis driven 逐步深入的文章,从机制到临床靶标。每一块内容拆分出来,都是一篇10分的paper。上周发表于Cell,这两篇预热贴《Cell的模式图画反,反,反了》,《RNA-seq居然能挖出这么多机制!给你的文章加5分》说的就是它:

Chen, H., Li, C., Peng, X., Zhou, Z., Weinstein, J.N., Liang, H. and Cancer Genome Atlas Research Network, 2018. A Pan-Cancer Analysis of Enhancer Expression in Nearly 9000 Patient Samples. Cell, 173(2), pp.386-399.




用别人的数据发自己的Science | 给你的文章加5分》一文用别人的ChIP-seq数据,发现MYC通过结合PD-L1的promoter调控抗肿瘤免疫应答。本文用TCGA的RNA-seq数据,找到了调控PD-L1的enhancer,揭示了PD-L1的远距离调控机制





思路

第一步,Data driven

TCGA产生了那么多癌症数据,如何有效利用?我对enhancer感兴趣,能用TCGA的RNA-seq数据找active enhancer吗?先总体看看这些数据适不适合分析enhancer expression(Figure 1),结果还不错。发现:跟对照相比,肿瘤组织有着更广泛的enhancer activation

enhancer expression是啥,跟RNA-seq有啥关系?你需要补习这篇《RNA-seq居然能挖出这么多机制!给你的文章加5分


Figure 1. Overview of Enhancer Expression in TCGA RNA-Seq Data


接下来整合其他高通量数据,看看能找到什么线索。TCGA除了RNA-seq以外,还有CNV和mutation数据,整合这些数据,发现:肿瘤组织enhancer的激活与肿瘤非倍性呈正相关,而与点突变无关或轻微负相关(Figure 2)。

Figure 2. Enhancer Expression Is Associated with Different Types of Genomic Aberration


第二步,hypothesis driven

Data driven发现了有趣的规律:肿瘤组织enhancer的激活与肿瘤非倍性呈正相关机制是什么呢?

提出假设:非整倍性导致染色质开放,从而导致enhancer激活(Figure 3A)。

怎样证实这个假设呢?

既然model里的关键点是染色质状态,那就要用到open和closed chromatin的marker,用ATAC-seq和H3K27ac的ChIP-seq数据标识open chromatin,用H3K9me2和H3K9me3标识closed chromatin。对比发现:open和closed染色质的双链突变率(DSB rate)和点突变率的确呈现相反趋势(Figure 3B)。进一步整合Hi-C数据,证实DNA-DNA interection多的区域 DSB密度高,enhancer密度也高 (Figure 3C),再次证实了假设模型(Figure 3E)。

open chromatin跟转录调控有什么关系?ATAC-seq、H3K27ac、H3K9me2和H3K9me3跟染色质状态有什么关系?你需要补习这篇《等我有钱了,我也这样研究一个基因》里的两个视频。

Figure 3. A ‘‘Chromatin-State’’-Centered Mechanistic Model for the Interplay among Enhancer Activation, SCNAs, and Point Mutations


第三步,深入挖掘机制

上面的“非整倍性-open chromatin-active enhancer”模型最后影响了哪些关键基因,从而在癌症发生发展中起决定性作用呢?要揭示enhancer的功能,就要跟enhancer调控的基因联系起来,从共表达模式入手可以找到enhancer的靶基因。

作者整合了enhancer和mRNA表达数据,找出co-expression的gene和enhancer。这些gene和enhancer可能通过以下三种方式产生co-expression效果(Figure 4A):

模型一:causal relationship,enhancer的激活导致基因差异表达;

模型二:reactive relationship,基因位于enhancer上游;

模型三:co-responsive relationship,基因和enhancer都受其他分子的影响。

作者重点关注模型一,因为模型一是直接调控机制。从两方面着手:

首先看调控,enhancer突变是否导致基因表达的变化(eQTL);

然后看结合,enhancer跟gene是否形成loop(Hi-C)(Figure 4B)。

找到了65个这样的interactions,包括49个enhancer和47个gene(Figure 4C),其中有22个已知的原癌基因和8个抑癌基因(Figure 4D),80%的gene-enhancer interaction是正调控。鉴定出的gene-enhancer调控有可能是癌症发展中的关键因素,有潜力成为候选靶标,用于临床治疗。接下来选其中两个enhancer,深入研究。

你也想通过分析转录因子结合和共表达,来挖转录调控关系?强烈推荐这个整合了ChIP-seq和RNA-seq数据的在线挖机制工具去TCGA看表型,来CistromeCancer挖机制

Figure 4. Systematic Identification of Causal Enhancer and Cancer-Gene Interactions


第四步,挖掘临床价值

作者选了两个enhancer,深挖其临床价值。

No.1 位于chr22的enhancer,简称它为enhancer 22SYK可能是它的靶基因。从三个方面着手挖掘enhancer 22的功能:

  1. 哪些转录因子结合在enhancer 22上?查看ENCODE的ChIP-seq数据,发现有大量的转录因子在这个enhancer上有结合信号,预示着这里是调控网络中的热点hub(Figure 5A),原理看这篇《他中了国自然,因为最后一周补了这张图》。

  2. enhancer 22的变异会影响基因表达吗?先看转录水平,查eQTL,发现有3个SYK的eQTL。这两个在线工具教你查eQTL《变异会影响转录?SNP影响转录因子结合?RegulomeDB》,《non-coding区的SNP影响了转录?HaploReg视频》(Figure 5BC)。再看蛋白质水平,查TCGA的蛋白表达数据,跟转录水平一致,enhancer activity跟SYK蛋白表达水平正相关(Figure 5DE)。

  3. enhancer 22的变异影响了患者的生存期吗?在很多癌症类型里,enhancer 22变异患者的预后都很差(Figure 5F-K)。这里有方法:《TCGA,她已经用了七年 | 资深用户深度点评

至此,挖掘出enhancer 22的临床价值:利用enhancer 22调控SYK的这一特点,把enhancer 22作为癌症诊断的分子marker。仅这一部分就是一项完整的研究,妥妥的10分paper。

Figure 5. Enhancer 22 as a Prognostic Marker across Cancer Types


No.2,位于PD-L1下游140kb处,简称enhancer 9。从以下五个方面挖掘其功能:

  1. 共表达分析:多种癌症类型中,以及130种肺癌细胞系中,enhancer 9与PD-L1有着强co-expression(Figure 6AB)。

  2. enhancer 9的变异引起PD-L1的表达变化吗?答案是肯定的(Figure 6C)。

  3. enhancer 9和PD-L1之间能形成loop吗?7种人细胞系的Hi-C数据证实,enhancer 9和PD-L1之间形成了DNA-DNA结合(Figure 6D)。

  4. 哪些转录因子结合在enhancer 9上?ENCODE的161种转录因子数据当中,只有NF-kB在enhancer 9上有结合信号,同时NF-kB在PD-L1的promoter上也有结合信号(Figure 6E),这再次证实了NF-kB介导了enhancer 9和PD-L1的远距离调控。

  5. 敲除实验证实enhancer对靶基因的调控。采用经典的研究单个enhancer对靶基因调控作用的实验,发现敲除了enhancer 9的细胞中,PD-L1的转录水平和蛋白表达确实降低(Figure 6F-H)。

至此,揭示了一个NF-kB介导PD-L1激活的enhancer-promoter相互作用模型。仅这一部分又是一篇10分paper。

Figure 6. Enhancer 9 Regulates PD-L1, a Key Target of Immunotherapy


最后,看看本文一共整合分析了这么多数据,文中都有链接




【彩蛋】

本文通讯作者梁晗,副教授,美国德州大学MD安德森癌症中心生物信息与计算生物系。


2015年,小丫参加了梁晗老师主讲的龙星课程,课程主题就是TCGA,http://210.46.85.200/dragonstar/,对课程ppt感兴趣的小伙伴可以联系嘉因表观小助手,微信号:epigenomics

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
HACER:human增强子数据库
Cell的模式图画反,反,反了
关于增强子,你想知道的都在这里
他中了国自然,因为最后一周补了这张图
ENCODE V5 | 基因组调控预测数据库
新的生信套路已经出现,2021年发了217篇5+SCI,你学废了吗?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服