打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【文献解读】文献147:全基因组测序揭示胃癌的串联重复热点和预后突变特征

Whole-genome sequencing reveals novel tandem-duplicationhotspots and a prognostic mutational signature in gastric cancer

NATURE COMMUNICATIONS2019


背景

  • 胃癌(GC)是中国最常见的癌症,是中国癌症死亡的第三大原因。目前的研究大多是基于全外显子测序,主要关注编码区域的突变,但是全基因组测序(WGS)分析得到的结构变化和全基因组突变特征仍需被阐明。

  • 结构变异(SVs)常常导致肿瘤抑癌基因的破坏和致癌基因的扩增,在肿瘤发生和恶性表型中起着重要作用。结构变异机制尤其是复杂的结构变异在许多癌症中有很大比例的高水平扩增,但是在胃癌中研究甚少。

  • 与复杂结构变异相比,某些参考区域一个拷贝数扩增的串联重复(TD)经常在癌症基因组学研究中被忽略。Mendhi等人描述了一种称为TD表型(TdP)的染色体型,其特征在于频繁和分布式的TDS,并且显著地富集在三阴性乳腺癌、浆液性卵巢和子宫内膜癌中。NIK-Zainal等人进一步探索560例乳腺癌样品的全基因组测序的基因组特征,并鉴定出三个与不同长度TDs和缺失相关的SV特征。发现与大片段(>100Kb)TDs相关的33个热点,这些TDs富集在乳腺癌胚系易感位点和超级增强子调节元件上。zhang等人分析了12种肿瘤的全基因组测序结果,发现TD诱导的超增强子扩增能激活驱动基因。这些发现表明,与直接增加癌基因拷贝数的高水平基因扩增不同,TDs通过增加超增强子区的拷贝数来上调癌基因的表达。因此,在胃癌中发现由TDs驱动的新基因是很重要的。

  • 本研究使用来自国际癌症基因组联合会项目的168名GC患者的WGS数据来描述中国人群胃癌的SVs特征。研究发现GC中多种类型的SV和受影响基因,揭示了一个TD热点,涉及到ZFP36L2的编码序列和超增强子区域。

材料与方法

  • 本研究入组了来自国际癌症基因组联合会项目的168例未经化疗和放疗的中国胃癌患者,其中弥漫性胃癌77例,肠型胃癌91例。此外,143例(85.12%)肿瘤在胃内的位置明显(19.05%为贲门,20.24%为基底/体,45.83%位于角切口//幽门),并进行WGS测序,探索中国胃癌人群的SV特征。

结果

结果-1 胃癌样品的特征和分析方法

  • 相比肠型胃癌,弥漫性胃癌有更差的生存期(图A)

  • 肿瘤不同的位置也有不同的预后:近端肿瘤(贲门和底/体)明显较远端肿瘤(角切迹/胃窦/幽门)差(图C)

  • 临床分期和MSI状态也是预后的影响因素(图D、E)

  • 168个GC按照EBV,MSI,CIN分类,四类GC的OS不同,结果与先前报道一致(图F)。

结果-2 队列中的驱动基因分布

  • TMB分布范围0.7~195.9(图A),通过样品聚类分为超突变和常规突变。使用MutSigCV软件预测显著突变基因,TP53占比54.76%,除了TP53,还预测到12个先前报道的基因,APC (8.93%), MUC6 (8.33%), ARID1A(8.33%), GLI3 (7.74%), PIK3CA (7.74%), RNF43 (7.74%), CDH1(7.74%), KRAS (6.55%), CTNNA2 (4.17%), RHOA (2.38%), ZIC4(1.79%) 和PTEN (1.19%),这些基因至少在10%的胃癌中出现(图A)。

  • CNV显著峰可能包括潜在的驱动基因(图B),观察到有些染色体臂发生很高频率的CNV,包括7p,8q,13q,20p,20q和4p,4q,17p,21q和22q扩增(图C),还鉴定出80个频发扩增区和124个缺失区(图D),其中包括一些先前报道的显著突变基因EGFR、MYC、CCND 1、ERBB 2、CCNE 1CDKN2A(图D)。鉴定出两个新的局部扩增峰,分别含有ZFP36L2基因和MYB基因。

结果-3 体细胞结构变异和复杂结构变异模式

  • 识别到23264个SVs,平均每个样品有138 SVs,分别有8430 (36.2%) 缺失,6363 (27.4%) 串联重复,3642 (15.6%)染色体间易位,2696 (11.6%) 倒置,1131 (4.9%) 复杂的缺失,914 (3.9%) 向后倒置,88 (0.4%) 插入(图a),随机选取60个SVs,用PCR和sanger测序鉴定SV准确性,90%是真的SVs。

  • 超突变GC相比常规突变GC有更少的SV检出;伴有WGD事件的GC有更多的SV检出(图d)。SV与性别之间存在关联,SVs最高四分位数的患者36/42为男性(P < 0.001;Wilcoxon rank sum test, two side;图d)。

  • 在168个胃癌样品中发现15,038个重排断点会直接破坏基因序列,发现许多频发重排基因,有25个基因至少出现在10个样品中(图b),在染色体脆性位点最常受影响的基因有脆性组氨酸三联蛋白(57.9%)、宏结构域(44.4%)、氧化还原酶结构域(38.8%)、致癌和抑癌基因等,还发现了体细胞重排导致的811个帧内功能性融合基因,1148 帧外融合基因。

  • 研究发现双微体(62/168),染色体碎裂(8/168),BFB和kataegis(6/168)等复杂结构变异,其中双微体导致了致癌基因FGFR2CTNNB1的扩增,染色体碎裂有chr1,chr2,chr12,chr17;BFB导致基因的高水平扩增(copy number>=5)如EGFR,MYC,KRAS等(图c)。

  • 19q21区域的CCNE1基因是最明显的扩增和fold-back inversions,说明CCNE1的扩增是BFB导致的结果,另外,kataegis分析还检测到在6个肿瘤中存在多个重排的超突变区域。

结果-4 串联重复表型

  • SVs在肿瘤内的分布复杂。一些肿瘤具有较低的分散断点数目,而另一些肿瘤具有较高的特定SV类型,如缺失或TDs。这些SVs是多种类型重排共存的高度复杂的重排(图a),表明了胃癌独特的潜在突变过程。

  • TDP、OS以及TCGA分类没有相关性(图d),另外58%的TDP肿瘤是染色体不稳定性,染色体不稳定性可能会导致更多的结构变异,进一步证明了TDP与WGD的显著相关(图c)。

  • 基于Menghi等提出的算法,进一步把TDP肿瘤分成三类,TDP group1:TD峰值 ~11kb;TDP group2:TD峰值~231kb;TDP group1/2:TD峰值介于11kb~231kb之间(图b)。

  • TP53BRCA突变状态与TDP无相关性(图d)。相比之下,TDP group2与CCNE1 BFB事件显著相关(图e)。

  • 比较单个基因体细胞突变与TDP groups的关系,发现MUC16与TDP group1和group1/2显著相关(图f)。

  • 这些结果表明,这些致癌因素可能导致一种特定的结构重排(TDP)模式,可作为临床决策的一个生物标志物。

结果-5 串联重复热点

  • 用Glodzik提出的方法鉴定TD热点,结果显示2767个短TD(<100kb)有2个热点,2727个 100 kb–1 Mb的TDs包含17个热点,869个长TDs (>1 Mb) 包含5个热点。热点区域与GISTIC 软件得到的局部扩增峰值有overlap,例如ERBB2、MYC、KLF5等。说明TD热点可能有效的导致驱动扩增子的拷贝数增加;TDP患者包含多个癌症基因说明基因组水平的TD可能会导致癌变,研究发现ZFP36L2MYC基因的非编码区域附近有两个热点,这些区域通常会产生增强子,增强子结合转录因子激活致癌基因(图F)。

  • TD通常会导致重排区域的基因扩增,不同肿瘤的特定区域频繁发生TD,表明在这个热点区域可能存在与肿瘤发生相关的驱动基因。

结果-6 ZFP36L2基因在胃癌中的致癌作用

  • ZFP36L2基因是RNA结合蛋白家族成员,在不同癌症中表现出不同的作用,在胰腺癌中扮演者致癌基因的角色,但是在食管鳞癌中又是抑癌基因,但是该基因在胃癌中的作用还不得而知。

  • 18个胃癌扩增区域包含ZFP36L2基因和附近的非编码区域,其中8个扩增区域发生在基因区域和附近的非编码区域(图a)。发生ZFP36L2重排的18个胃癌相比配对正常组织有显著较高的蛋白表达水平。此外,还观察到该基因在胃癌中相比TCGA胃癌队列中非癌组织有更高表达(图b)。为了描述该基因在分子功能上的作用,本研究对正常胃上皮细胞系中的ZFP36L2基因进行过表达,结果显示过表达的ZFP36L2基因能促进细胞生长(图c)。菌落形成试验显示,过表达的ZFP36L2细胞集落形成显著增加(图d)。

  •  对胃癌细胞系HGC-27做ZFP36L2基因敲除实验,结果显示敲除ZFP36L2能显著抑制细胞生长(图e)。菌落形成试验显示,敲除ZFP36L2的细胞集落形成显著减少(图f)。在NCI-N87细胞系和其他胃癌细胞系中也是同样的结果。此外,异种移植实验显示ZFP36L2基因敲除能在体内抑制NCI-N87细胞的生长。这些结果都说明了ZFP36L2基因在胃癌中是潜在的致癌基因。

结果-7 ZFP36L2基因的超级增强子产生TDP热点

  • 在人类上皮癌中发现了MYC基因的超增强子与MYC致癌基因的过表达有关。结果显示13个胃癌样品中有MYC热点,以单个或嵌套的重排,发生在MYC超增强子(图a)。另外,在18个胃癌组织中还发现了ZFP36L2下游区域的扩增(图b)。有趣的是9%的HK WGS队列也发现这种现象(图c),其中有78%来源于TDs。

  • 队列中ZFP36L2基因下游区域的扩增和MYC超增强子有相似的SV模式,研究人员预测ZFP36L2基因下游区域的扩增可能会产生作用在ZFP36L2基因的超增强子,由于这些扩增与ZFP36L2下游500kb附近区域有重叠,因此从对应的胃癌组织中下载了DNase-seq的数据和H3K27ac染色质免疫沉淀数据,并在ZFP36L2下游500kb区域(外显子1-11)识别到11个增强子(图a)。

  • 在先前研究中,Hnisz等人基于胃癌H3K27ac的ChIP-seq数据发现了包含从e8到e11增强子的超级增强子,并进一步鉴定ZFP36L2基因下游区域的超级增强子的存在。

  • 为了更好的理解ZFP36L2相关的增强子,研究人员定义e1到e11的区域是一个超增强子,在TCGA胃癌和EAC队列中都发现了该超增强子的扩增,并且该扩增跟胃远端区域组织取样位置有一定的联系。

  • 增强子通过与基因启动子互作来调节基因表达,这种互作包含在拓扑关联域中(TAD),TAD在组织类型中是高度保守的。研究发现在基因区域和启动子区域有相同TAD的超增强子扩增(图a)。另外,从我们数据和HK-WGS数据中都能发现ZFP36L2的重排和扩增都有相同的TAD。

结果-8 ZFP36L2基因超增强子扩增导致过表达

  • 为了探索ZFP36L2的e5和e11增强子区域的功能,研究人员用CRISPR/Cas9系统分别删除了e5和e11增强子。sgRNA把Cas9靶向到e5和e11增强子边界,用PCR检测e5和e11的缺失(图e)。e5和e11增强子区域的缺失导致ZFP36L2表达的减少(图f)。这些结果表明ZFP36L2致癌作用主要是超增强子发生TD驱动的。

  • 基于H3K27ac峰将超增强子克隆到PGL3启动子质粒中。在SNU-719和NCI-N87细胞中进行荧光素酶报告分析,结果显示e5和e11增强子有最强的活性(图c)。e5和e11增强子的复制导致荧光素酶表达是单拷贝的e5和e11的2倍多(图d)。

结果-9 胃癌中的signature18*

  • 编码SNVs和非编码SNVs之间表现出不同的突变模式,编码区域相比非编码区域,CpG下发生的C>T转换增加,C>A和T>G突变减少。这些发现说明编码区域和非编码区域不同的突变特征。进一步比较编码区域和非编码区域的6个突变特征的比例,结果显示signature17*、age特征和signature18*有显著不同(图a)。Aging 特征在编码区域更容易发生,而signature17*、18*和ABOPEC特征在非编码区域比例更高。尤其signature18*在非编码区域几乎完全发生(图a)。非编码区域的Signature18*的突变比例比编码区域显著高。在HK-WGS队列中也发现在这种情况,这些发现说明了编码区域和非编码区域之间突变过程的变化程度是可变的。

  • 发生CDH1突变的胃癌有更高的signature18*比例,与弥漫型胃癌有关,Kaplan-Meier生存曲线发现signature18*预后更差(图d),多变量分析显示Signature18*预后的显著性独立于年龄,性别和TNM分期,在弥漫型胃癌中,signature18*相比其他特征有更差的预后。此外,胃癌队列和HK胃癌队列分别只有15.4%和25%发生CDH1 C>A突变(是signature18*主要特征)。事实上,只有15.9%的signature18*胃癌有CDH1突变,另外,signature18*主要发生在EAC全基因组区域和成神经细胞瘤编码区域,但是CDH1突变很少发生在这两个癌种中,这些结果支持一种假设,CDH1突变是signature18*的原因而不是结果。

讨论

  • 胃癌中发现一些包含CCNE1,EGFR,MYC等驱动基因的复杂SV;还发现了MYCZFP36L2超增强子区域的TD热点,且由TD导致的ZFP36L2超增强子的扩增会导致ZFP36L2基因表达上调,高表达的ZFP36L2会促进胃癌细胞的增长,还发现signature18*与预后差有关。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
全基因组分析阐明胃癌新致癌机制
《自然》重磅:哈佛科学家首次揭示,雌激素是导致乳腺癌关键致癌基因拷贝数扩增的直接“黑手”!
Nature:雌激素竟是导致乳腺癌关键致癌基因拷贝扩增的「元凶」?
LncRNA:LncRNA的前世今生以及临床思路分析
JAMA子刊:中山大学徐瑞华/邱妙珍团队,首次揭示中国遗传性弥漫性胃癌患者胚系变异特征!
15+分的纯生信:胃癌m6A​和肿瘤免疫微环境
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服