打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
千万不能错过的生信热点!6+m7G预后模型的生信思路!

导语

今天给同学们分享一篇基于m7G相关基因特征构建LUAD预后模型的生信文章“ Construction of a Novel Prognostic Model in Lung Adenocarcinoma Based on 7-Methylguanosine-Related Gene Signatures ”,这篇文章于2022年2月发表在 Front Oncol 杂志上,影响因子=6.244。作者首次总结了m7G相关基因在LUAD中的改变和预后作用,然后构建了基于m7G相关基因特征的预后模型,该模型能够准确、稳定地预测LUAD患者的生存率,并指导个体化治疗决策。

1.m7G相关基因的筛选和遗传图谱

经过筛选,作者发现了29个m7G相关基因,分别是AGO2、CYFIP1、DCP2、DCPS、EIF3D、EIF4A1、EIF4E、EIF4E1B、EIF4E2、EIF4E3、EIF4G3、GEMIN5、IFIT5、LARP1、LSM1、METTL1、NCBP1、NCBP2、NCBP2L、NCBP3、NSUN2、NUDT10、NUDT11、NUDT16、NUDT3、NUDT4、NUDT4B、SNUPN 和 WDR4。其中,12个DEMG(差异表达m7G相关基因),在535个肿瘤和59个正常TCGA-LUAD组织之间有显著意义,其中包括2个下调(NCBP2L、EIF4E3)和10个上调(DCPS、EIF4E1B、EIF4G3、LARP1、LSM1、METTL1、NCBP1、NCBP2、NSUN2和WDR4)肿瘤样本中的DEMG(图 1B)。使用HPA平台的IHC结果进一步验证了DEMG在正常和肿瘤组织中的蛋白质表达。如图2所示,METTL1、NSUN2、EIF4G3、LARP1、NCBP1、NCBP2在肿瘤组织中的蛋白表达高于正常组织,然而WDR4、EIF4E1B和NCBP2L的蛋白表达在肿瘤和正常组织中均为阴性。p <0.05 的 24 个 DEMG 之间的PPI网络如图1C所示,在这些DEMG中,EIF4E、EIF4E1B、EIF4E2、NCBP1、NCBP2、EIF4E3、AGO2、NCBP2L、CYFIP1和EIF4A1是前10个hub基因。Spearman的相关分析表明,EIF4E3与其他DEMG最频繁且负相关,如图1D所示。TCGA-LUAD队列中共有561个样本用于m7G相关基因的体细胞突变,观察到80个样本发生了突变事件。错义突变是最常见的变异分类类型,EIF4G3、LARP1、NSUN2、AGO2和CYFIP1是最常见的5个突变基因(图 1E)。

图1 流程图

图2 差异表达的m7G相关基因在的蛋白质表达

2. 基于每个m7G相关基因表达的生存分析

为了进一步验证每个m7G相关基因的预测作用,作者使用Kaplan-Meier方法进行了生存分析。如图3所示,大多数基因(包括CYFIP1、DCPS、EIF3D、EIF4E、EIF4E2、EIF4G3、LARP1、METTL1、NCBP1、NCBP2、NUDT4、NUDT11、SNUPN和WDR4)的高表达预示着显着较差的OS,相反,NUDT3的高表达预示着OS的改善(图 3)。

图3 基于每个m7G相关基因表达的总体生存分析

3. 基于m7G相关基因表达的共识聚类

基于29个m7G相关基因的表达相似性,应用共识聚类方法对TCGA和GSE68465队列的组合LUAD样本进行聚类。簇数k范围从2到9,当k=2时,共识矩阵的热图中显示了一个相对清晰的边界(图 4A),并且在共识指数得分的CDF曲线中看到了一个平坦的斜率。因此,作者选择k=2作为适当的簇数,并将936个LUAD样本分成两个簇,即簇1和簇2。接下来用 Kaplan-Meier生存生信分析来评估该聚类的预后价值。在两个集群之间观察到OS的显着差异。C1的OS较差(图 4B)。因此,与C2相比,C1的样本具有更高水平的基因表达,如热图所示(图 4D)。此外,其他临床病理学特征的变化在每个集群的样本之间没有显示出统计学意义。类似地,与C2相比,C1大多数m7G相关基因的表达更高。基于KEGG基因集的GSVA富集分析结果表明,非同源末端连接、剪接体、核苷酸切除修复、错配修复和细胞周期等细胞周期和DNA修复过程在C1中富集。C2在代谢相关通路中显着富集,例如酪氨酸代谢、花生四烯酸代谢、药物代谢细胞色素P450、细胞色素P450对异生物质的代谢、硫代谢和 α-亚麻酸代谢(图 4E)。从ssGSEA的结果中,我们发现一些免疫细胞的得分,例如活化的B细胞、活化的CD8 T细胞、活化的树突状细胞 (aDC)、CD56暗自然杀伤细胞、髓源性抑制细胞(MDSC)、巨噬细胞、肥大细胞、单核细胞、中性粒细胞、T滤泡辅助细胞、1型T辅助细胞和17型T辅助细胞在C2中显着富集(图 4C)。此外发现体细胞突变在C1中比在C2中更频繁(图 4F)。C1和C2中CNV的频率和位置也不同(图 4G,H),C2中的拷贝数丢失比C1中更频繁。

图4 基于 m7G 相关基因表达的共识聚类

4. 基于集群间DEG的新预后模型的构建和验证

使用“limma”包,首先在组合LUAD数据集中的两个集群之间筛选DEG,最终获得130个DEG。然后使用单因素Cox生信分析来探索112个与预后相关的DEG。为了防止模型过度拟合,进行LASSO-Cox回归建模以筛选与生存相关的关键DEG。使用这种方法,构建了一个具有四个基因的新型预后基因模型(图 5A、B)。合并的LUAD数据集以1:1的比例随机分为训练队列和内部验证队列,并将GSE72094数据集中的442个LUAD样本用作外部验证队列。根据训练组风险评分的中位值将样本分为高风险组和低风险组(图 5J-L)。大多数m7G相关基因的表达在高风险组中显着高于低风险组(图 5C)。如Kaplan-Meier生信分析所示,高风险组患者的OS明显低于低风险组患者(图 5D-F),类似地,随着风险评分的增加,更多的患者死亡(图 5J-L)。在训练队列中,本风险模型的1年、2年和3年预后的AUC值分别为0.734、0.691和0.676(图 5G),在内部和外部验证中观察到类似的结果组(图 5H)。t-SNE和PCA生信分析的分布模式表明,样本可以完全区分为高风险和低风险组(图 5M-O)。总之,这些发现证明了新型预后模型在LUAD患者中的预后稳健性。

图5 m7G相关基因特征的预后模型的构建和验证

5. 使用ROC曲线分析和C指数值比较预后模型和先前报告的模型

为了将预后模型与之前在LUAD中报道的其他模型进行比较,作者搜索了四项主要关注 m6A 相关特征的研究,这些模型中包含的基因数量从3个到27个不等。作者发现自己的模型的AUC和C-index值高于其他模型(图6A)。

图6 不同风险队列中的生信分析

6. 独立预后因素分析、临床相关性分析、列线图构建以及功能和通路富集分析

通过引入年龄、性别、TNM 分期和风险评分进行单因素和多因素Cox回归生信分析,以评估风险评分在 LUAD 患者生存预测中的独立性。选择单因素生信分析中p <0.1的变量进行多因素生信分析。在训练队列的样本中,结果显示年龄、T 分期、N分期和风险评分被确定为LUAD患者的独立负面预后因素(图 6B),并且在内部和外部验证中观察到相似的结果组。同时,在内部验证队列中,风险评分比其他临床特征在预测预后方面更有帮助。如图6C所示,热图显示了高风险和低风险人群之间临床病理学特征的分布。不同风险组在N分期、T分期和性别方面存在显着差异。为了便于使用风险模型,作者进一步构建了一个使用风险评分结合临床特征的列线图,如图6D所示。

通过考虑来自TCGA和GSE68465队列组合样本的高风险和低风险群体之间的DEG,作者进行了GO富集生信分析、KEGG通路生信分析和GSEA富集生信分析,以探索这些基因的潜在生物学功能。如图6E所示,“核分裂”和“细胞器裂变”是生物过程类别中最丰富的通路,“纺锤体”和“微管蛋白结合”是细胞成分和分子中最丰富的功能类别。细胞周期被确定为DEG的KEGG通路中最丰富的(图6F)。进一步进行GSEA富集分析识别高危亚组和低危亚组之间富集GO和KEGG的差异通路,结果显示细胞周期和DNA复制相关的生物学过程和通路在高危组中富集,然而,在低风险组中富集的生物学过程和通路与肿瘤的发生和进展弱相关(图6G)。

7.基于风险特征的免疫细胞浸润、免疫相关通路、肿瘤微环境和干性分析

ssGSEA用于量化两个风险组之间13个免疫细胞相关功能和16个免疫细胞的富集分数。有趣的是,在训练队列的低风险组中,一些免疫细胞的得分显着丰富(图 7A)。然而,细胞溶解活性、炎症促进、主要组织相容性复合物(MHC)I类、副炎症、I型干扰素(IFN)反应和T细胞共抑制等免疫功能的得分显着丰富。作者进一步分析了免疫细胞浸润与预后模型构建所涉及的基因表达之间的相关性,如图7D所示。高风险组的TIDE评分较低(图 7C)和大多数免疫检查点相关基因的表达较高(图 7E),这表明高风险组的患者可能受益于免疫治疗。此外,低风险组患者的 ESTIMATE、免疫和基质评分较高(图 7F),通过使用Spearman相关性生信分析,观察到风险评分和肿瘤突变负荷(TMB,图 7G,H)以及风险评分和mRNAsi评分(图 7I),这表明具有较高风险评分的LUAD患者具有较高的RNAss值和TMB。

图7 基于风险特征的免疫细胞浸润、免疫相关通路、TME和干性分析

8.基于m7G相关风险特征的药物筛选

作者评估了高危组和低危组之间对化疗和小分子药物的反应,在高危组中,共观察到57种IC50值明显降低的药物,同时,在低风险组中共观察到28种药物。根据治疗LUAD的常用药物,作者注意到高危组患者对顺铂、多西他赛、依托泊苷、吉西他滨、紫杉醇和长春瑞滨等化疗药物更敏感。

小结

综上所述,随着人们对RNA修饰认识的日益深入,m7G修饰逐渐成为近年来的研究热点,然而,仍然缺乏综合生信分析来总结m7G相关基因特征在LUAD中的作用。 在这项研究中,全面生信分析了LUAD中m7G相关基因的遗传特征和预后价值,然后进一步构建了基于m7G相关基因特征的新型预后模型,以预测生存和指导治疗决策。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
构建与验证免疫相关的预后模型来预测胰腺癌患者的预后
自噬相关基因模型在非小细胞肺癌中的预后意义
最新的7分预后模型有什么特别之处?
循环肿瘤细胞联合DNA甲基化,双热点9 纯生信是怎么做的?
肿瘤也有“冷”“热”之分?一篇简单易上手的5分纯生信文章,包你稳赚不赔
为什么他就发3+分我就被拒?因为他标题上有机器学习吗?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服