打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
5+非肿瘤+WGCNA+机器学习,经典套路也能轻松拿捏5+,快上车!!

导语

今天给同学们分享一篇非肿瘤+WGCNA+机器学习的生信文章“Identification of biomarkers for the diagnosis of chronic kidney disease (CKD) with non-alcoholic fatty liver disease (NAFLD) by bioinformatics analysis and machine learning”,这篇文章于2023年2月27日发表在Front Endocrinol (Lausanne)期刊上,影响因子为5.2。

慢性肾脏疾病(CKD)被定义为肾脏结构或功能异常,持续≥3个月,原因可以是多种。流行病学研究显示,亚洲约有4.343亿人患有CKD,其中大部分来自中国和印度等发展中国家。有效控制慢性肾脏疾病是全球面临的一项巨大公共卫生挑战。

图1 本文主要研究思路的路线图

1. 通过WGCNA鉴定了NAFLD样本中的关键模块基因

GSE89632是用于研究非酒精性脂肪肝(NAFLD)的代表性数据集,作者使用它来获取与NAFLD最相关的模块化基因(23-25)。首先,作者使用WGCNA方法来识别与NAFLD最相关的模块化基因。基于尺度独立性和平均连接性,作者选择β=26(尺度无关R^2=0.85)作为“软”阈值(图2A)。然后,作者选择不同的颜色来表示9个基因共表达模块(GCMs),如图2B所示。NAFLD样本与GCMs之间的相关性显示在图2C中,而被认为是关键模块的深青色模块(412个基因)与NAFLD样本之间的相关性最高(相关系数=-0.85,p=5.3e-19)。此外,在深青色模块中,模块成员与基因重要性之间存在显著正相关(r=0.68,p=4.2e-57),如图2D所示。

图2 通过在NAFLD数据集GSE89632中使用WGCNA鉴定模块基因

2. CKD与NAFLD之间相关的共享基因的鉴定

接下来,在GSE104954数据集中找到了386个差异表达基因(DEGs),其中227个上调,159个下调。图3A展示了这些差异表达基因的火山图。图3B展示了数据集中前50个最显著的差异表达基因的热图。然后,将386个DEGs和412个模块基因进行交集运算,最终得到了45个与非酒精性脂肪肝相关的共享基因,如图3C的维恩图所示。

图3 不同表达基因(DEGs)和与非酒精性脂肪肝(NAFLD)相关的共享基因的筛选

3. 对45个与非酒精性脂肪肝相关的交集基因进行富集分析

为了探索NAFLD相关共享基因在CKD发展中的生物功能和途径,对45个共享基因进行了GO和KEGG富集分析。共获得了563个与生物过程相关的显著结果和23个KEGG信号通路。对共享基因进行了GO分析以揭示其生物功能(图4A-C)。正如作者所见,在GO类别中,大多数共享基因主要涉及“程序性细胞死亡”、“炎症反应”、“代谢过程的正调控”和“免疫系统过程”(BP);“细胞外基质”、“含胶原的细胞外基质”(CC);“DNA结合转录激活因子活性,RNA聚合酶II特异性”、“DNA结合转录因子活性”等(MF)。KEGG通路富集结果显示,最常涉及的通路是IL-17信号通路、TNF信号通路、MAPK信号通路、凋亡、Toll样受体信号通路等,这些通路与免疫反应和炎症密切相关(图4D)。

图4 45个NAFLD共享基因的GO和KEGG分析中的丰富项

4. 通过Cytoscape软件和机器学习鉴定与NAFLD相关的关键基因,并验证其差异表达

为了揭示每个蛋白质的相互作用,根据STRING数据库构建了共享基因的蛋白质相互作用网络(PPI网络)。图5A中有38条边和45个节点,随后使用Cytoscape软件进行分析。MCODE插件用于发现PPI网络中的重要模块,结果显示图5B中的两个簇中有8个关键基因紧密相连,作为重要模块。另一方面,根据随机森林算法确定了7个MeanDecreaseGini> 1.5的关键基因,如图5C所示。图5D中的Venn图显示了4个关键基因(DUSP1、FOSB、NR4A1、ZFP36)的交集,它们被用作与非酒精性脂肪肝相关的关键基因。此外,在另外两个慢性肾脏病数据集(GSE32591、GSE66494)中,这4个与非酒精性脂肪肝相关的基因明显下调(图6A、B),这与GSE104954的变化一致。

图5 通过Cytoscape软件和机器学习的交集来识别与NAFLD相关的关键基因

图6 通过两个CKD数据集验证了4个与NAFLD相关的关键基因的下调

5. 用ROC曲线评估CKD和NAFLD的诊断效能

在训练集GSE104954中,4个与NAFLD相关的基因(DUSP1、FOSB、NR4A1、ZFP36)的ROC曲线分别具有0.961、0.954、0.866和0.960的AUC值(图7A)。同时,在验证集GSE32591中,这些关键基因的AUC值分别为0.828、0.796、0.927和0.689,无法区分样本的来源是肾小球还是肾小管间质(图7B)。同时,在另一个验证集GSE66494中,这些关键基因的AUC值分别为0.958、1.000、0.889和0.932(图7C)。综合分析验证集和训练集的结果表明,这4个与NAFLD相关的基因可以作为慢性肾脏疾病的有效诊断标志物。

图7 通过ROC曲线在CKD和NAFLD数据集中验证了4个与NAFLD相关的关键基因的诊断效能

GSE104948和GSE104954作为姊妹数据集,分别代表了同一组样本的肾小球和肾小管间质转录水平信息。在GSE104948数据集中,4个与NAFLD相关的关键基因对CKD具有相同的良好诊断效果。同样,在数据集GSE32591中,对肾小管间质和肾小球样本进行了采样,并进一步探索发现这4个诊断标志物在不同解剖结构中显示出良好的效果。需要注意的是,这4个CKD诊断标志物在GSE89632数据集中对NAFLD也具有良好的诊断价值,其ROC曲线的AUC分别为0.951、0.968、0.974和0.915(图7D)。这一发现可能表明这四个基因在患有NAFLD的CKD患者的发展中起着重要作用。

6. 免疫浸润分析和相关性分析

根据富集分析的结果,与NAFLD相关的共享基因可能参与了CKD进展的免疫相关机制。因此,进一步探索4个诊断标志基因与CKD中免疫细胞浸润之间的相关性是值得关注的。首先,使用CIBERSORTx评估GSE104954数据集中22种免疫细胞的比例(图8A)。在CKD样本中,记忆B细胞、M1巨噬细胞、静息肥大细胞和γδT细胞的水平显著上调;然而,幼稚B细胞、调节性T细胞和活化肥大细胞的水平显著下调。接下来,探索了四个诊断标志基因与CKD免疫细胞的相关性(图8B)。FOSB表达与幼稚B细胞、调节性T细胞和活化肥大细胞的比例呈正相关,与静息肥大细胞、γδT细胞、M0巨噬细胞和M1巨噬细胞的比例呈负相关。ZFP36和DUSP1与调节性T细胞和静息NK细胞的比例呈负相关。NR4A1与B细胞初生、静止树突状细胞和激活肥大细胞的比率呈正相关,与静止肥大细胞、M1巨噬细胞和B细胞记忆呈负相关。在探索四个诊断标志基因表达之间的相互关系时,有趣的是它们彼此之间都呈正相关(图8C),这表明它们可能参与了一种共同机制来促进CKD的发展。此外,还探讨了免疫细胞的相互作用(图8D)。调节性T细胞和激活肥大细胞之间具有最强的正相关性(r = 0.53)。相反,静止肥大细胞与激活肥大细胞之间呈最强的负相关性(r = -0.83)。

图8 CKD样本的免疫景观和GSE104954的相关分析

与对照组相比,CKD样本显示出明显的免疫细胞浸润变化,并且四个诊断标志基因的表达与免疫细胞浸润显著相关。

总结

在这项研究中,4个与非酒精性脂肪性肝病(NAFLD)相关的基因(DUSP1、NR4A1、FOSB、ZFP36)被确定为慢性肾脏病(CKD)患者的诊断标志物,并且NAFLD可能通过免疫和炎症途径加速CKD的发展。还阐明了CKD中免疫细胞浸润的变化以及与诊断标志物的显著相关性。作者的研究可能为患有NAFLD的CKD患者提供诊断标志物和治疗靶点。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
3.9分 非肿瘤生信+实验验证 经典蹭热点思路 不到2个月接收
整合头颈部鳞状细胞癌神经浸润的临床和遗传分析解读
一文学会WGCNA分析
免疫浸润:凡是打不倒你的都会让你更强大
非肿瘤单基因如何做免疫浸润?
又是一篇4+分免疫亚型...别撞车了...
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服