打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
8+生物信息学+机器学习,机器学习加持生物信息学,文章高分也easy!!

导语

今天给同学们分享一篇生物信息学+机器学习的生信文章“Identification of immune-related genes in diagnosing atherosclerosis with rheumatoid arthritis through bioinformatics analysis and machine learning”,这篇文章于2023年3月9日发表在Front Immunol期刊上,影响因子为8.786。

越来越多的证据表明,类风湿性关节炎(RA)可能会加重动脉粥样硬化(AS),作者的目标是探索AS和RA患者的潜在诊断基因。

1. 鉴定差异表达基因

从RA组合数据集中,共鉴定出2,705个差异表达基因(DEGs),其p值<0.05且|log2FC| > 1.2。图1A和B分别展示了这些DEGs的火山图和热图,揭示了它们的差异表达模式。同样地,对于AS,使用相同的截断标准(p值<0.05且|log2FC| > 1.2),共鉴定出5,322个DEGs。图2A和B描述了这些DEGs在AS中的差异表达模式。

图1 AS组和对照组之间的不同表达基因

图2 通过Limma和WGCNA模块基因在RA中鉴定DEGs

2. 加权基因共表达网络分析和关键模块识别

作者使用加权基因共表达网络分析(WGCNA)构建了一个无标度的共表达网络,以识别与RA最相关的模块。基于尺度独立性和平均连接性,作者选择了一个“软”阈值β为7(图2C、D)。生成了RA和对照的聚类树状图,并得到了26个不同颜色的基因共表达模块,合并阈值为0.25,最小大小为50(图2E-G)。临床相关性分析结果显示,粉色模块与RA的关联最高(r = 0.73,p值<0.001)(图2H)。因此,作者选择了由206个基因组成的粉色模块进行进一步分析。作者进行了模块成员和基因重要性之间的相关性分析,并发现它们之间存在显著正相关(相关系数=0.64,p值<0.001)(图2I)。这些结果表明,粉色模块中的基因与RA最密切相关。

3. RA的功能富集分析

为了验证GSE55457的可靠程度,作者对Limma和模块基因的交集进行了富集分析。共获得了164个共同基因,如图3A所示。

图3 RA基因交集的功能富集分析

KEGG分析表明,常见基因参与了“p53信号通路”和“凋亡”过程,如图3B所示。GO分析结果显示,常见基因富集在生物过程(BP)方面,包括“免疫系统过程”、“免疫应答”和“免疫应答调节”,如图3C所示。对于细胞组分(CC)本体论,常见基因参与了“细胞质”、“细胞核部分”和“细胞核腔”,如图3D所示。在分子功能(MF)方面,结果显示“药物结合”是常见基因中最显著的术语,如图3E所示。

结果表明,RA的常见基因与免疫反应有关,与RA的发病机制高度相关。

4. 通过蛋白质相互作用网络对AS与RA进行富集分析和筛选节点基因

AS和RA的DEGs交集中包括53个基因,如图4A所示。为了探索RA相关基因与AS发病机制之间的关系,基于这些基因进行了富集分析。KEGG分析显示,这53个基因主要富集在“NF-kappaB信号通路”和“神经营养因子信号通路”,这些通路与免疫系统密切相关,如图4B所示。GO分析显示,这些基因参与了“NF-kappaB信号通路”、“I-kappaB磷酸化”(BP)、“细胞质”、“细胞骨架”(CC)和“转移酶活性”(MF),如图4C-E所示。

图4 对RA与AS的共同基因进行功能富集分析,并利用PPI网络识别节点基因

构建了一个蛋白质相互作用网络,其中有22个基因可以相互作用,如图4F所示。节点基因在图4G中按节点编号进行了排名。

5. 通过机器学习识别候选关键基因

利用LASSO回归和RF机器学习算法,作者确定了与AS伴RA诊断相关的潜在候选基因。LASSO回归分析确定了与该疾病密切相关的22个基因(图5A、B)。在RF算法中,作者根据平均准确率下降(MDA)和平均基尼指数下降(MDG)等指标评估了基因的重要性(图5C、D)。计算了这些基因在LASSO回归中的AUC和95% CI,以及在RF机器学习算法中MDA和MDG的交集,并绘制了ROC曲线。结果显示,LASSO回归(AUC 0.999,CI 0.971–1)和RF机器学习算法(AUC 0.995,CI 0.971–0.986)具有较高的准确性(图5E、F)。RF中排名前15位最重要基因与LASSO中的22个基因的交集在图5E中可视化,确定了六个基因(NFIL3、EED、GRK2、MAP3K11、RMI1和TPST1)作为最终验证的关键诊断基因。

图5 机器学习在识别AS相关的RA关键诊断基因方面的应用

6. 诊断价值评估

作者使用六个关键的诊断基因构建了一张图表,如图6B所示。通过构建ROC曲线计算这些基因的AUC和95% CI,以评估其诊断效能,如图6A所示。结果如下:NFIL3(AUC 0.907,CI 0.8515–0.9622),EED(AUC 0.915,CI 0.8582–0.9712),GRK2(AUC 0.986,CI 0.9669–1),MAP3K11(AUC 0.954,CI 0.9089–0.9984),RMI1(AUC 0.953,CI 0.9157–0.9903),TPST1(AUC 0.815,CI 0.723–0.9076),以及nomogram(AUC 0.996,CI 0.9839–1)。作者使用GSE55235和GSE73754验证了该模型,如图6A所示。所有基因和nomogram对于AS伴有RA的诊断具有很高的价值。

图6 建立诺莫图和诊断价值评估。

7. 免疫浸润分析

由于与RA相关的关键诊断基因可以调节AS的发病机制,并且主要富集在免疫系统中,免疫浸润分析可以更好地探索免疫在AS中的作用。对于AS组和对照组,22种免疫细胞的比例如图7A所示。箱线图显示,与对照组相比,AS组中的原始B细胞、浆细胞、CD4+原始T细胞、CD4+记忆激活T细胞、滤泡辅助T细胞、活化NK细胞、单核细胞、M0巨噬细胞、M1巨噬细胞、M2巨噬细胞、静止肥大细胞和活化树突细胞水平较低,而记忆B细胞、调节性T细胞、γδT细胞和活化肥大细胞水平较高,如图7B所示。22种免疫细胞的相关性表明,CD4+记忆静止T细胞与单核细胞呈正相关(r = 0.55),单核细胞与M0巨噬细胞呈负相关(r = -0.64),CD4+记忆静止T细胞与M0巨噬细胞呈负相关(r = -0.72),所有相关关系如图7C所示。总之,免疫细胞在类风湿关节炎患者中的不同程度渗透可能成为潜在的治疗目标。

图7 AS和对照组之间的免疫浸润分析

总结

在这项研究中,作者成功地通过生物信息学分析和机器学习算法鉴定出了六个与免疫相关的中心基因(NFIL3、EED、GRK2、MAP3K11、RMI1和TPST1)。这些基因显示出潜力成为类风湿性关节炎(RA)患者中强直性脊柱炎(AS)的诊断候选基因。此外,作者的研究还突显了AS合并RA患者中的免疫功能紊乱。作者还构建了一个用于诊断AS合并RA的图表,可辅助临床决策。总的来说,作者的发现可能为AS合并RA的发病机制和诊断提供新的见解。进一步的验证研究有必要确认这些基因在AS合并RA中的临床相关性。对这篇文章的思路感兴趣的老师,欢迎扫码咨询!



生信分析定制服务

请扫描下方二维码

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
科研│ 浙江大学医学院 : 早期类风湿关节炎特异性潜在生物标志物:血液/免疫系统特异性表达的基因(国人佳作)
当生信扯上免疫浸润,非肿瘤纯生信分析也可以轻松发7
非肿瘤也能做预后模型,只要分析的好,4.9分SCI不是梦!
教你发8分 癌症预后模型!
又见8+基于单细胞marker基因的纯生信文章,仍然可以模仿并超越!
单细胞转录组实战06: pySCENIC转录因子分析(原理)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服