打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
科研 | 墨尔本大学:机器学习应用于全血RNA测序数据揭示了系统性红斑狼疮患者的不同亚群


编译:夕夕,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

目的:系统红斑狼疮是(SLE)是一种异质性自身免疫性疾病,治疗困难。目前SLE患者没有最佳分类。因此,患者对于现有治疗反映是不可预测的。本研究基于对患者全血转录组分析,为SLE患者制定了一种新的分类方案。

方法:作者使用机器学习的方法分析RNA测序数据,基于样本基因表达水平将SLE患者分为四类。对最近发表的三个全血RNA测序数据进行了meta分析,本研究另外采用了30SLE患者和29例健康人的数据集,共161例患者和57例健康人的数据进行了分析。

结果:与未分类的SLE患者相比,对SLE分类簇来说揭露了一些临床表现相关的疾病基因的表达模式的差异。此外,成功鉴定到了与疾病加剧恶化相关基因。

结论:考虑到SLE疾病异质性是阻碍临床试验设计和充分管理患者的重要挑战,作者的方法使我们加深了对SLE异质性的理解,为解决这一限制开辟了新的可能性。基于基因表达水平对患者进行分类是一个有价值的策略,可用于识别支持SLE疾病的单独分子机制。此外,这种方法可以用于了解对治疗反应的可变性,可用于提升临床试验设计和改善个体化治疗。

论文ID

原名:Machine learning applied to whole-blood RNA-sequencing data uncovers distinct subsets of patients with systemic lupus erythematosus

译名:机器学习应用于全血RNA测序数据揭示了系统性红斑狼疮患者的不同亚群

期刊:Clinical & Translational Immunology

IF: 7.271

发表时间:2019.10

通讯作者:william A Figgett

通讯作者单位:Department of Microbiology and Immunology, University of Melbourne

DOI号:10.1002/cti2.1093

实验设计

结果

作者对30个SLE患者和29个健康人提取全血进行RNA-seq并鉴定差异表达基因,除此之外,还分析了3个公共数据集(共161个SLE患者和57个健康人),见表1。

患者和健康人采样信息
使用limmar/edgeR进行差异分析时考虑不同批次的数据对结果的影响或使用BatchQC计算数据ComBat作为数据的已知协变量并确认批次变化对数据的影响。PCA分析表明SLE样本中具有更高的基因表达异质性(图1a)。使用PLSDA进行监督聚类。PLSDA方法为基因指派的更高的权重,可以更好的将健康人和SLE患者分开(图1b)。聚类热图显示SLE患者具有异质性(图1c),可以将SLE患者分类几个明显的簇。

图1 SLE患者差异基因

作者使用非监督k-means方法将患者聚为四类,C1-C4;使用PCA图进行可视化(图2a)。作者使用PLSDA将两个最大的数据集(1和2)分开,导致将相似的基因权重值分配给了四个簇,表明该聚类算法在独立样本研究中表现较好。应用了监督机器学习,证实了分类软件可以训练学习每个簇的转录本特征,准确的对新患者进行分类。

图2 患者聚类情况

C1与C2-C4相比,与健康样本的最相似。对差异基因进行富集分析,表明每个簇之间功能的差异(图2b)。有趣的是,anti-Ro自身抗体活性在C2和C4簇内增加,而且C4是显著增加(图2c)。

根据SLEDAI-2k(图3a)和PGA打分(图3b)结果显示,从C1到C4其疾病的严重程度逐渐升高。在C4中Anti-dsDNA自身抗体的比例明显提高(图3c)。流式细胞结果显示C3中循环中性粒细胞数量明显增加(图3d)。中性粒细胞可能是肾炎的潜在诱因,但在作者的研究人群中,没有发现有或没有肾脏疾病的患者中性粒细胞数量有显著差异。使用’xCell’计算富集打分,表明在一些特定类中一些免疫细胞类型具有显著差异。特别是,C3中血浆细胞基因显著下降,而B-细胞和CD8+T细胞基因在C3和C4中显著下降。NKT细胞基因在C4中显著升高,而cDC基因在C4中显著下降。M1和M2巨噬细胞基因没有明显变化。

图3 SLE亚型的疾病严重性和临床特征

数据集2中的30例患者均符合美国风湿学会(ACR)标准(图3e),尽管每个簇之间都具有一些明显差异。例如,C4具有更高的可能患肾脏疾病和盘状皮疹而C2更可能患浆膜炎(图3f)。
为了进一步研究基因表达模式和临床特点之间的关系,作者使用三个独立的数据集(1+3+4)训练一个ECOC分类器。随后又数据集2来进行分类。其预测结果与临床表现类似,表明机器学习可以作为一种可靠的方法来检测独立患者和临床特征差异。

通过比较SLE簇中与SLE相关的基因的表达水平,作者发现有证据表明不同发病通路可能与每一簇患者相关(图4)。BAFF的过表达是自身免疫的驱动因素。有趣的是,C4中BAFF显著高表达,随后是C2和C3(图4a)。TNFSF10 mRNA在SLE中上调表达(图4b)。据此前报道,CFLAR在SLE患者的B细胞中上调表达,并和疾病具有明显相关性。这可能阻止了凋亡信号的相应配体,如TRAIL和Fas配体。作者研究研究表明CFLAR在C3和C4中过表达(图4c)。

过多的TLR受体信号涉及自身免疫,TLR2,TLR7和TLR9是SLE的潜在治疗靶点。过多的TLR信号可能加快非特定的免疫细胞激活。有趣的是,TLR在C2中显著上调,C3中下调表达。PELI1在C3和C4中上调表达(图4e)。CD40L,受CD40LG的编码。CD40LG在C2,C3,C4中表达量显著减少(图4g)。IFNAR1表达量在C3和C4中显著增加,表明干扰素信号敏感性增加(图4h)。CTLA4表达量在C3和C4中显著减少,表明效应T细胞调节功能受损(图4i)。干扰素特征度(ISM)是三个干扰素调控基因(HERC5、CMPK2和EPSTI1)的mRNA表达的综合评分。这些基因的表达在C2和C4中持续上调(图4j-l)。作者验证大量通过GWAS方法发现的与SLE相关基因的表达水平,发现这些基因大部分在C4中差异表达。

图4 已知SLE相关基因的表达水平

讨论

由于SLE临床表现的异质性和治疗结果的不可预测性,目前仍然缺少有效安全的治疗SLE的方法。SLE仍然是一种长期预后不良的疾病。长达六十年的SLE临床试验只产生了一种新的治疗方法,贝利单抗,对患者的功效不一。由于选择患者时临床标准的局限性,其不能捕获到潜在的基础疾病的分子机制,大规模的临床试验都无一例外的无法证明治疗方法的有效性。

作者对病人全血进行转录组测序,根据基因表达水平将病人分为四类。这个分类结果由于主改进临床试验的设计,更有效的针对不同的SLE患者进行靶向治疗。回顾分析以往失败的临床试验可能会发现一些临床试验对特定的患者群的疗效更高。

以前也有关于对SLE病人取全血进行芯片分析的研究。Banchereau等人对158个SLE病人进行了大规模的芯片测序。Panousis等人对142个SLE病人和58个健康人进行全血的转录组测序,并推断出有关全球疾病活动打分的额外信号。本篇文章使用转录组测序技术,与芯片测序相比可以获得等多的基因的信息。作者的研究基于四个转录组数据的整合提供了一种数据聚类的新方法,用机器学习的基因表达特征将患者分为四个主要亚型。使更多的生物学方法可以应用于SLE,将额外的方法结合匹配的数据可能会找到有用的临床生物标记物。

总的来说,作者的研究为SLE病人循环免疫细胞中基因表达的异质性提供了新的见解。作者使用全血转录组数据和机器学习相结合的新方法,在分类和识别新的患者簇以及揭示簇特异性基因表达模式方面具有潜在的功能。本实验结果揭露了SLE疾病的遗传异质性,并为临床试验提供一定的信息。使用作者的方法对SLE的失败临床试验进行事后分析,也可能提供有用的信息,有助于更好地了解结果并改进未来临床试验的设计。作者的工作还提供了特定分类的特异性基因信息。本研究结果可能是结束数十年SLE研究失败历史的一个新的机会。

更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
BIO Integra:单细胞RNA测序分析揭示了不同的人类自身免疫性疾病中免疫细胞的异质性
八分文献解读丨教你轻松入手单细胞测序研究
脓毒症亚型与精准治疗:进展和趋势
揭开肿瘤“黑幕”,患者如何采纳诊疗决策?
​多位点取样探索肿瘤异质性的研究集锦(万字长文,慎入)
不研究肿瘤,就用不了TCGA的测序数据库,那要用啥……
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服