术语
AUC:ROC曲线下面积;
C-指数:一致性指数;
EGFR-TKI:表皮生长因子受体酪氨酸激酶抑制剂;
GO:基因本体,在生物信息学领域中广泛使用的本体,涵盖细胞组分、分子功能、生物过程三个生物学方面;
GEO:基因表达综合
GSEA:基因集富集分析
HR:风险比
KEGG:京都基因与基因组百科全书
LASSO:最小绝对收缩与选择算子
LUAD:肺腺癌
LUSC:肺鳞状细胞癌
NSCLC:非小细胞肺癌
OS:总生存
ROC:受者操作特征
TCGA:癌基因组图谱
一
研究思路
二
结果
进一步通过Lasso回归得到LUAD的22个和LUSC的11个生存相关基因。TCGA-LUAD(A)中25个基因和TCGA-LUSC(B)中11个基因的LASSO系数分布。根据对数(lambda)序列生成系数剖面图。TCGA-LUAD(C)和TCGA-LUSC(D)套索模型中最优参数(lambda)的选择。(E) TCGA-LUAD队列中22个基因的遗传改变。(F) TCGA-LUSC队列中11个基因的遗传改变。
根据每个基因的mRNA表达水平和风险系数,即每个自噬相关基因的mRNA水平与其多变量LASSO回归系数加权的线性组合,计算每个患者的风险得分。风险评分用于预测预后,以中位风险评分作为临界值,将患者分为高风险组和低风险组。绘制热图以显示高风险和低风险组的基因表达谱,TCGA-LUAD(A)和TCGA-LUSC(B)。TCGA-LUAD(C)和TCGA-LUSC(D)的危险评分分布、患者生存时间及状态,黑色虚线是将患者分为低风险组和高风险组的最佳界限。TCGA-LUAD(E)和TCGA-LUSC(F)的单因素Cox回归分析,风险因素与存活率之间关系的森林图。
多元Cox回归分析。自噬相关基因标记是TCGA-LUAD(A)和TCGA-LUSC(B)预后的独立预测因子。TCGA肺癌患者的Kaplan-Meier分析,(C) 高危评分与TCGA-LUAD患者总体生存率低有关,(D) TCGA-LUSC的高危评分与总体生存率低相关。受试者操作特征(ROC)分析操作系统对TCGA-LUAD(E)中22个基因风险评分和TCGA-LUSC(F)中11个基因风险评分的敏感性和特异性。TCGA-LUAD(G)和TCGA-LUSC(H)的分期和危险度评分联合应用比单独应用两者更能预测预后。
这部分是对之前利用TCGA数据所构建的模型在GEO数据集进行验证。Okayama包括226例原发性I-II期肺腺癌(GSE31210)患者。患者的风险评分从-58到-53(图A)。低危患者存活时间明显长于高危人群(图C和E)。Rousseaux包括293例I-IV期肺癌(GSE30219),包括71例腺癌、61例鳞状细胞癌、56例大细胞神经内分泌肿瘤、39例基底细胞瘤、24例类癌、21例小细胞癌和7例其他组织学。风险评分范围从-19到-15(图B)。即使在该混合型肺癌样本(图D和F),风险评分也表现良好。
三
结语
联系客服