打开APP
未登录
开通VIP,畅享免费电子书等14项超值服
开通VIP
首页
好书
留言交流
下载APP
联系客服
教你发8分 癌症预后模型!
外科黄文斌
>《单细胞测序》
2023.02.15 广东
关注
肝细胞癌(
HCC
)占原发性肝癌的
80%
以上,是全球癌症相关死亡的第四大原因。对于
HCC
患者,明确其进展机制和预测预后至关重要。先前的研究发现,癌症相关成纤维细胞(
CAFs
)促进肿瘤增殖和免疫排斥。近日,有作者基于
CAFs
相关基因构建了一种新的人工神经网络(
ANN
)模型,通过功能、突变、免疫和临床分析揭示了关于
ANN
模型的信息。研究于
2022
年
7
月发表在
《
Frontiers in immunology
》
,
IF:8.786
。
技术路线:
主要研究结果:
1. HCC
单细胞转录组分析及
CAFs
相关基因功能富集
作者将单细胞的
6
个亚群(包括恶性细胞、
B
细胞和
T
细胞、肿瘤相关巨噬细胞(
TAMs
)、肿瘤相关内皮细胞(
TECs
)和癌症相关成纤维细胞(
CAFs
))进行分离,并绘制
UMAP
图(图
1A
)。然后,使用
Monocle 2
进行伪时间分析,发现
CAFs
出现在分化轨迹的末端(图
1B
)。此外,在六个亚簇之间进行了配体
-
受体相互作用网络(图
1C
),并提取了
CAFs
与其他亚簇之间配体
-
受体对的数量(图
1D
)。作者证明了
CAFs
和
TECs
具有最多的配体
-
受体对,其次是
CAFs
和
TAMs
。随后,在
CAFs
和其他亚簇之间进行了配体
-
受体相互作用(图
1E
)。选择与
CAFs
显著相关的基因进行功能富集分析,它们主要富集在与肿瘤相关的通路,如
PI3K-Akt-mTOR
信号通路、血管发育、受体酪氨酸激酶信号通路以及细胞迁移的正向调控(图
1F
和
G
)。
图
1 CAFs
相关基因的单细胞转录组分析及功能
2.
12
个
CAFs
相关基因被确定为
HCC
的预测模型
单变量
Cox
回归分析进一步筛选
TCGA
数据集中与
CAFs
相关的预后基因:
14
个基因被选中(图
2A
)。为了进一步获得最严格的模型,进行随机森林分析并筛选候选基因。最后,选择
12
个可变重要值大于
0
的
CAFs
相关基因作为
HCC
患者的预后模型(图
2B
)。然后,绘制
12
个与
CAFs
相关的预后基因的突变图谱(图
2C
),发现
HGF
的突变率最高(
24%
),其次是
CD44
(
12%
),
CSF1
和
NRP1
(
6%
),最高的突变类型是错义突变。突变分析结果中常见的变异和变异类型分别是错义突变和单核苷酸多态性(
SNPs
)。单核苷酸变异数显示,胞嘧啶(
C
)向腺嘌呤(
A
)突变最为常见(图
2D
)。每个样本的中位数变异为
1
。此外,作者列出了前
10
个突变基因供进一步分析。随后,在
TCGA
数据集中对
12
个与
CAFs
相关的预后基因进行了
CNV
分析(图
2E
),发现
EFNA4
具有最高的
CNV
增益突变,而
CSF1
具有最高的
CNV
损失突变。然后,构建一个圆形图来展示
12
个与
CAFs
相关的预后基因之间的相关性(图
2F
),结果发现
12
个与
CAFs
相关的预后基因均为危险因素,且
p
值
< 0.0001
,呈强正相关。
图
2 12
个与
CAFs
预后相关基因的鉴定
3.
基于
12
个与
CAFs
相关的预后基因,建立了
ANN
预测模型
基于
TCGA
数据集中
12
个选择的与
CAFs
相关的预后基因构建了一个神经网络模型(图
3A
)。输入层输入
12
个
CAFs
相关基因。网络超参数为
:a
)
3
个隐层;
B
)每层
35
、
27
、
19
个节点;
C
)
dropout rate= 0.286
;
D
)
learning rate= 0.4621984
;
e
)
weight decay= 0.3156897
。结果:输出层包含一个神经元,通过
Cox
回归计算
CAS
。为了评估预测能力,引入
c
指数。在
ANN
模型中
c
指数高于
Cox
模型。此外,在
ICGC
和
GSE76427
数据集中,
c
指数是令人满意的(图
3B
)。通过
AUC
分析,
ANN
模型优于
Cox
模型
(图
3C
)。随后,在
TCGA
数据集中计算每个样本的
CAS
(图
3D
),
CAS
高的患者生存状态较差,反之亦然。通过对
TCGA
数据集进行
Kaplan-Meier
分析,发现高
CAS
的
HCC
患者总生存期较短(
P = 0.0065
)(图
3E
)。为了评估
ANN
模型的准确性,对
TCGA
、
ICGC
和
GSE76427
数据集进行了
ROC
分析,发现
TCGA
数据集中的
1
年、
3
年和
5
年
AUC
均大于
0.6
(图
3F
),这表明我们的
ANN
模型是一个准确的预后模型。
图
3
建立
ANN
模型
4.
基于
CAFs
相关
ANN
模型构建
nomogram
图
为了评估
ANN
模型是否可以作为独立的预后标志物,对三个队列(
TCGA
、
ICGC
和
GSE76427
)进行了单变量和多变量
Cox
回归分析(图
4A, B
)。单因素和多因素
Cox
回归结果显示,
ANN
模型的
CAS
与三个队列中较低的总生存率显著相关,这表明
ANN
模型可以作为
HCC
患者的独立预后标志物。因此,作者建立了一个基于
CAS
的
nomogram
图来预测
HCC
患者的
1
年、
3
年和
5
年的总生存期(图
4C
)。然后,建立评估预测风险与观察风险的校准曲线(图
4D
)。
1
年、
3
年和
5
年的校准曲线显示出很大的预测能力。此外,
nomogram
的
AUC
表明
nomogram
与单个参数相比具有最高的
AUC
(图
4E
)。最后,通过
1
年、
3
年和
5
年的
DCA
评估该模型是否值得使用(图
4F
),结果表明
nomogram
检查对
HCC
患者是可以接受的。
图
4
肝细胞癌患者计数图的创建
5.
CAFs
相关
ANN
模型的富集分析
通过分析高
CAS
和低
CAS
样本之间的差异表达基因,并将基因输入在线富集分析工具
metscape
。高
CAFs
组中显著富集的
terms
如图
5A
所示:排在前五位的是基质金属蛋白酶、己糖反应、膜电位调节、含苯化合物代谢过程、甾体分解代谢过程。
CAS
组中显著富集的
terms
如图
5B
所示:前五项分别是核心母质体、
ECM
组织、母质体相关、蛋白多糖和细胞对生长因子刺激的反应。
GSEA
分析显示低
CAS
组中
ABC
转运蛋白、抗原加工和递呈、自然杀伤细胞介导的细胞毒性、结点样受体信号通路和
toll
样受体信号通路富集,而高
CAS
组中钙信号通路、
ECM
受体相互作用、
Notch
信号通路、核糖体和血管内皮生长因子(
VEGF
)信号通路富集
(图
5C, D
)。然后,根据
CAS
相关基因的中位表达,将样本分为两个亚组(高组和低组),并确定高组的激活细胞串扰高于低组(图
5E
)。作者总结显著的串扰通路,结果表明高组可以激活大部分通路(图
5F
)。此外,我们分析了一些关注的通路(图
5G
),发现
T
细胞共抑制,血管生成和主要组织相容性复合体
I
类在高
CAS
样本中显著上调。然而,
II
型干扰素(
IFN
)反应通路在低
CAS
样本中显著富集。此外,
CAS
和通路之间的相关性如图
2
所示,
T
细胞共抑制与
CAS
有最显著的正相关性。
图
5 ANN
模型的功能分析
6.
CAFs
相关
ANN
模型的免疫分析
根据有或无显著性的风险或保护因素,将
22
例
TIC
分为
4
组,并进行相关分析(图
6A
),证明了
M0
巨噬细胞和活化的树突状细胞是危险因素,而静息记忆
CD4 T
细胞是保护因素。作者发现
22
个
tic
之间存在正相关或负相关。然后,绘制一个热图来分析
TME
和肿瘤纯度以及
TICs
和免疫能力的表达(图
6B
)。高
CAS
样本的免疫评分和
ESTIMATE
评分均显著升高,且与
CAS
呈正相关。激活的记忆
CD4 T
细胞、卵泡辅助
T
细胞和中性粒细胞在高
CAS
样本中高表达,而调节性
T
细胞和静息性记忆
CD4 T
细胞在低
CAS
样本中高表达,
CD8 T
细胞在低
CAS
患者中高表达。检查点
CTLA4
、
IDO1
和
CD274
在高
CAS
样本中高表达,而
TBX2
在低
CAS
样本中显著高表达。此外,在高
CAS
和低
CAS
样本之间对
75
种免疫调节剂进行了多组学分析,发现包括
14
个抗原递呈因子、
3
个共刺激因子、
8
个共抑制剂、
22
个配体、
19
个受体、
3
个细胞粘附因子和
6
个其他因子(图
6C
)。检测
mRNA
的表达,突变,扩增和缺失的频率,以及基因表达与
DNA
甲基化
β
值在高和低
CAS
样本之间的相关性。最后,在高
CAS
样本和低
CAS
样本之间检测了癌症
-
睾丸抗原(
CTA
)(图
6D
)、新抗原(图
6E
)和增殖(图
6F
)评分。
CTA
评分可加快肿瘤发生速度,抑制细胞凋亡,促进细胞增殖。高
CAS
样本具有更高的
CTA
评分、新抗原表达和增殖能力。通过相关分析,发现
CAS
与
CTA
评分(
P= 0.03
)、新抗原(
P= 0.0014
)、增殖(
P= 0.044
)呈显著正相关。
图
6 ANN
模型的免疫分析
7.
CAFs
相关
ANN
模型的突变分析
对低
CAS
和高
CAS
样本进行突变分析。首先,检测所有突变计数:非同义突变和同义突变计数(图
7A
)。然而没有发现两组之间有任何显著性。此外,筛选
26
个突变数超过
15
的基因,随后在高
CAS
和低
CAS
样本中展示了突变景观(图
7B
)。高
CAS
样本中突变频率最高的基因是
TP53
(
33%
),其次是
CTNNB1
(
25%
)和
TTN
(
24%
)。相比之下,低
CAS
样本中突变频率最高的基因是
CTNNB1
(
25%
),其次是
TTN
(
25%
)和
TP53
(
23%
)。森林图展示高
CAS
和低
CAS
样本之间的差异突变基因
(图
7C
):
NBEA
和
FRAS1
在高
CAS
样本中突变数较高,
RYR2
在低
CAS
样本中突变数较高。由于
TP53
在高
CAS
样本中具有最高的突变计数百分比,因此生成
TP53
的
lollipop
图来展示高
CAS
和低
CAS
样本中的突变频率和突变类型(图
7D
)。柱状图来展示了高
CAS
和低
CAS
样本中每个臂的扩增和缺失频率(图
7E
)。
图
7 ANN
的突变分析
8.
ANN
模型可指导临床治疗
HCC
的主要治疗方法之一是化疗,其中包括
5-
氟尿嘧啶、顺铂、吉西他滨和多柔比星。因此,作者预测了
TCGA
数据集中高
CAS
和低
CAS
样本之间化疗药物的敏感性(图
8A
)。
3
种药物(
5-
氟尿嘧啶、顺铂和吉西他滨)在高
CAS
样本中的敏感性高于低
CAS
样本(
p
值分别为
0.00063
、
0.018
和
0.00045
)。此外,利用
CTRP
和
PRISM
数据库对小分子药物进行了预测(图
8B
)。
Brefeldin A
、
SR-II-138A
、
CR-1-31B
、
BRD-K97651142
、
KX2-391
、
tosedostat
与
CAS
呈负相关,高
CAS
样本的
AUC
估计值较低。结果表明,预测的小分子药物在高
CAS
患者中具有较高的敏感性。此外,通过使用
TCGA
数据集中的子类映射来预测针对
PD1
和
CTLA4
的免疫反应(图
8C
)。然后,通过
TIDE
算法检测高
CAS
和低
CAS
样本之间的总免疫应答(图
8D
)。
图
8
预测药物和免疫反应
结论:
作者创建了一个新的与
CAFs
相关的
ANN
模型,该模型适用于单独预测
HCC
患者的预后,并通过功能、突变、免疫和临床分析指导临床治疗。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报
。
打开APP,阅读全文并永久保存
查看更多类似文章
猜你喜欢
类似文章
【热】
打开小程序,算一算2024你的财运
成纤维细胞生信可以这样做!8+单细胞测序+转录组学鉴定成纤维细胞群
Cell Discov | CD36+癌细胞抑制巨噬细胞迁移为肝癌提供免疫抑制微环境
J Hepatol:基因组测序确定WNK2是肝细胞癌的一个驱动因素和早期复发的危险因素
经典文献分享:单细胞测序研究黑色素瘤免疫治疗耐药性的形成机制
英科学家发现27种能抑制癌症的新基因!
单细胞揭示不同类型转录重构助力人类前列腺癌研究进展
更多类似文章 >>
生活服务
热点新闻
留言交流
回顶部
联系我们
分享
收藏
点击这里,查看已保存的文章
导长图
关注
一键复制
下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!
联系客服
微信登录中...
请勿关闭此页面
先别划走!
送你5元优惠券,购买VIP限时立减!
5
元
优惠券
优惠券还有
10:00
过期
马上使用
×