打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Cell|人类基因组单细胞染色质可及性图谱

本期iProteome为大家带来的是2021年11月14日Cell上发表的由美国加州大学圣地亚哥分校任兵课题组的最新研究成果---人类基因组单细胞染色质可及性图谱。

撰文|黄敏静

Highlights

整合了成人胎儿人体组织130万个单细胞染色质图谱

222种细胞类型的120万候选顺式调控元件(CRE)图谱

成人和胎儿候选CRE的细胞类型特异性

解释与复杂性状和疾病相关的非编码变异

Significant

人体各种器官组织中的细胞是高度特化的,其特化的功能受到CRE的调控。CRE通过招募细胞特异性的TF进而决定TG的表达模式。常规分析中,研究者往往采用异质性组织作为材料得到群体平均测量结果,这在研究不同人的细胞类型的基因调控程序以及解释non codingDNA上有很大的局限性。

本文中,研究者对不同捐献者的30个成人组织的染色质可及性进行了分析,从这些组织中提取了60万个细胞核,根据染色质图谱相似性分成111种不同细胞类型,鉴定了与CRE相应的89万个开放染色质区域的联合。随后将上述的数据与胎儿细胞染色质可及性图谱进行对比,揭示了人类一生中130万个细胞的开放染色质图谱以及222种细胞类型的115万个细胞的开放染色质图谱。并利用这个CRE图谱解释了240种复杂的人类性状以及与疾病相关的非编码突变体的细胞类型和相应TG,解释细胞的类型与疾病的关系,并在人类细胞类型中提出相关的治疗靶点。

Result

Result1. 30个成人组织的单细胞染色质可及性分析

研究者对30个成人捐献者的组织样本进行SCI-ATAC-seq,过滤测序结果后得到61万个染色质图谱。通过SnapATAC算法,研究者提高了单细胞染色质可及性数据集的数据处理数目,确定了30个主要的细胞群,其中22个是由多亚群组成的。据此研究者发现了111个不同的细胞团。作者发现,大多数组织样本中都检测到的细胞,它们的聚类结果更偏向于细胞类型而不是组织偏好性或个体倾向性。而组织驻留型成纤维细胞分为7种亚型,亚型间组织来源不同。这111种中细胞中大多数表现出高度组织特异性。

Fig1. 30例成人原发组织的单细胞染色质可及性分析

Result2.成人111种细胞类型CRE图谱

研究者者试图确定上述111种细胞的染色质可及性区域,对每个细胞簇中所有细胞核的染色质可及性区域进行聚类。随后又合并了这些染色质可及性区域,得到89万个不重叠的CRE列表。为了得到这些CRE的潜在功能,作者比较了它们和先前已得到验证的哺乳动物组织特异性增强子,发现组织特异性增强子在相应组织细胞类型中具有更高的染色质可及性,表明细胞类型的染色质可及性核组织特异性增强子有较好的相关性。根据CRE到TSS距离对CRE进行分类,直接位于TSS或靠近启动子区域的CRE有更高的序列保守性和染色质可及性,基因远端的CRE的染色质可及性具有更大的差异。存在高度可及的启动子-近端CRE的共享机制以及跨细胞类型和物种的基因远端CRE可变机制。基于熵值,作者发现43万个CRE在一种或几种细胞类型中呈有限可及性。对这些CRE进行GO和motif富集分析,得到每种细胞类型可能的生物学过程和TF,这与细胞类型特定功能密切相关。限制在肝细胞上的cCRE产生了生物过程,如类固醇代谢过程,并富集了肝细胞核因子TF家族成员HNF1A/B、HNF4a/G和Onecut1/2的结合位点。

Fig2. 30成人细胞类型CRE图谱

Result3.成人胎儿染色质可及性整合分析

研究者使用SnapATAC方法比较222种胎儿和成人细胞类型的染色质可及性图谱,批次校正后从胎儿和成人组织中得到1321万个细胞核低维表达,并计算了相应成人和胎儿细胞类型的主要生命阶段特异性的CRE图谱。为了系统性量化成人和胎儿细胞间染色质可及性差异,研究者比较了每对胎儿和成人细胞类型的CRE的可及性。胎儿细胞类型和其他细胞类型相比有更强的相关性,而通过CRE重塑实现在人类发育不同阶段特定功能在研究中的不同人类细胞类型间存在很大程度的差异。为了揭示胎儿和成人特异性调节程序的背后机制,研究者计算了成人和胎儿细胞类型的主要生命阶段特异性CRE,鉴定出在胎儿和成人骨骼肌细胞间72648个差异可及性CRE。胎儿心肌细胞中可及性CRE与胚胎发育和创伤反应相关,且富含协调正常肌肉发生的生肌调节基序。成人骨骼肌细胞可及性CRE与肌肉对收缩活动以及胰岛素和类固醇激素反应有关,而MEF家族成员以及AP-1成员在调节成人骨骼肌对激素暴露和符合的转录反应中起作用。

Fig3. 成人和胎儿单细胞染色质可及性图谱整合分析

Fig4. 成人和胎儿细胞类型中染色质可及性图谱差异

Result4.人类细胞类型特异性CRE分类

研究者将222种细胞类型CRE进行标准化可及性得到了150个簇的顺式调节模块(CRM)。大多数的CRM限于单个胎儿或成人细胞类型,或限于反映共享细胞谱系的细胞类型组。研究者发现在特定的胎儿或成人细胞类型中显示优先可及性的CRM富集到与细胞类型和生命阶段特定细胞过程相关的通路。同时研究者测量了150个CRM中1565个人类TF motif的富集情况。接下来,作者试图使用120万个细胞类型CRE来解释与复杂性状和多基因疾病表型相关的遗传变异,并进行GWAS分析。胎儿和成人细胞类型与人类特征和疾病表型之间总共有3220个显著的相关性。

Fig5. 222种胎儿和成人细胞CRE模块阐述

Fig6. 胎儿和成人细胞类型与复杂性状和疾病的关系

Result5.非编码变异分子机制的系统性阐述

研究者应用ABC模型系统性地解释了与复杂形状相关的特定遗传变量的分子机制。将111种成人细胞类型中确定的CRE与它们的目标基因相关联。研究者检测出成人细胞类型CRE中3096个可能的非编码变异,并发现了527个TF结合位点可能会因非编码变异改变。对361个非编码变异进行排序,它们可能受到(1)驻留在成人细胞CRE中,(2)显著的改变与TF的结合,(3)与1个或多个靶基因结合的影响。这个发现可能对一些疾病治疗有帮助。

Fig7. 非编码风险变异分子功能的系统解释

Discussion

    作者利用单细胞测序技术分析了30种人类组织约60万个细胞,通过与之前数据的集成分析绘制了目前最大规模的人类单细胞染色质可及性图谱、并在222个细胞亚型中注释了近120万个顺式作用元件,为解析基因转录调控机制,以及人类复杂疾病的致病机理提供宝贵参考资源。

研究结果显示,人类基因组内的非编码区至少有80%是具有生物活性的,而并非junk DNA。其中,CRE(启动子、增强子、调控序列、可诱导元件等等)是目前已知的最重要的功能性非编码区,通过与转录因子结合而调控基因转录的精确起始和转录效率。发生在CRE上的基因突变是许多重大疾病(糖尿病、AD、自身免疫病等等)的发病机制之一。

染色质可及性是指细胞内DNA在需要进行转录等活动的时候,DNA才会从组蛋白中释放出来,裸露出需要和转录因子结合的位点,便于转录。这段暴露的染色质也叫开放染色质。CRE作为转录调控的核心区域,其附近的染色质通常具有较高的可及性。利用全基因组染色质可及性检测技术(ATAC-seq)可以鉴定出细胞中潜在的CRE。

原文引用|https://doi.org/10.1016/j.cell.2021.10.024

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
4项技术让他拿下全球青年科学家大奖
Science公布两大图谱,解析人类细胞如何生长和发育
scRNA-seq联合scATAC-seq解析人大脑皮层发育的基因调控
单细胞多组学刻画EGCs特征
文献解析 | 单细胞空间多组学解析H3-K27M弥漫性中线胶质瘤的时空异质性
一文读懂表观遗传学研究利器——ATAC-seq技术及应用丨深度长文
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服