打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
TCGA

甲基化芯片

450k甲基化芯片可以检测人全基因组近450000个甲基化位点,具有单碱基的分辨率。全面的覆盖了96%的CpG岛,并根据需求加入了CpG岛以外的CpG位点信息,人类干细胞非CpG甲基化位点,正常组织与肿瘤(多种癌症)组织差异甲基化位点,编码区以外的CpG岛,miRNA启动子区域和GWAS疾病相关区域的位点,同时覆盖270的90%的位点。

CpG位点(英语:CpG sites,或称为CG位点),我理解的cg****就是cg位点
是指DNA的某个区域,其上的碱基序列以胞嘧啶接着鸟嘌呤出现。“CpG”是“—C—磷酸—G—”的缩写 ,指磷酸二酯键连接了胞嘧啶和鸟嘌呤,其中C位于5'端而G位于3'端。

在CpG位点中的胞嘧啶可以被甲基化5-甲基胞嘧啶。在哺乳动物中,基因内CpG位点的甲基化会改变此基因的表达,对这一表达调控的研究是表观遗传学的重要组成部分。涉及添加甲基基团的称为DNA甲基转移酶

在哺乳动物中,70%到80%的CpG位点的胞嘧啶是甲基化的

未甲基化的CpG位点可以被免疫系统的浆细胞样树突状细胞单核细胞NK细胞B细胞上的TLR9(Toll样受体9)识别,来检测体内的微生物感染。

CpG岛是一个富含CpG位点的区域,但客观精确描述所谓“富含”的定义尚不明确。通常对于CpG岛的正式定义为:一个长度至少为200bp的片段,其GC含量高于50%,且“观察期望比”(observed-to-expexted)高于60%。

注:观察期望比:即CpG位点的观察值(片段实际含有的CpG位点数目)和“期待值”的比值。“期待值”通常有两种算法:(C*G)/LS[4]或((C+G)/2)^2/LS[5]。其中,C、G代表胞嘧啶和鸟嘌呤的数目;LS代表片段长度(length of sequence)。

很多哺乳动物基因组中的CpG岛和基因的起始位点相联系[6]。因此,CpG岛的存在对于基因的预测和解释具有帮助作用。

在哺乳动物基因组中,CpG岛的序列长度通常为300-3000bp,在约40%的基因的启动子附近都有发现[7]。在人基因组中则有约70%的基因启动子有高CpG含量。如前文提及,CpG位点的实际存在率比随机概率的结果要低得多[5]

2002年的某研究阐述了CpG岛的预测规则,使用这种规则可以排除一些高GC含量的基因组序列,如Alu重复序列。基于对人21和22号染色体的完全测序研究成果,长度大于500bp、GC含量高于55%、CpG位点“观察期望比”高于65%的DNA序列更有可能是“真正的”CpG岛[8]

CpG岛以至少达到60%的理论CpG位点含量(可达到4-6%)为特征,而基因组中平均CpG含量只有约1%(CG抑制)。和在基因编码区中的CpG位点不同,在基因正常表达时,位于基因启动子区中的CpG位点往往不会被甲基化;这种现象表明启动子序列中的CpG位点的甲基化很可能导致基因表达被抑制。DNA甲基化和组蛋白修饰是基因铭印的核心过程[9]。大多数组织间或正常样本和癌症样本间的甲基化差异发生在CpG岛附近(CpG island shores)而非CpG岛内部[10]

一种CpG岛形成的假说图解:通过未被甲基化,从而在漫长的进化史上保留下来

在脊椎动物中,CpG岛往往位于基因转录起始位点附近,尤其是持家基因。CpG位点有被甲基化的倾向,借助这种甲基化可以分辨新合成的DNA链和母链,这在DNA序列复制后的最终校对环节起重要作用。甲基化的胞嘧啶容易脱氨转变成胸腺嘧啶,导致T/G错误配对。胸腺嘧啶DNA糖苷酶(TDG)是人类用于修复TG错配的酶。但由于CpG位点的稀少性,TDG在理论上没有足够高的效率来消除这些快速发生的突变。通常认为CpG岛存在的原因是因受如下选择压力导致的:需要相对更高的CpG含量、更低的甲基化水平或是调控基因需要。最近也有研究称大多数的CpG岛是由非选择压力形成的[11]

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
快问快答,一步了解DNA甲基化!
基因甲基化筛查到底是什么
DNA甲基化数据分析,了解下
组学专题-表观基因组学
【海普周报】DNA甲基化和癌症
疾病诊断之甲基化qPCR检测
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服