生信草堂
号外,号外,号外
你想和生信分析大神做好朋友么?
你想认识更多爱好生信分析的小伙伴么?
你想让自己的生信分析走上快车道么?
那就赶快加入我们的生信交流微信群吧!
正确加入我们的模式是:
添加我们的微信bioinformatics88为好友
标注“加入生信草堂交流群”
在群里请大家注明自己本名,单位,研究领域
便于小编管理
是的,你没看错。GWAS这个似乎快过时的研究领域又一次登上了Nature正刊,特别是作者只是做了很少的实验验证的情况下,虽然只是以一篇letter的形式刊登,但丝毫不掩其对科学发展的价值。那么,这篇文章究竟做了些什么得以在Nature上发表呢,下面我们就一起来分析分析。
本文研究的表型是乳腺癌。大家也许会吐槽,这个表型不是早就研究的很透彻了吗?不就是BRCA1基因突变占主要作用吗?居然还能再发Nature。我初看标题的时候也是这样认为的,但读了摘要之后我就改变了自己看法,认真地读完了正文。
摘 要
作者提到虽然现有的遗传学研究表明乳腺癌致病风险通常受到稀有编码区遗传变异,如BRCA1基因,和许多非编码区常见变异影响,但是还有很多遗传贡献还不为人知。本文中,作者用来自欧洲(122,977 cases, 105,974 control)和亚洲(14,068 cases, 13,104 control)的乳腺癌疾病和对照样本进行全基因组关联分析(GWAS)研究,找到了65个之前未报道的与乳腺癌显著相关的遗传位点。为了进一步研究这些在统计意义上关联的位点的潜在生物学功能,作者整合了大量表观遗传数据,包括:基于ChIA-PET和Hi-C的染色质交互数据,基于生物信息学预测的增强子-靶基因数据,胸腺组织中表达性状位点(eQTL)数据,基于ChIP-seq的转录因子结合结构域数据以及基于RNA-Seq的胸腺组织表达数据。根据这些数据与GWAS显著位点的位置关系,作者鉴定出689个可信易感基因,并发现这些基因与乳腺癌驱动基因集(147个)具有高度富集关系。此外,研究人员还发现单核苷酸多态性位点的遗传力显著富集在乳腺细胞中转录因子结合位点上。综上所述,这篇Nature文章整合GWAS和大量基因调控数据,找到乳腺癌疾病潜在的调控机制。
1GWAS研究
图1:GWAS分析曼哈顿图。a) 全部位点关联分析结果;b) 去除掉之前已报道位点的结果。
2可信风险位点(credible risk variants, CRVs)
图2:CRVs与genomic feature的富集分析
3INQUISIT基因筛选系统
仅仅定义了CRV还不够,作者是想找出那些真正具有潜在的生物学功能的SNPs或者基因。于是,他们开发了一个叫做Integrated expression quantitative trait and in silico prediction of GWAS targets, (INQUISIT)的基因筛选系统,结合多种维度的基因组数据来描述调控关系,包括:基于ChiA-PET和Hi-C技术的染色质相互作用数据;人乳腺癌细胞系中基于Chip-seq的转录因子数据;基于生物信息学预测的增强子-靶基因数据;TCGA中乳腺癌eQTL数据;Topologically associated domain (TAD) boundaries;乳腺癌细胞以及对应的癌旁组织的基因表达数据,通过CRVs与这些调控区域的位置是否重叠进行打分,筛选出目标基因。不得不说,作者能整合这么多数据来探究SNP的功能可见功夫了得。
图3:pathway富集分析结果
4遗传力在不同细胞类型和调控元件上的分布
图4:遗传力在乳腺组织中3个组蛋白标记上的富集情况
5荧光素酶报告基因和3C实验验证SNP对启动子获得影响
图5:a,b) 荧光素酶报告实验;c) 3C实验
Dwek, M. and Presneau, Nadège (2017) Association analysis identifies 65 new breast cancer risk loci. Nature. ISSN 0028-0836
转发后截屏发送后台,小编送上原文献的链接和密码,可自行下载
联系客服