打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
一篇发在NC上的公开数据库meta分析

今天给大家介绍一篇今年6月份发表在Nature Communication上的利用公开数据库挖掘脑相关性状基因靶点的文章。全文利用公开数据库,方法为主要为常规分析和meta分析。


Identifying gene targets for brain-related traits using transcriptomic and methylomic data from blood


Nature Communications 

血液的转录组和甲基化组数据联合识别与脑相关性状的基因靶点

 

摘要

了解脑和血液之间基因表达遗传调控的差异对于发现脑相关性状和紊乱的基因很重要。在本文中,作者估计了在脑和血液之间高关联的顺式表达或DNA甲基化数量性状基因座(顺式eQTLs或顺式mQTLs)遗传影响的相关性。通过使用公共可获得的数据,本文发现脑和血液样品之间cis-eQTLs或mQTLs上的遗传效应高度相关(cis-eQTLs: r=0.7,cis-mQTLs: r= 0.78)。对脑的cis-eQTL /mQTL数据做meta分析最终本文使用大样本血液的数据(n = 1980至14115)识别出与四种脑相关表型相关的61个基因和167个DNAm位点,其中大多数是已发现的子集(97个基因和295个DNAm位点)。结果表明使用大样本血液的cis-eQTL / mQTL数据在与脑相关表型的基因发现中起重要作用。


结果1. 脑和血液之间cis-eQTL影响的相关性

为了量化两个组织之间top-associated的 cis-eQTLs (or cis-mQTLs) 的遗传效应的相似性,我们使用基于数据的方法来估计两组织之间顺式效应的相关性(rb),rb是一个很好的顺式遗传效应真值相关性估计量。其中,rb方法与Spearman或Pearson相关不同,因为后者没有考虑估计的eQTL效应中的误差,从而导致低估了真实eQTL效应的相关性。

本文应用开发的方法去估计不同脑区域和脑和血液之间top cis-eQTLs的rb,汇总数据分别来自GTExv6(全血和10个脑区域),CMC(背侧前额叶皮层),Religious Orders Study and Memory and Aging Project (ROSMAP), Brain eQTL Almanac project (Braineac; 10 brain regions)。所有eQTL效应均以标准偏差(SD)单位中每个基因的表达水平为基础进行重新标准化。本研究的主要目的是量化血液中顺式-eQTL数据并用于SMR分析以鉴定与脑相关表型和病症相关的基因。

结果显示top-associated cis-eQTLs在校正了估计错误率后在GTEx的所有脑区域之间的影响高度相关(rb均值为0.94, se=0.004)。这个估计的相关性比之前研究的Spearman相关要高,因为Spearman相关没有考虑估计和SNP影响的错误,因此特别是当样本量很小时,低估了真实效应的相关性。大脑小脑半球和小脑几乎是完美的(rb=0.99,se=0.002),但两个小脑区域和其他区域之间的相关性(rb = 0.89和s.e.= 0.006)显著小于其他区域之间的成对相关性(rb=0.98 and s.e.= 0.003)。这在其它数据集中也得到了相似的结论。如下图所示:

 

 


结果2. 组织特异影响的cis-eQTLs

脑和血液之间cis-eQTL影响具有强相关性。结果表明组织特异eQTLs富集在远端调控元件(例如增强子)上。为了验证这个假说,本文计算了eQTL影响的组织之间差异的统计学检验(用TD表示)及由REMC注释的功能类别中cis-eQTLs的平均TD。结果显示出尽管cis-eQTLs在活性染色质状态(例如启动子和增强子)的基因组区域富集并且在非活性区域缩小,但CMC和GTEx-血液之间cis-eQTL的平均TD几乎均匀分布于所有功能目录中,在增强子区没有增加。如下图所示

 

 

另外,大量基因显示在组织间表达水平存在差异,但是这些差异是否部分由eQTL效应的差异所驱动尚不清楚。为了探究这个问题,本文检查GTEx-小脑与GTEx-血液之间对于顺式-eQTL效应差异的测试统计量(以SD单位计)和对应基因平均表达水平差异的检验统计量(以log2(RPKM)单位)之间的相关性。结果发现相关性很小(r=0.003)。如下图所示,这就类似于男性和女性平均身高有很大差异,但所有常染色体SNP对男性身高的影响几乎与女性相同

 


结果3. 脑和血液间cis-mQTL影响的相关性。

本文又通过应用rb方法到mQTL数据中,估计了两个组织间DNA甲基化遗传效应的相关性。分别分析了5个研究中的基于DNA甲基化450K的mQTL数据。结果显示两个大脑样品的cis-mQTL效应的相关性非常强(rb=0.92和se=0.002),类似于两个血液样品之间的相关性(rb=0.92,se=0.003)。如下图所示:

 

然后,本文检验了REMC功能类别中的cis-mQTL是否倾向于在脑和血之间具有较高的TD,结果显示TD在增强子区域(例如转录增强子,活性增强子和弱增强子)中有少量但显着的富集。如下图所示:

 


结果4.相关样本的脑eQTL数据的meta分析

从上面的rb分析可知,cis-eQTLs在不同脑区域几乎完全相关。然后,我们试图结合大脑区域的数据,以增加检测eQTLs用于后续分析的能力。我们将MeCS应用于GTEx中10个脑区的数据,meta分析结果显示:与GTEx-脑,CMC或ROSMAP相比,在脑-eMeta中具有至少一个的PeQTL<>


结果5. 识别脑相关表型的DNA甲基化和基因

    使用从meta分析获得的Brain-eMeta eQTL数据,本文应用SMR方法来测试基因表达水平与四种脑相关表型(吸烟,IQ,教育年限,精神分裂症)的关联。我们使用脑eQTL数据鉴定了61个与性状相关的基因,其中41个(67.2%)与使用eQTLGen血eQTL数据识别的基因相同。如下图所示:

本文还对脑mQTL数据进行了SMR分析,以检测DNAm位点与大脑相关表型之间的关联。我们使用脑mQTL数据鉴定了167个与性状相关的DNAm位点,其中133个(79.6%)与使用血液mQTL数据鉴定的295个DNAm位点共同。如下图所示:

 

这些结果进一步证明了在血液中估计基因表达或DNA甲基化的顺式遗传效应来识别脑相关表型中的假定靶基因和调控DNA元件的可行性和获益。


做生信跟踢足球一样,

常规的分析就是这些,

如何利用这些常规分析,

实现不同的想法,这才是最重要的。

大家如果有相关的生信分析需求,可以留言小编哦。


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
肺癌专题 | 大规模的全基因组关联分析发现新的肺癌易感位点和其在不同组织亚型之间的异质性
遗传变异对基因表达有何影响?33种肿瘤类型免费在线查询
深度解读| 大样本人类诱导多能干细胞转录组研究| 高分文章
科研 | Nature Genetics:高精度渐渗系群体分析揭示番茄果实风味和抗病性的遗传基础
使用MatrixEQTL进行cis/trans-eQTL分析
科研 |Science:性别对人类组织基因表达的影响
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服