打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
MR | 第8期. 孟德尔随机化最重要的决策
孟德尔随机化(MR)整体上可分为9个部分(MR | 第3期.一文掌握孟德尔随机化的整体流程),我们前期基于一篇发表于BMJ的文章,依次解析了MR的第一部分“研究目的与假设”(点击进入)、第二部分“数据来源”(点击进入),今天我们继续介绍MR研究的第三部分,也是MR研究中最重要的决策:遗传变异的选择,即将哪些遗传变异纳入分析?
本期内容主要分为两个部分,先解析遗传变异选择相关的理论知识,后基于一个例子来分析。
 

一、理论:单个基因区域 vs 多个基因区域

遗传变异可以简单分为两种:单个基因区域的变异体 和 基因组多个区域的变异体(多基因分析)。在MR研究中,我们需要做出选择,那么选择的依据是什么呢?

单个基因区域的变异体具有特异性(优势)——如果一个基因区域与暴露有特定的生物学联系,那么MR在评估特定暴露的因果关系方面更合理。然而,如果分析中只包括一个基因区域,则不能使用后续稳健的统计学分析方法,因为它们在变异体是否违反工具变量假设方面的独立条件需要明确,这是单个基因区域的变异体的劣势

相比之下,基因组多个区域的变异体与暴露之间因果关系的特异性差,但其优势在于统计学功效更强。可以这么理解:同一基因组的多个区域的变异体可能全部是有效工具或全部无效,当都是有效工具时,遗传变异体可以解释暴露中最大比例的变异,统计学功效也就相应增大。因此,多基因MR研究的统计学功效通常超过仅包括单个基因区域的变异体的研究。

二、举例  

我们来解析一下这篇发表于BMJ研究(详见参考文献)是如何选择遗传变异的。该部分主要回答两个问题:1.这个研究为什么要选择基因组多个区域的变异体;2.针对基因组多个区域的变异体,该研究做了哪些分析?

1. 这个研究为什么要选择基因组多个区域的变异体?

既往研究显示,肥胖的遗传易感性与多种遗传变异相关,单个遗传变异对肥胖的影响较小,肥胖的遗传易感性可能是由众多变异的累积效应造成的。因此,本研究选择了基因组多个区域的变异体,量化加权等位基因得分作为工具变量。

2. 针对基因组多个区域的变异体,该研究做了哪些分析?

证实相关性假设:为了得到哪些遗传变异与BMI相关,研究人员下载了GWAS数据后,筛选出P5×10-8SNP,共77个,其中两个SNP(rs12016871rs2033732)未在HUNT研究中获得,因此纳入了75SNP

证实独立性假设:为了评估上述75SNP与协变量的关联,研究人员进一步排除了与潜在协变量相关的SNP(方法是bonferroni校正,阈值是p 6.7×10-4,即0.05除以75)。发现2SNP与吸烟有关(rs13021737rs16951275),因此被剔除,随后纳入73SNP开展进一步的分析。

计算加权等位基因得分:剩下73个遗传变异都被编码为012,对应于效应等位基因(定义为bmi增加等位基因)的拷贝数。定义个体i加权等位基因得分为:


下一期,我们将继续以此参考文献为例,解读其“遗传变异的调整”。

大家对于推送内容有任何问题或建议可以在公众号菜单栏“更多--读者的话”栏目中提出,我们会尽快回复!


参考文献

1. Sun YQ, Burgess S, Staley JR, Wood AM, Bell S, Kaptoge SK, Guo Q, Bolton TR, Mason AM, Butterworth AS, Di Angelantonio E, Vie GÅ, Bjørngaard JH, Kinge JM, Chen Y, Mai XM. Body mass index and all cause mortality in HUNT and UK Biobank studies: linear and non-linear mendelian randomisation analyses. BMJ. 2019 Mar 26;364:l1042. doi: 10.1136/bmj.l1042. PMID: 30957776; PMCID: PMC6434515.


2. Khera AV, Chaffin M, Wade KH, Zahid S, Brancale J, Xia R, Distefano M, Senol-Cosar O, Haas ME, Bick A, Aragam KG, Lander ES, Smith GD, Mason-Suares H, Fornage M, Lebo M, Timpson NJ, Kaplan LM, Kathiresan S. Polygenic Prediction of Weight and Obesity Trajectories from Birth to Adulthood. Cell. 2019 Apr 18;177(3):587-596.e9. doi: 10.1016/j.cell.2019.03.028. PMID: 31002795; PMCID: PMC6661115.

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
文献之声|整合GWAS和eQTL数据的孟德尔随机化揭示了复杂和临床特征的遗传决定因素
科学家在中国人群中发现2型糖尿病关键致病变异体!
今天我们来聊一聊孟德尔随机化
花10分钟就能全面了解孟德尔随机化
常规孟德尔随机化分析就能上12 ?原来是这个“小窍门”!
基因大数据的集成分析
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服