在这本 IJE期刊中 ,Gao及其同事使用孟德尔随机抽样(MR)两样本研究了肥胖对几种癌症的因果关系,并发现了一些证据表明,较高的成人体重指数(BMI)可以降低患乳腺癌的风险,而增加卵巢癌,肺癌和大肠癌。1 作者得出结论,这项研究提供了“……对肥胖与癌症风险之间复杂关系的进一步理解”。
除了研究结果本身之外,本文还通过两个样本的MR方法使用公开可用的全基因组关联研究(GWAS)汇总数据来进行研究。自MR在IJE中首次提出以来,在过去的十年中,MR已得到越来越多的使用 ,但 2 两样本MR是相对较新的扩展。3 随着GWAS联盟提供的完整摘要结果(可在互联网上轻松获得)的可用性越来越高,在未来十年中,使用两个样本的MR可能会大大增加。4 通过完整的摘要数据,我指的是具有特征或疾病结局的所有遗传基因座的结果,而不仅仅是达到预先指定的 P值阈值,如期刊出版物中所示。正是这种广泛的研究结果使Gao 等人得以实现 。将用作肥胖性状工具变量的遗传变异与他们感兴趣的癌症结果联系起来;除非它们达到预先指定的GWAS显着性值,否则已发表的关于癌症结局的GWAS不会报告肥胖的变体。
MR是一种工具变量分析的形式,它使用遗传变异作为工具变量。它被描述为大自然或您的上帝的随机对照试验(RCT),指的是概念上遗传变异的随机分配,这意味着遗传变异比非遗传仪器更不可能违反某些工具变量分析的假设。5 ,6 到教学MR到流行病学谁感到焦虑遗传学当类比随机对照试验也非常有用,如所示图1它通过一个示例来确定低密度脂蛋白胆固醇(LDLc)通过RCT对冠心病(CHD)的因果关系,从而对工具变量分析和该方法的关键假设进行了修订(图1a和b)并通过MR(图1c和d)。在这两种方法中,最有可能违反的假设是“排除限制标准” [ 7-9 ], 其中指出工具变量仅通过其对风险因素的影响而与结果相关。图1还表明,如果工具变量假设是正确的,则可以通过工具变量对结果的影响的简单比率除以工具变量对风险的影响,得出风险因子对结果的因果关系的估计值因子。在Gao及其同事的论文中,因果效应=合并肥胖基因变异的每个等位基因的癌症对数几率÷合并肥胖遗传变异的每个等位基因的肥胖测量的回归系数。
RCT和MR研究中的工具变量分析DAG探索了LDLc对冠心病的影响。这些是有向无环图(DAG),因此任何两个变量(节点)之间都没有箭头表示我们认为这两个变量之间没有因果关系。图中显示了工具变量(IV)分析的DAG,以测试低密度脂蛋白胆固醇(LDLc)对CHD的因果作用。在图1在a和b中,IV是随机分配给他汀类药物或不接受他汀类药物(即,这是RCT中IV分析的一个例子)。在图1c和d,IV是与LDLc密切相关的遗传变异(即,这是孟德尔随机研究)。图1a和c都说明了IV分析的三个关键假设:
一世。IV'Z'(随机分配给他汀类药物图1a和与LDLc有关的遗传变异图1c)与(或合理地)与危险因素(所有图中的LDLc)有因果关系;
ii。风险因素-结果“ X”-“ Y”关联的混杂因素(此处所有数据均为CHD上的LDLc)与工具变量无关;
iii。工具变量“ Z”仅通过其对风险因子“ X”(LDLc)的影响而影响结果“ Y”(CHD)。
在RCT示例中,我们知道假设(i)是正确的,并且如果RCT进行得当,则假设(ii)将是正确的(机会关联除外)。但是,如果他汀类药物直接(独立于LDLc)与随后影响冠心病的其他因素相关,则将违反假设(iii),并且估计的因果效应将是LDLc真实效应的偏向估计。有证据表明,他汀类除LDLc外还与多种脂类和脂肪酸有关[ 27], 尽管目前尚不清楚它们是否由不依赖LDLc的他汀类药物引起并影响冠心病。如果他们这样做(如图1b)LDLc对冠心病的影响的估计值可能会产生偏差。在MR示例中,从存在复制的大型GWAS财团中选择变体意味着假设(i)可能是正确的。对于假设(ii),有证据表明这可能是正确的。26 与RCT的例子一样,在MR中,我们通常最担心假设(iii)通过定向(水平)多效性而被违反,即LDLc遗传变异独立于LDLc而影响其他因素,进而反过来(独立于LDLc)影响冠心病(图1d)。如果IV假设是正确的(如图1a和c)可以看出,LDLc对CHD的影响大小可通过以下公式轻松计算 :e LDLc对CHD几率的影响=对数几率CHD对Z的影响÷βLDLc对Z的影响,其中Z =对他汀类药物(在RCT实例中)或LDLc的遗传变异体(在MR实例中)。例如,如果在进行良好的RCT中随机分配到标准剂量的他汀类药物,LDLc降低4 mmol / l,CHD相对降低20%(几率0.80),那么LCLc对CHD的因果关系是相对的每1 mmol / l降低5%(OR 0.95)。还可以看到,如果违反了假设(iii)(排除限制标准)(如图1b),则此估计是有偏差的,因为这是LDLc和任何其他受他汀类药物影响并影响冠心病的脂质或脂肪酸的综合作用。
两样本MR利用了这样一个事实,即不必从同一参与者样本中获得工具变量风险因子关联(比率分母)和工具变量结果关联(比率分子)的效果。确实,从两组不同的参与者那里获取它们具有一些优势。特别是“赢家的诅咒”,它可能低估了一个样本MR中的真正因果效应, 在两个样本MR中不太可能发生10,并且不同于一样本MR中弱仪器偏向的影响(偏向于对混杂多变量回归结果),在两样本MR中,弱仪器偏向零值。3在两个样本的MR中使用来自GWAS财团的摘要数据的主要优势是统计能力的提高,尤其是在检测对二元疾病结局的影响方面。4 Gao及其同事的论文通过他们分析的大量癌症病例说明了这一点:分别针对乳腺癌,结肠直肠癌,肺癌,卵巢癌和前列腺癌的15 748、5100、12 160、4369和14 160。1 两样本MR的假设与一样本MR的假设相似,因为它有很多优点和局限性。与单样本MR相比,它还具有其他优势和局限性,其摘要如下:表格1。
一样本和两样本MR的比较
假设或其他问题 | 一样本MR | 两样本MR |
---|---|---|
工具变量与危险因素有关 |
|
|
危险因素-结果关联的混杂因素与遗传仪器无关 |
|
|
遗传手段仅通过对危险因素的影响而与结果相关 |
|
|
小组分析和效果调节 |
|
|
GWAS中所做调整的偏差 |
|
|
非线性效应 |
|
|
“胜利者的诅咒” |
|
|
MR可以在参与者的一个“样本”中进行,其遗传工具和所有参与者的结果数据以及(随机)子样本中的危险因素数据都可以进行。例如,英国生物银行将很快发布所有50万参与者的GWAS数据,并且已经积累了大量心血管疾病和乳腺癌等常见癌症的病例。11已经开始在10万名参与者的子样本中收集独特的影像数据,因此,通过MR来确定新型影像生物标记物对常见慢性疾病结局的因果关系,其中将50万名参与者的遗传仪器-疾病结局进行了划分通过遗传仪器成像生物标志物协会在10万个亚组中的应用,将很快成为可能。但是,这是一个单样本MR,因为该亚组“属于”同一研究人群。基于如此大样本的单样本MR研究虽然没有两样本MR的优势,但具有强大的统计能力(包括用于检验对二元疾病结局的因果关系)。此外,它具有个人参与者数据而不是摘要数据的优势,
在两个样本的MR中使用汇总数据的缺点类似于对RCT或多元回归观察结果进行荟萃分析的汇总结果-汇总结果的质量取决于各个研究的质量。因此,正如高等人的论文 。举例说明(请参阅下文),即使这些结果不是很理想,也必须使用所提供的汇总结果,例如,因为已经对协变量进行了调整,而您宁愿没有对其进行调整,或者所使用的样本不理想您的问题。
在可能被视为真正的两样本MR的情况下使用汇总GWAS数据时,由于一些队列研究对这两个GWAS都有贡献,因此这两个样本可能重叠(例如,许多成人队列研究都对肥胖测量的GWAS都有贡献以及CHD和2型糖尿病等疾病的预后)。如果此重叠很大,则可能会丢失两个样本相对于一个样本MR的某些优势,但是保留了使用汇总数据的劣势。尽管这似乎不太可能成为Gao及其同事进行的研究的一个问题,但应该包括探索这种问题的方法,并在任何两样本MR论文中使用汇总数据讨论其结果。
高和同事着手研究“肥胖在不同生命阶段与多种癌症风险之间的潜在因果关系”。Gao和他的同事研究了儿童BMI和成人BMI的影响,但是由于在不同年龄评估的BMI之间的相关性以及MR的性质,他们实际上无法确定不同生命阶段的影响。MR的显着优势之一是,它通常可以评估风险因素在生命的长期过程中(可能是从受孕而来)的累积影响,而无需重复风险因素评估,并且回归稀释偏倚或反向因果关系的可能性很小(因流行病而混杂), 7这也带来了一个缺点,即MR在探索不同生命过程模型的程度上受到了限制,例如在生命过程中的不同点上的暴露效果是否有所不同。12 ,13 从原始GWAS,15子BMI重叠与已知成年BMI的12变体, 14 ,其示出了区分这两种的难度。此外,MR-Egger测试 9正如Gao和同事所承认的那样,作者曾用来检验是否符合排除限制标准,但不能用来区分成人和儿童BMI的影响。这是因为MR-Egger仅在遗传工具对目标危险因素的影响独立于其对可能违反该假设的任何其他表型的影响时才有效。9 对于儿童和成人BMI,我们知道情况不太可能。
作者指出,尽管他们的MR结果表明成人BMI对乳腺癌有保护作用,但许多观察性研究报道,成人BMI对绝经前乳腺癌有保护作用,但对绝经后乳腺癌有不利影响。由于无法用绝经数据测试绝经前和绝经后乳腺癌之间的疗效差异,因此他们无法做到,因为乳腺癌协会未提供被这些亚表型分隔的GWAS。但是,关于BMI与绝经后乳腺癌呈正相关的一种假设是,绝经后肥胖的女性终生可能会暴露于更多的雌激素。1 此外,他们指出,他们的结果与最近的一项样本MR研究一致,该研究发现绝经前和绝经后女性中BMI与乳腺癌呈负相关,尽管在撰写本评论时,该论文似乎尚未发表。作者推测,成人BMI对乳腺癌(包括绝经后)的保护作用可能代表了早期BMI与以后体重增加之间的复杂相互作用。要使用MR进行测试,需要建立与早期BMI和随后体重变化有关的不同(独立)遗传变异。从计算上讲这很困难,但是最近的BMI轨迹的GWAS从1岁到17岁显示出了一些可能的未来研究,以探索这种可能性。15
与IJE 作者的建议和美国统计学会的最新指南相反 , 16 Gao 等。他们的结论主要基于P的发现多次测试后的-值等于<0.05。结论是较高的成人BMI,而不是腰臀比(WHR),可以减少乳腺癌并增加卵巢癌,肺癌和结直肠癌的风险。但是,BMI和WHR的一些点估计并没有那么相似。因此,可以得出结论,BMI降低了乳腺癌风险{几率[OR] 0.66 [95%置信区间(CI):0.57,0.77)]},但对于WHR却没有得出相同结论[0.73(0.53,1.00)]。同样,成人BMI对所有肺癌的影响的比值比为1.27(1.09,1.49)被宣布为阳性结果,但对1.33的比值比(95%CI:0.75,2.36)却没有得出相同的结论。 WHR对鳞癌的MR效应。
一个相关的问题是,WHR的发现是否可能比BMI的发现更偏向于零。使用汇总数据的一个缺点是您必须获取原始研究中分析的结果。Gao及其同事使用的WHR变体针对BMI进行了调整,作者似乎没有意识到。这种调整可能会使与未经调整的WHR相关的全基因组变异的影响产生偏差(远离零值)。17 因此,对未调整的WHR对癌症的影响的MR估计将使它偏向零值,因为由于BMI的调整,比例的分母(遗传仪器与WHR的关系)将被夸大。
为什么大多数强调的(基于统计检验)MR结果是针对成人BMI而不是其他肥胖风险因素的进一步潜在解释是,成人BMI的遗传工具比其他特征更强大。一样本MR中的仪器偏差较弱,导致偏向混杂的多元回归结果,而二样本MR中的仪器偏向于零值(表格1)。3 Gao和他的同事没有提供有关不同仪器变量强度的任何信息,例如遗传仪器-肥胖性状关联的F统计量或R 2。从原始论文中可以看出,成人BMI的指标要强于其他特征(成人BMI,出生体重,儿童BMI和WHR的R 2分别 为:0.027、0.008、0.020和0.013; R 2 儿童BMI仅适用于三个新颖的SNP,但是,正如原始论文的作者所指出的那样,它是在相对较小的样本上计算得出的,因此需要谨慎对待。14 ,18-20 有趣的是,尽管高 等。使用最新的BMI GWAS数据,尽管它们针对WHR的最新GWAS已针对BMI进行了调整,但20使用了最新的BMI GWAS数据, 但发现了33个其他变体(并从早期GWAS确认此处使用了14个)并与最新的BMI GWAS同时发布。21
为了使两个样本的MR有效,两个样本必须来自相同的基础人群,但对于Gao 等人在论文中针对性别的癌症 。,情况似乎并非如此。根据高在补充表1中提供的数据,似乎遗传工具变量与每个肥胖性状的关联均取自结合了男性和女性的样本,而遗传工具与乳腺癌和卵巢癌的关联,仅包含女性,而仅包含前列腺癌男性。1 假设男女之间的遗传变异与肥胖危险因素的关系没有差异。Gao 等人未讨论此问题 。
我查看了GWAS的四篇原始论文,以探讨性别对GWAS肥胖性状的影响是否存在差异。14 ,18-20对于出生体重和儿童的BMI,似乎没有尝试去探索性别差异,这可能反映了这些研究中这样做的能力不足。因此,不可能知道这两个危险因素是否存在无性别差异的假设。对于成人BMI,报告了性别差异,并且发现了77个变异中的两个差异(女性与男性的关联性更高)。77个变体中仅有两个的差异可能不足以使成年BMI的结果具有性别特异性,但作者没有针对每个具有性别差异的变体使用特定于性别的beta值,这令人失望具体结果也未在论文中阐明,分母将来自两性的数据结合在一起。
更令人惊讶的是,尽管从原始GWAS论文的标题中可以清楚地发现并检查了性别差异,但他们似乎还使用了性别综合结果来确定针对BMI调整的WHR的效果 19 (表2)。高和同事使用的针对BMI变异进行调整的14种WHR中,女性比男性更强(表2),在最新的GWAS中的44个变体中,有19个在雌性中更强(而在雄性中更强)。21 在两个GWAS中,针对BMI调整的遗传仪器对WHR的等位基因效应的结果,女性明显强于男性。因为这是MR比估算值的分母,所以这意味着为女性癌症(乳腺癌和卵巢癌)的BMI调整的WHR估算效果可能会被夸大,而对于前列腺癌的估算则可能被低估。
GWAS显着SNP的等位基因效应幅度(按性别)与原始GWAS的性别比(根据体重指数调整),并由Gao及其同事用于癌症效应的两样本MR中
SNP rs号 | GWAS对女性的影响 | GWAS对男性的影响 | GWAS对男女的综合作用 | 高等人使用的影响幅度 。 |
---|---|---|---|---|
Rs9491696 | 0.050 * | 0.031 | 0.042 | 0.042 |
Rs6905288 | 0.052 * | 0.020 | 0.036 | 0.036 |
Rs984222 | 0.034 | 0.035 | 0.034 | 0.034 |
Rs1055144 | 0.044 | 0.035 | 0.040 | 0.040 |
Rs10195252 | 0.054 * | 0.010 | 0.033 | 0.033 |
Rs4846567 | 0.059 * | 0.005 | 0.034 | 0.034 |
Rs1011731 | 0.029 | 0.028 | 0.028 | 0.028 |
Rs718314 | 0.042 * | 0.017 | 0.030 | 0.030 |
Rs1294421 | 0.031 | 0.025 | 0.028 | 0.028 |
Rs1443512 | 0.040 * | 0.018 | 0.031 | 0.031 |
Rs6795335 | 0.038 * | 0.011 | 0.025 | 0.025 |
Rs4823006 | 0.030 | 0.015 | 0.023 | 0.023 |
Rs6784615 | 0.047 | 0.039 | 0.043 | 0.043 |
Rs681681 | 0.024 | 0.019 | 0.022 | 0.022 |
所有值都是针对体重指数(BMI)进行调整的腰臀比(WHR)的每个等位基因差异。在GWAS中,有强有力的统计证据表明,每个协会的偶然性可能性都很低,特别是在女性中( P 女性只有 1.55×10 -6 至3.84×10 -34 ; P 女性只有 0.043至9.41×10 -13 ; P 组合为 1.9×10 -9 至1.8×10 -40 。高等 。在所有分析中,包括具有特定性别结局的结果(乳腺癌,卵巢癌和前列腺癌),似乎都从性别综合结果中得出了等位基因得分。所有变体的总和分别解释了针对男性和女性的BMI调整后的WHR的1.34%和0.46%。特别是,女性的等位基因综合效应要强于男性。对于标有星号(*)的人,有强有力的性别差异统计证据( P 性别差异 1.9×10 -3 至1.2×10 -13 )
由于不使用性别特定的遗传工具数据而导致的真实效果可能被夸大,这是由于仪器偏弱和BMI WHR调整的可能结果而导致的对零位偏倚的程度(在上面讨论)。 WHR协会在女性癌症中,是无法分辨的。但是这项研究确实说明了使用汇总GWAS数据和可能用于限制这些数据的方法的一些陷阱。因此,对于在两个样本的MR中使用摘要数据,我将提出以下建议。
确保这两个样本来自相同的种群。如果不是这种情况(如本白皮书中针对性别的癌症),请查看原始论文出版物和/或联系原始作者,以查看是否有可能从同一人群中获得结果(此处为针对性别的结果) )。如果不可能,请考虑可能的偏差,进行敏感性分析和/或考虑是否适合进行分析。
报告两个样本之间任何重叠的程度。这将需要搜索原始出版物和/或财团网站。如果重叠很大,则应认为该研究更像是单样本MR,而关于长处和局限性的讨论应针对单样本MR。
确定是否在原始GWAS中对任何协变量进行了调整,并对此进行报告。如果进行了调整,请确保考虑到结果的表示和解释。
报告如何评估风险因素和结果,包括疾病病例是普遍的,突发的还是混合的。考虑测量误差和/或幸存者偏倚(主要是在使用普遍病例的情况下)是否可能会影响发现。
描述由于摘要数据而无法进行的,可能对进行重要的任何其他关键分析,例如亚表型或相互作用。
在过去的十年中,我观察(并参与)GWAS和MR的发展时令我印象深刻的是,我们这些主要从事流行病学(包括干预研究)工作的人做我们众所周知的好科学的速度有多慢。我们的遗传同事已率先确保在大型合作中的复制,在这种合作中,“团队科学”受到赞赏,并且在很大程度上得到了适当回报。那些将MR作为一种方法开发的人从一开始就对其局限性非常开放,并致力于开发方法来测试和限制偏差的来源。2 ,3 ,9 值得注意的是,例如,高 等。对MR的“强”假设发表评论,但我们很少看到这样的陈述,即关于常规多变量回归分析的同样强大且不可检验的假设。现在,遗传流行病学家向我们展示了如何提供完整的开放获取摘要数据,并且在未来十年中,很可能会重要且有影响力地使用这些数据。4
在第一篇建议使用MR的论文发表之前的十年, Lau及其同事[ 2]证明,如果定期更新累积的荟萃分析,链激酶在患有急性心肌梗塞的患者中的有益作用将在1973年确立,在该日期之后对超过35,000名患者进行了进一步的随机分组,只是证实了原始结果并推迟了挽救生命的治疗的广泛实施。22 1997年,Egger和Davey Smith在急性心肌梗死后的β受体阻滞剂和死亡率方面表现出相同的结果。23可以通过轻松地访问所有RCT中测试的所有内容的完整摘要数据来前瞻性地确定这些回顾性发现。但是,我们仍然缺乏这种访问权限。
以下(按名字的字母顺序)对本评论的早期草案提供了有益的评论:George Davey Smith(布里斯托大学),Gibran Hermani(布里斯托大学),Maria-Carolina Borge(佩洛塔斯联邦大学),尼尔·皮尔斯(伦敦卫生与热带医学学院),菲利普·海考克(布里斯托尔大学),雷切尔·弗雷西(埃克塞特大学)和理查德·马丁(布里斯托尔大学)。本评论中表达的观点是作者的观点,不一定是此处承认的任何人的观点。
除了获得来自公共或慈善资助机构的资金用于她的研究外,DAL还获得了工业界(Medtronic和Roche Diagnostics)有关其生物标志物研究的支持。那笔资金与本文的评论无关。她声明没有其他利益冲突。
DAL的工作部门获得了布里斯托大学和英国医学研究理事会的资助(拨款参考:MC_UU_12013 / 5),她是美国国立卫生研究院高级研究人员(NF-SI-0611-10196)。本文中的评论是作者的,不一定是MRC或NIHR的。
联系客服