34讲:利用回归分析控制偏倚的过程与报告撰写
SPSS 教程 32讲:协方差在随机对照研究的应用
顾名思义,协方差分析是协助方差分析的方法,纳入协变量(Covariate)开展方差分析。协变量的作用,在上一讲31讲,已经进行了介绍,它的身份往往是混杂因素,因此协方差分析往往用来控制混杂偏倚。一般用于随机对照研究
通俗来讲,协方差分析(analysis of covariance,ANCOVA)是方差分析基础上加入协变量进行回归分析,也就是方差分析和线性回归分析的结合。大家都明白,方差分析是可以开展组间差异性分析,在分组均衡性的实验性研究中,方差分析可以证明处理因素与定量结局的关系;那么线性回归呢?在上一讲我已经介绍,线性回归可以控制混杂偏倚。既然如此,如果协变量是混杂变量,我们用线性回归分析便可以控制偏倚了。因此方差分析与回归分析相结合的协方差分析,便可以控制偏倚,探讨处理因素效应了。
一般的方差分析, 我可以建立以下等式
协方差分析模型可以建立以下等式
μ代表处理因素因素和协变量均不在的水平;a、b*协变量分别代表处理因素水平和协变量附加效应;eij是剩余变异。根据这一方法,我们混杂偏倚从原本的a(式1)中移除出去,得到了更为真实的a(式2)
由于在控制偏倚的优秀表现,协方差分析是一种随机对照研究常见的方法,它结合不同研究设计活跃在统计分析中。最常见的是普通的随机对照研究的协方差分析,也可以结合随机区组设计、析因设计、重复测量设计开展协方差分析。
本文结合案例,探讨协方差分析的分析思路、SPSS操作,总结协方差分析的价值。
实例分析
一项临床试验,研究对象是高血压患者,随机分为两组,分别用复方羚羊角降压和安慰剂各治疗20名高血压病人,对每人治疗前、后收缩压(mmHg)进行测量,数据见ANCOVA.sav,问该药有无降压作用?
本案例的汇总数据如下
统计分析策略
该研究是随机化研究,结局是定量数据,一般情况下我们可以直接考虑t检验(正态分布)或者秩和检验(偏态分布)来进行统计分析,比较试验组和对照组的差异性。
不过,该数据有实验前的血压,而且看起来貌似实验前差别有点大(123.10 vs 114.7)。分组不均衡!
在这种情况下,本例在统计策略上,可以考虑差值法和协方差分析法
若采用差值法,则计算每名患者治疗前后的差异,并开展差值的统计分析,结果如下:
试验组和对照组,干预前后差值差异具有统计学意义(差值8.2,95%CI 2.82--13.56,P=0.004)
本文采用协方差分析的方法来进行。
协方差分析SPSS软件操作
协方差分析主界面
分析--一般线性模型--单变量
协方差分析操作界面
协方差分析属于广义线性模型的一种,因此,采用的SPSS是广义线性模型的界面,该界面需要设定因变量、固定因子、协变量、交互变量、多重比较等诸多内容。关于广义线性模型,本系列文章在之前的随机区组方差分析已经开展详细的介绍
此处介绍协方差分析的关键选项
①因变量即为结局变量,
②固定因子要放入研究因素。本例是group(实验因素)
③协变量:放入基线值,本例基线值是“治疗前收缩压”
④模型:具体操作上,选择① 构建项。“构建项”意味着选择方差分析要纳入的研究因子。一般随机区组方差分析均选择“构建项”,也就是人工筛选因子。不推荐以“全因子”方式纳入因子。“全因子”意味着电脑纳入所有的因子进入模型(包括交互效应)。在②因子与协变量中,将group(区组因素)和treat(实验因素)通过选择③的“主效应”放入到右侧选框中(不要选择交互)。
⑤选项:选项可以开展残差分析与方差齐性检验(具体可以见随机区组方差分析的介绍),但此处需要点击“参数估计值”
协方差分析结果
根据上述设置,协方差分析给出两张关键的结果,一张是主效应,另一张是参数估计结果。
第一张:主效应结果
第二张表:给出了实验组相对对照组的差异性(b值)以及95%置信区间。
协方差分析结果与差值法t检验略有不同。该结果统计表如下:
协方差分析,不仅仅是控制混杂
之前的例子,一直在讨论协方差分析在控制混杂偏倚方面,所发挥的作用,实际上,协方差分析还有一项非常重要的功能是,它可以提高检验效能。
与仅仅拿差值做t检验相比,协方差可以在一定程度上控制变异程度。学过方差分析的朋友知道一点,方差分析讲总变异分解为组间变异与组内变异。组间变异是由处理因素效果不同带来,而组内变异是残差引起。
如果方差分析模型再加上一个协变量,那么协变量也将挖走一部分变异,这部分变异是从原本无法解释的残差变异(原残差变异)而来,最后剩下的组内变异(新残差变异)将会变小。而方差分析就是比较组间变异与组内变异,当组内变异越小,方差分析的F越大,则P值越小,那就是研究分析容易获得统计学差异的结果。
这样的好事情,哪里去找?一个唾手可得的基线值结合协方差分析就可以将P值变得小一点!所以我说协方差分析是cheap 又好用的方法。在随机对照研究,干嘛不考虑协方差分析!
因此,随机分组已使协变量在各组的分布均衡可比,此时是否还需要校正协变量呢?答案是肯定的。因为协变量将影响结果变量,即结果变量的部分变
异来自协变量,如果能扣除协变量的影响,将提高组间比较的检验效能 。
这里我建议
对于结局是定量数据、
带有协变量的随机对照研究,
优先选择协方差分析
在随机对照研究,协方差分析是最主流的方法之一,其操作简单,结果可信,可控制混杂偏倚,改善分析结果,提高检验效能。
协方差分析的应用条件
协方差分析是方差分析的 一种,一般情况协方差分析要满足正态性与方差齐性的条件,至于方差分析的独立性,则因研究设计而异,比如重复测量资料的协方差分析,则无须考虑独立性问题。
除此之外,还有一个非常重要的条件:协方差分析要求协变量与处理因素无交互效应,意味着无论在干预组还是在对照组,协变量x与结局Y的效应关系是一致的,从回归分析的角度,他们的回归系数b值一致,从回归关系图(下图)来看:如果我们分别绘制干预组和对照组的回归图,两条线图是平行的。
如果处理因素与协变量存在着交互,则不能开展协方差分析。
SPSS 课程视频和操作录屏
SPSS课程视频
联系客服