这是一种cheap 又好用的统计方法，你却视若无物？

它便是协方差分析！

SPSS 教程 29讲-34讲：混杂偏倚及控制方法

29讲：了解混杂因素与混杂偏倚

30讲：为什么回归分析可以控制混杂偏倚

31讲：如何控制随机对照研究中协变量的影响

32讲：协方差分析在随机对照中的应用

33讲：分层分析控制实验性研究混杂偏倚

34讲：利用回归分析控制偏倚的过程与报告撰写

SPSS 教程 32讲：协方差在随机对照研究的应用

顾名思义，协方差分析是协助方差分析的方法，纳入协变量(Covariate）开展方差分析。协变量的作用，在上一讲31讲，已经进行了介绍，它的身份往往是混杂因素，因此协方差分析往往用来控制混杂偏倚。一般用于随机对照研究

通俗来讲，协方差分析（analysis of covariance，ANCOVA）是方差分析基础上加入协变量进行回归分析，也就是方差分析和线性回归分析的结合。大家都明白，方差分析是可以开展组间差异性分析，在分组均衡性的实验性研究中，方差分析可以证明处理因素与定量结局的关系；那么线性回归呢？在上一讲我已经介绍，线性回归可以控制混杂偏倚。既然如此，如果协变量是混杂变量，我们用线性回归分析便可以控制偏倚了。因此方差分析与回归分析相结合的协方差分析，便可以控制偏倚，探讨处理因素效应了。

一般的方差分析，我可以建立以下等式

协方差分析模型可以建立以下等式

μ代表处理因素因素和协变量均不在的水平；a、b*协变量分别代表处理因素水平和协变量附加效应；eij是剩余变异。根据这一方法，我们混杂偏倚从原本的a（式1）中移除出去，得到了更为真实的a（式2）

由于在控制偏倚的优秀表现，协方差分析是一种随机对照研究常见的方法，它结合不同研究设计活跃在统计分析中。最常见的是普通的随机对照研究的协方差分析，也可以结合随机区组设计、析因设计、重复测量设计开展协方差分析。

本文结合案例，探讨协方差分析的分析思路、SPSS操作，总结协方差分析的价值。

实例分析

一项临床试验，研究对象是高血压患者，随机分为两组，分别用复方羚羊角降压和安慰剂各治疗20名高血压病人，对每人治疗前、后收缩压（mmHg）进行测量，数据见ANCOVA.sav，问该药有无降压作用？

本案例的汇总数据如下

统计分析策略

该研究是随机化研究，结局是定量数据，一般情况下我们可以直接考虑t检验（正态分布）或者秩和检验（偏态分布）来进行统计分析，比较试验组和对照组的差异性。

不过，该数据有实验前的血压，而且看起来貌似实验前差别有点大（123.10 vs 114.7）。分组不均衡！

在这种情况下，本例在统计策略上，可以考虑差值法和协方差分析法

若采用差值法，则计算每名患者治疗前后的差异，并开展差值的统计分析，结果如下：

试验组和对照组，干预前后差值差异具有统计学意义（差值8.2，95%CI 2.82--13.56，P=0.004）

本文采用协方差分析的方法来进行。

协方差分析SPSS软件操作

1

协方差分析主界面

分析--一般线性模型--单变量

2

协方差分析操作界面

协方差分析属于广义线性模型的一种，因此，采用的SPSS是广义线性模型的界面，该界面需要设定因变量、固定因子、协变量、交互变量、多重比较等诸多内容。关于广义线性模型，本系列文章在之前的随机区组方差分析已经开展详细的介绍

SPSS 统计分析策略（8）：随机区组设计方差分析

此处介绍协方差分析的关键选项

①因变量即为结局变量，

②固定因子要放入研究因素。本例是group（实验因素）

③协变量：放入基线值，本例基线值是“治疗前收缩压”

④模型：具体操作上，选择① 构建项。“构建项”意味着选择方差分析要纳入的研究因子。一般随机区组方差分析均选择“构建项”，也就是人工筛选因子。不推荐以“全因子”方式纳入因子。“全因子”意味着电脑纳入所有的因子进入模型（包括交互效应）。在②因子与协变量中，将group（区组因素）和treat（实验因素）通过选择③的“主效应”放入到右侧选框中（不要选择交互）。

⑤选项：选项可以开展残差分析与方差齐性检验（具体可以见随机区组方差分析的介绍），但此处需要点击“参数估计值”

3

协方差分析结果

根据上述设置，协方差分析给出两张关键的结果，一张是主效应，另一张是参数估计结果。

第一张：主效应结果

第二张表：给出了实验组相对对照组的差异性(b值）以及95%置信区间。

协方差分析结果与差值法t检验略有不同。该结果统计表如下：

协方差分析，不仅仅是控制混杂

之前的例子，一直在讨论协方差分析在控制混杂偏倚方面，所发挥的作用，实际上，协方差分析还有一项非常重要的功能是，它可以提高检验效能。

与仅仅拿差值做t检验相比，协方差可以在一定程度上控制变异程度。学过方差分析的朋友知道一点，方差分析讲总变异分解为组间变异与组内变异。组间变异是由处理因素效果不同带来，而组内变异是残差引起。

如果方差分析模型再加上一个协变量，那么协变量也将挖走一部分变异，这部分变异是从原本无法解释的残差变异（原残差变异）而来，最后剩下的组内变异（新残差变异）将会变小。而方差分析就是比较组间变异与组内变异，当组内变异越小，方差分析的F越大，则P值越小，那就是研究分析容易获得统计学差异的结果。

这样的好事情，哪里去找？一个唾手可得的基线值结合协方差分析就可以将P值变得小一点！所以我说协方差分析是cheap 又好用的方法。在随机对照研究，干嘛不考虑协方差分析！

因此，随机分组已使协变量在各组的分布均衡可比，此时是否还需要校正协变量呢？答案是肯定的。因为协变量将影响结果变量，即结果变量的部分变
异来自协变量，如果能扣除协变量的影响，将提高组间比较的检验效能。

例 1 将三组大鼠随机分入 3 个饲料组（低蛋白、中蛋白、高蛋白）。各组大白鼠的进食量控制在相近的条件下，3 组大白鼠进食量与所增体重测定结果如下表。详细数据集见ANCOVA2.sav

该研究为随机化及，比较三组体重的差异性方法，可以采用方差分析的方法。结果如下：P=0.557，无统计学差异，是阴性结果。

在完全随机设计的方差分析中，研究者没有考虑进食量这一协变量。协变量是不是混杂因素呢？不妨做个差异性比较，采用方差分析：P=0.577，无统计学意义，也是阴性结果。

但是如果采用协方差分析方法，用SPSS25.0 统计软件进行协方差分析结果发现：3组间比较的F=3.744， P=0.042<0.05，可以认为不同饲料喂养的大白鼠，所增体重的均数在扣除进食量的影响后仍有差别。进一步分析发现，以第三组高蛋白组（treatment=3）为对照，低蛋白饲料组（treatment=1）组与高蛋白组组有统计学差异，饲料2组与饲料3组无统计学差异。

可以看出，采用协方差分析和不采用协方差分析的方法，结果有所区别。协方差可见通过控制协变量的影响，可能给我们带来新的不一样的结果。

这里我建议

对于结局是定量数据、

带有协变量的随机对照研究，

优先选择协方差分析

在随机对照研究，协方差分析是最主流的方法之一，其操作简单，结果可信，可控制混杂偏倚，改善分析结果，提高检验效能。

协方差分析的应用条件

协方差分析是方差分析的一种，一般情况协方差分析要满足正态性与方差齐性的条件，至于方差分析的独立性，则因研究设计而异，比如重复测量资料的协方差分析，则无须考虑独立性问题。

除此之外，还有一个非常重要的条件：协方差分析要求协变量与处理因素无交互效应，意味着无论在干预组还是在对照组，协变量x与结局Y的效应关系是一致的，从回归分析的角度，他们的回归系数b值一致，从回归关系图(下图）来看：如果我们分别绘制干预组和对照组的回归图，两条线图是平行的。

如果处理因素与协变量存在着交互，则不能开展协方差分析。

SPSS 课程视频和操作录屏

SPSS课程视频

带字幕去水印的视频可复制以下地址浏览器打开

https://evod.zcmu.edu.cn/resource.html?stationID=1&resourceid=426&isprivate=false&cateid=102

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。