打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
这是一种cheap 又好用的统计方法,你却视若无物?
它便是协方差分析!


SPSS 教程 29讲-34讲:混杂偏倚及控制方法
29讲:了解混杂因素与混杂偏倚
30讲:为什么回归分析可以控制混杂偏倚
31讲:如何控制随机对照研究中协变量的影响
32讲:协方差分析在随机对照中的应用
33讲:分层分析控制实验性研究混杂偏倚

34讲:利用回归分析控制偏倚的过程与报告撰写

SPSS 教程 32讲:协方差在随机对照研究的应用

顾名思义,协方差分析是协助方差分析的方法,纳入协变量(Covariate)开展方差分析。协变量的作用,在上一讲31讲,已经进行了介绍,它的身份往往是混杂因素,因此协方差分析往往用来控制混杂偏倚。一般用于随机对照研究

通俗来讲,协方差分析(analysis of covariance,ANCOVA)是方差分析基础上加入协变量进行回归分析,也就是方差分析和线性回归分析的结合。大家都明白,方差分析是可以开展组间差异性分析,在分组均衡性的实验性研究中,方差分析可以证明处理因素与定量结局的关系;那么线性回归呢?在上一讲我已经介绍,线性回归可以控制混杂偏倚。既然如此,如果协变量是混杂变量,我们用线性回归分析便可以控制偏倚了。因此方差分析与回归分析相结合的协方差分析,便可以控制偏倚,探讨处理因素效应了。

一般的方差分析, 我可以建立以下等式

协方差分析模型可以建立以下等式

μ代表处理因素因素和协变量均不在的水平;ab*协变量分别代表处理因素水平和协变量附加效应;eij是剩余变异。根据这一方法,我们混杂偏倚从原本的a(式1)中移除出去,得到了更为真实的a(式2)

由于在控制偏倚的优秀表现,协方差分析是一种随机对照研究常见的方法,它结合不同研究设计活跃在统计分析中。最常见的是普通的随机对照研究的协方差分析,也可以结合随机区组设计、析因设计、重复测量设计开展协方差分析。

本文结合案例,探讨协方差分析的分析思路、SPSS操作,总结协方差分析的价值。

实例分析


一项临床试验,研究对象是高血压患者,随机分为两组,分别用复方羚羊角降压和安慰剂各治疗20名高血压病人,对每人治疗前、后收缩压(mmHg)进行测量,数据见ANCOVA.sav,问该药有无降压作用?

本案例的汇总数据如下

统计分析策略

该研究是随机化研究,结局是定量数据,一般情况下我们可以直接考虑t检验(正态分布)或者秩和检验(偏态分布)来进行统计分析,比较试验组和对照组的差异性。

不过,该数据有实验前的血压,而且看起来貌似实验前差别有点大(123.10 vs 114.7)。分组不均衡!

在这种情况下,本例在统计策略上,可以考虑差值法和协方差分析法

若采用差值法,则计算每名患者治疗前后的差异,并开展差值的统计分析,结果如下:

试验组和对照组,干预前后差值差异具有统计学意义(差值8.2,95%CI 2.82--13.56P=0.004

本文采用协方差分析的方法来进行。

协方差分析SPSS软件操作


1



 协方差分析主界面

分析--一般线性模型--单变量


2



协方差分析操作界面

协方差分析属于广义线性模型的一种,因此,采用的SPSS是广义线性模型的界面,该界面需要设定因变量、固定因子、协变量、交互变量、多重比较等诸多内容。关于广义线性模型,本系列文章在之前的随机区组方差分析已经开展详细的介绍

SPSS 统计分析策略(8):随机区组设计方差分析

此处介绍协方差分析的关键选项

因变量即为结局变量,

固定因子要放入研究因素。本例是group(实验因素)

协变量:放入基线值,本例基线值是“治疗前收缩压”

④模型:具体操作上,选择① 构建项。“构建项”意味着选择方差分析要纳入的研究因子。一般随机区组方差分析均选择“构建项”,也就是人工筛选因子。不推荐以“全因子”方式纳入因子。“全因子”意味着电脑纳入所有的因子进入模型(包括交互效应)。②因子与协变量中,将group(区组因素)和treat(实验因素)通过选择的“主效应”放入到右侧选框中(不要选择交互)

选项:选项可以开展残差分析与方差齐性检验(具体可以见随机区组方差分析的介绍),但此处需要点击“参数估计值”


3



协方差分析结果

根据上述设置,协方差分析给出两张关键的结果,一张是主效应,另一张是参数估计结果。

第一张:主效应结果

第二张表:给出了实验组相对对照组的差异性(b值)以及95%置信区间。

协方差分析结果与差值法t检验略有不同。该结果统计表如下:

协方差分析,不仅仅是控制混杂

之前的例子,一直在讨论协方差分析在控制混杂偏倚方面,所发挥的作用,实际上,协方差分析还有一项非常重要的功能是,它可以提高检验效能。

与仅仅拿差值做t检验相比,协方差可以在一定程度上控制变异程度。学过方差分析的朋友知道一点,方差分析讲总变异分解为组间变异与组内变异。组间变异是由处理因素效果不同带来,而组内变异是残差引起。

如果方差分析模型再加上一个协变量,那么协变量也将挖走一部分变异,这部分变异是从原本无法解释的残差变异(原残差变异)而来,最后剩下的组内变异(新残差变异)将会变小。而方差分析就是比较组间变异与组内变异,当组内变异越小,方差分析的F越大,则P值越小,那就是研究分析容易获得统计学差异的结果。

这样的好事情,哪里去找?一个唾手可得的基线值结合协方差分析就可以将P值变得小一点!所以我说协方差分析是cheap 又好用的方法。在随机对照研究,干嘛不考虑协方差分析!

因此,随机分组已使协变量在各组的分布均衡可比,此时是否还需要校正协变量呢?答案是肯定的。因为协变量将影响结果变量,即结果变量的部分变
异来自协变量,如果能扣除协变量的影响,将提高组间比较的检验效能 。

例 1 将三组大鼠随机分入 3 个饲料组(低蛋白、中蛋白、高蛋白)。各组大白鼠的进食量控制在相近的条件下,3 组大白鼠进食量与所增体重测定结果如下表 。详细数据集见ANCOVA2.sav


该研究为随机化及,比较三组体重的差异性方法,可以采用方差分析的方法。结果如下:P=0.557,无统计学差异,是阴性结果。

在完全随机设计的方差分析中,研究者没有考虑进食量这一协变量。协变量是不是混杂因素呢?不妨做个差异性比较,采用方差分析:P=0.577,无统计学意义,也是阴性结果。

但是如果采用协方差分析方法,用SPSS25.0 统计软件进行协方差分析结果发现 :3组间比较的F=3.744, P=0.042<0.05,可以认为不同饲料喂养的大白鼠,所增体重的均数在扣除进食量的影响后仍有差别。进一步分析发现,以第三组高蛋白组(treatment=3)为对照,低蛋白饲料组(treatment=1)组与高蛋白组组有统计学差异,饲料2组与饲料3组无统计学差异。


可以看出,采用协方差分析和不采用协方差分析的方法,结果有所区别。协方差可见通过控制协变量的影响,可能给我们带来新的不一样的结果。

这里我建议

对于结局是定量数据、

带有协变量的随机对照研究,

优先选择协方差分析

在随机对照研究,协方差分析是最主流的方法之一,其操作简单,结果可信,可控制混杂偏倚,改善分析结果,提高检验效能。

协方差分析的应用条件

协方差分析是方差分析的 一种,一般情况协方差分析要满足正态性与方差齐性的条件,至于方差分析的独立性,则因研究设计而异,比如重复测量资料的协方差分析,则无须考虑独立性问题。

除此之外,还有一个非常重要的条件:协方差分析要求协变量与处理因素无交互效应,意味着无论在干预组还是在对照组,协变量x与结局Y的效应关系是一致的,从回归分析的角度,他们的回归系数b值一致,从回归关系图(下图)来看:如果我们分别绘制干预组和对照组的回归图,两条线图是平行的。

如果处理因素与协变量存在着交互,则不能开展协方差分析。

SPSS 课程视频和操作录屏

SPSS课程视频

带字幕去水印的视频可复制以下地址浏览器打开
https://evod.zcmu.edu.cn/resource.html?stationID=1&resourceid=426&isprivate=false&cateid=102
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
方差分析基础
从方差到协方差分析,这里有你需要掌握的重要知识点 | 护理科研
2023心理学考研 | 百日打卡 Day.107 方差分析
倾向性评分与匹配病例对照研究辨析
中医药临床研究中预试验样本量的确定
独立样本t检验,来看看完整版的SPSS教程
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服