打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
三种方法筛选控制变量

作者:潘承谕   来源:SPSS学堂     


大家好,我是上海交通大学医学院的硕士生ppppcy,目前方向是环境和人群健康,擅长流行病和统计相关内容,接下来将与大家分享协变量筛选系列内容,请大家多多关注~

在明确了暴露因素和结局变量的研究中,控制变量的筛选直接影响到后续多因素分析的结果。如,在研究吸烟和肺癌的关系时,往往还会控制年龄一变量,否则有可能得出吸烟是肺癌的保护因素这样与实际相悖的结论。控制变量的纳入需要考虑会受到样本量、结局事件数量是否足够,是否存在共线性等问题,此外还得结合经验判断是否存在专业意义。那么面对几十上百的研究因素中,大家该如何筛选出要控制的变量呢?接下来我们将会简单介绍一下三种比较常见的方法,教大家如何筛选控制变量。

1.单因素分析法

单因素分析想必大家都很熟悉了,比较常见的做法是对备选的混杂因素和研究因素或者结局变量进行单因素分析(如方差、卡方等),并将单因素分析结果有统计学显著性的变量(P是否<0.05、0.1、0.2)纳入后续模型进行分析。

2.有向无环图(Directed Acyclic Graph,DAG)

     有向无环图有时也被称为因果图,是结合专业及流行病学知识,根据变量与变量之间的因果关系筛选控制变量。如果从专业或者流行病学角度来看不存在混杂关系,就将变量剔除。在下图中,当我们研究0与5的关系时,2就是潜在的混杂因素。

3.效应改变法(change in estimations,CIE)

效应改变法也叫称为CIE原则,是根据控制变量对暴露因素与结局变量的之间影响是否足够大来判断是否纳入模型。比较常见的做法是一个变量纳入多因素分析模型后,观察暴露因素与结局变量的β变化量是否>10%,若>10%则保留,否则剔除。

在应用方面而言,三种方法也有着各自的优缺点,如下图所示。


优点

缺点
单因素分析法门槛低、适用性强未排除其他因素的干扰,尤其样本量较小时,可能会遗漏真正的混杂因素
DAG流行病学角度考虑可清晰地指明因果效应

习门槛高、有一定的难度。依赖于研究者丰富的专业知识。

CIE门槛低、适用性强、从统计角度考虑更跟有效地校正混杂

当涉及多种研究因素、结局、协变量时,工作量繁琐重复。

当然也可以把以上三种方法结合起来使用,比较常见的组合是使用DAG+CIE控制混杂。本篇介绍就到这里

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
你只会“先单后多”吗? 如何筛选自变量建立多因素回归模型
你认识它吗?--有向无环图(DAG):回归分析中自变量筛选的指导思想
倾向性评分与匹配病例对照研究辨析
流行病学 重点知识
重型肝炎中医证型辨证标准的论文---中医学论文
中考必备 | 四步搞定初中化学控制变量法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服