打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
倾向得分匹配-理论概述一







倾向值分析

Propensity Score Analysis




       倾向值分析已被证明是使用非实验数据或者观测数据进行干预效应评估时很有用的、较为新颖的且具有创造性的一类统计学方法。这种方法最早由Paul Rosenbaum和Donald Rubin在1983年提出,此后该方法获得了快速发展并且在各个方面不断改进。诸如倾向值加权等其他的新模型已经被发展出来,将倾向值和传统方法有效结合。

      该方法用于处理观察研究的数据。在观察研究中,由于种种原因,数据偏差和混杂变量较多,倾向得分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。一般常用于医学、公共卫生、经济学等领域。

       以临床研究为例,恶性胸膜间皮瘤(MPM)是一种罕见且通常致命的恶性肿瘤。尽管为提高生存率做出了很大的努力,包括引入顺铂和培美曲塞双联化疗、放射治疗、手术技术的进步以及提高围手术期患者护理,但是恶性胸膜间皮瘤的预后并未发生显着变化。同时由于疾病的罕见性,实施临床试验极其困难。研究人员通过收集数十年间的病例来进行研究,得到的数据是观察研究数据,而不是随机对照实验数据,手术组或者非手术组已经确定,无法人为干预,因此必然会存在选择偏倚1。

       从统计学角度分析,这是由于因变量除了受到自变量的影响外,还不可避免的会受到其它因素的影响。例如,在临床试验中,除了手术方式这个自变量会影响患者生存率以外,参与试验病人的身体状况,性别,年龄等因素也可能会影响到预后变化,我们将这些因素称为混杂因素。混杂因素的存在使得分析者无法确定因变量的变化是由自变量引起的,还是由混杂因素引起的,还是由自变量与混杂因素交互影响的。





处理混杂因素的方法




1.随机试验(Randomized Controlled Trial)

       实验设计中,控制混杂因素最主要方法是随机试验。只有在完全随机的情况下,才能保证混杂因素在自变量与因变量之间影响完全相同,这是一种理想化假设。然而,随机试验在实际运用中有很多限制,例如,高昂的研究费用、实际操作的困难性、不适用于发生率很低的试验等。

2.分层分析(Stratified Analysis)

       分层分析是一种常用的控制混杂因素的方法,它是将数据资料按照某个需要控制的混杂因素进行分层,然后再估计暴露/处理因素与研究结局之间的关联性。

3.多因素调整分析法(Multivariable risk adjustment)

       多因素调整分析法适用于研究中存在较多的混杂因素,且混杂因素较为复杂(例如混杂因素为多分类变量或连续变量),克服了分层分析仅仅适用于混杂因素较少,且多为分类变量的缺点。在观察性研究中,我们通常可以构建一个多因素调整的回归方程,来探讨对结局有独立作用的影响因素。其中方程的因变量为结局事件,而自变量既包括研究者关注的暴露/处理因素(如药物、手术等),也包括其他可以影响结局的混杂因素(如年龄、性别、疾病严重程度等)。在多因素调整分析方法中,根据因变量的类型不同,我们最常应用到的三种回归模型即:多重线性回归、logistic回归及Cox回归。

4.工具变量分析(Instrumental Variable Analysis, IVA)

       工具变量分析是一种用来控制测量误差和未知混杂因素引起的偏倚的估计方法,其基本思想为通过选择有效的工具变量,采用二阶段回归分析来消除未知混杂因素与暴露/处理因素之间的关系,使得混杂因素在暴露/处理组与对照组之间的分布是均衡的,从而获取暴露/处理因素对结局变量无偏的效应估计值。缺点是工具变量选取难度大,且易引起选择偏倚。

5.倾向得分匹配法(Propensity Score Matched)

       采用多个配对变量跟分组变量建立回归方程,根据方程每个研究对象算出一个值作为得分(score),评分相近的研究对象匹配。可用于观察性研究:队列研究设计,分组变量是暴露因素X;病例对照研究设计,分组变量是结局指标Y。PSM优点:提高论文证据力度,控制混杂、防止偏性。缺点:需要样本量大,匹配后引起的样本量损失不容忽视,甚至引起原有研究样本代表性的问题。


       尽管如此,倾向得分匹配依旧是一个不可或缺的方法,基于该方法的加权利用了全部样本进行分析,可以在一定程度上弥补因匹配导致的样本流失问题。

       如下图所示,分别是匹配前、匹配后混杂因素处理结果及匹配前后倾向得分图。

       下期我们将继续学习倾向得分匹配的理论,敬请期待~





参考文献




1.Nelson, D. B.; Rice, D. C.; Niu, J.; Atay, S.; Vaporciyan, A. A.; Antonoff, M.; Hofstetter, W. L.; Walsh, G. L.; Swisher, S. G.; Roth, J. A.; Tsao, A.; Gomez, D.; Giordano, S. H.; Mehran, R.; Sepesi, B., Long-Term Survival Outcomes of Cancer-Directed Surgery for Malignant Pleural Mesothelioma: Propensity Score Matching Analysis. J Clin Oncol 2017, 35, (29), 3354-3362.

作者简介

姓名:石鹏

院校:中国医科大学

擅长方法:多元回归分析



提==


学堂正在招募内容主笔、短视频创作者、课程讲师,请在公众号底部菜单栏点击“招聘”了解详情!


SPSS学堂 交易担保 放心买 SPSS学堂小商店 小程序

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
如何用SPSS进行双因素方差分析?
9种常用的数据分析方法汇总(上)
互助问答第218期:自变量为分类变量,因变量为连续型变量的回归方法
数据分析方法汇总
九大常用数据分析方法汇总
一文搞定协方差!(附案例分析) | 科研实务
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服