缘起
后台收到一个咨询如下,有点意思,这篇文章的套路虽然普通,但是确实不常见。分享出来大家供大家赏析。
原文标题:
Reduced Intellectual Ability in Offspring of Ovarian Hyperstimulation Syndrome: A Cohort Study
卵巢过度刺激后代智力下降综合征:一项队列研究
这是一篇队列研究,研究卵巢过度刺激对子代智力IQ的影响。选择了3种IQ指标。
IQ是数值变量,因此作者采用了线行回归模型。这在我们生物医药研究中,线性回归模型没有Logistic回归和COX回归用的多。
咨询者问的问题是:模型中也有校正和未校正。这在Logistic回归和COX回归中常用,线性回归怎么用呢?
其实道理是一样的。对于统计而言,校正谁,就是把谁放入模型。
只不过Logsitic采用的统计指标为OR和95%CI;COX是HR及其95%CI。
而对于线性回归,那就是均数差和其95%CI。
松哥常说建模有三种目的,一是风险因素的发现,二是风险因素的验证;三是结局效应的预测。
本例一看到Unadjusted、Model1和Model2,其实就知道了,这是风险验证模型。风险验证模型就是抽丝剥茧,排除一切可能干扰的因素,最终确定我们所研究的因素到底与目标时间有没有关系。
那么怎么实现呢?
很简单,以verbal IQ为例,将Verbal IQ作为Y放入模型,以是否卵巢过度刺激作为X放入模型,即可得到回归系数B和95%CI;然后分布加入其他协变量,分别得到Model1和Model2的B和95%CI即可。
有人会追问,为什么不给P值呢,其实P值和95%CI是相通的,95%CI给出的信息比P值要多的多,因此95CI更好!
下面是松哥虚构的一组数据。研究性别对身高的影响。松哥先做两独立t检验,然后再用回归做,你会发现结果是惊人的相同。
下表是两独立t的结果,发现均数差是11.7457,95%CI:10.87-12.62
下表是线性回归的结果,你会发现回归系数B=-11.746和t检验结果一致,就是方向相反,因为回归是X改变一个单位Y的平均该变量,这里男=1,女=2,所以方向是反的,如果设置男=2,女=1,则结果一模一样。
而且后面的95%CI也和t检验一样。
松哥常说,初级说一说是统计世界的一维空间,中级比一比是二维空间,高级找关系是统计世界的三维空间。
三维空间秒杀二维空间,二维秒杀一维空间,所以我们完全可以用回归去处理t检验。
这里松哥给大家展示的t检验和线性回归,都是单因素分析,因为只考虑性别因素。
当模型中加入其他协变量,就叫做多因素分析了。维度越高处理多因素的能力越强哦!
回归是统计学的上乘功夫,得回归而得统计的天下!
SPSS实战系列[2]
【赠人玫瑰,手留余香】
【2045】有序Logistc回归,为什么不能计算OR值,那还玩啥?
【2041】为什么SPSS读取Excel数据乱码或空值,真实案例
【2040】谁说SPSS不能画统计地图
【2038】别犯愁了,SPSS数据录入格式就这4种,松哥给你总结好了
【2037】如何计算二项logistic回归模型的灵敏度、特异度等指标
【2033】如何让SPSS根据自身数据库行号产生ID特征变量
【2031】相关样本非参数检验如何实现两两事后比较
【2029】SCI编辑让我报告LSD-t检验的t值,可是SPSS没有啊,怎么办?
【2027】如何利用SPSS计算总体率与总体均数的95%可信区间
【2026】SPSSS如何实现哈迪-温伯格平衡(Hardy-Weinberg equilibrium)法则检验
【2025】R×C列联表(分类数据)的统计分析方法选择与SPSS实现
【2023】Kappa一致性与组内相关系数(ICC)应用辨析【推荐】
【2017】SPSS输出结果统计表与统计图的专业性编辑及三线表定制格式赠送!
【2006】为什么配对样本t检验,SPSS结果默认输出相关性
【2004】如何让SPSS自动按照四分位数间距分组某变量【技巧】
【2002】太伤自尊,以为学会了,现在用SPSS连两独立样本t检验都做不好
----------------------------------------------
联系客服