打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
统计结果可视化

空格本文介绍ggplot2在统计分析可视化中的应用。 文中通过五张图,介绍一种简单的分析思路:单因素分析——多因素分析——分层分析——综合分析。


单因素分析

空格有时候,面对一个数据集,可能不知如何下手,尤其是导师没有设定课题,要自定题目。更有时候,查阅了很多文献,想到了一个稍微新颖的题目,于是开始分析数据,却发现单因素已然无统计学意义。只好更换题目。下图将展示了一个单因素logistic回归模型的结果。

空格做图前,通过循环,分别对数据集中每个自变量建立logistic, 依据S3类方法对glm对象提取感兴趣的OR值、置信区间等,放入提前建立的空数据框,储存每次循环的结果。然后用ggplot2展示结果,由此,根据变量的OR值及专业知识等,可进行选题。至少选择单因素分析有统计学意义的危险因素由于这里只谈论图形,数据操作部分的代码略去。代码和结果如下:(点击图片可以放大查看)



多因素回归

空格单因素分析后,由于可能的混杂效应,要做调整其他可能混杂因素的多因素分析,下图左侧展示了多因素COX回归的HR, 右侧展示了单因素COX回归的HR。图中采用了ggplot2中的facet函数。代码和结果如下:




亚组分析

空格单因素、多因素分析后,如果进行亚组分析,可以探究修饰效应,更能增多统计结果,从多角度论证自己研究因素的价值。下图中,分性别,在不同血压水平、是否大于50岁的多个亚组中探究自变量的RR值变化,其中“NWNT”为参考组(RR值为1)。



空格上图虽然简洁明了,但却很少出现在杂志中,下图是它的变身,提供了相似的信息,可以经常在文献中看到(代码略)。



综合作图

空格上述展示了单因素分析、多因素分析及分层分析的结果。下图是它们的综合。图中自变量是连续型变量,采用不同的节点(如四分位间距、临床有意义的界值等)分为四组,分别对应facet的每一行,均以group1为参考组。每一列表示不同的亚组及不断加入的调整因素,如both代表总人群(前5列),female为女性人群(中5列),male为男性人群(后5列),相应的不断加入调整因素年龄、BMI、疾病史等。可以看到采用第三行:四分位间距对自变量分组,可以避免OR值在1上下波动的问题(提示:同样的变量,不同的处理方式,可能会得到不同的结论)。且随着矫正因素的加入,OR值变化逐渐变缓。图中,关于每个格子的大红点:对探究因素采用不同分组方式,其分组的中位数作为自变量纳入对应模型(做趋势性检验),由于趋势性p值均小于0.01,对其系数进行标化,红点的面积代表系数的大小。也可看出,在不同人群中,随着矫正因素的增多,红点变小,进一步提示可能存在的混杂因素。结合OR值,可以看出,自变量按四分位间距处理,总人群中发现自变量是危险因素。主要是女性中比较明显,而在男性中,进一步调整其他因素后,无统计学意义。




参考文献:

https://www.R-project.org/

http://had.co.nz/ggplot2/book/


感谢韩西坤的撰稿!



欢迎关注【统计咨询】微信公众号!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
SPSS:单因素重复测量方差分析(史上最详细教程)
单因素分析与多因素分析的结果矛盾怎么办?
单因素完全随机实验的方差分析
多因素线性回归分析,为什么和单因素回归结果不一样?
那么多变量,我该选择哪些进入多因素分析呢?
单因素分析和多因素分析的结果不一致,怎么办?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服