打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【2060.】不要轻易相信SPSS自动赋值功能
缘起

    我们都知道,SPSS对于字符型的变量,可以进行“自动赋值编码”的功能,好用到爆,可是最近松哥再一次数据整理的过程中,发现这个过程编码后,一定要多个心眼,否则有坑!

 案例呈现





      如我们研究血管狭窄程度与某个指标X(连续性正态)的相关性,可是数据库建立时,狭窄程度为字符型(无狭窄、轻度狭窄、中度狭窄和重度狭窄),字符型变量统计分析不好分析,我们想把狭窄程度直接转换为数字型,而且让软件直接进行编码,编码后与X进行Spearman相关分析。

于是我们-转换-自动重新编码:

将狭窄程度放入后,定义一个狭窄程度_1,确定运行!


结果你会发现,在数据库中最右边产生一个新变量“狭窄程度_1”。因为狭窄程度是等级变量,因此狭窄程度与X之间的相关性采用Spearman相关,这是没问题的。

问题来了





     我们知道,本例如果我们手动进行赋值转换的话,应该无狭窄=1,轻度=2,中度=3,重度=4,这是可以的对吧!

     可是SPSS自动赋值功能,它并不能识别中文的语境,因此,它是否自动赋值和我们专业上考虑是一直的呢?

     非常简单,我们看一下自动赋值后的变量值标签即可。我们打开值标签如下:完蛋了!完蛋了!

     我们发现“1=轻度,2=无狭窄,3=中度,4=重度”。这样的赋值打乱了我们专业上的次序,这样子做出来的相关性结果肯定会违背事实的呀!

     那SPSS为啥会犯错呢?因为SPSS也不懂中文,因此它只会根据字母顺序进行赋值,轻度首字母是Q,而无狭窄首字母是W,中和重都是Z,这下您明白了吧!

如何避免与纠正





     如果您使用了自动赋值功能,对于无序分类变量,则不必考虑上述问题;但是对于等级资料,在您赋值之后,一定要看一下赋值的顺序是否符合专业。一般来说都不会符合(也会存在巧合的情况),那么只要在值标签中进行修订即可!本来本期说重测的Bug,但这个感觉有意思,所以插个队!

SPSS实战系列[2]

---SPSS实战与疑难杂症系列---

【2059.】学了SPSS之后,我竟然连变量名都命名不了

【2058.】SPSS太不靠谱,明明没有缺失值,非说有缺失值,难道是真的?

【2057.】SPSS出现unnicode和非unicode到底如何选择与修改

【2056.】SPSS25/26,作图优化啦,bayes也可统计了

【2055.】松哥建模思路实操:以一个真实困惑案例为例!

【2054.】Cox比例风险模型,等比例风险你验证了吗?

【2053.】万能建模策略【新课早鸟】

【2052.】SCI编辑让做控制协变量的生存曲线

【2051.】趋势性检验集锦

【2050.】析因设计方差分析

【2049.】有福利哦,SCI作图又一技能-嵌入图

【2048.】定性资料一致性评价

【2047.】SCI编辑让做偏相关散点图,怎么破?

【2046.】非参数检验两两比较,步骤都对,为啥你操作不出来

【2045.】有序Logistc回归,为什么不能计算OR值,那还玩啥?

【2044.】书中从来没告诉你的,线性回归哑变量如何设置?

【2043.】SPSS如何开启unicode on?

【2042.】这张ROC图有两个问题,你能识别吗?

【2041.】为什么SPSS读取Excel数据乱码或空值,真实案例

【2040.】谁说SPSS不能画统计地图

【2039.】单因素方差分析没有原始数据怎么办?

【2038.】如何比较不同组相关的一致性?

【2037.】如何计算二项logistic回归模型的灵敏度、特异度等指标

【2036.】松哥带您分享一篇文章带来的若干思考【荐荐荐】

【2035.】松哥松哥告诉我,中位数95%可信区间怎么做?

【2034.】一文秒杀各种类型t检验

【2033.】如何让SPSS根据自身数据库行号产生ID特征变量

 [2032.]SPSS如何实现百分数的平方根反正弦变换

【2031.】相关样本非参数检验如何实现两两事后比较

【2030.】多元回归中交互作用的评价

【2029.】SCI编辑让我报告LSD-t检验的t值,可是SPSS没有啊,怎么办?

【2028.】如何利用SPSS计算总体率与总体均数的95%可信区间

【2027.】SPSSS如何实现哈迪-温伯格平衡(Hardy-Weinberg equilibrium)法则检验

【2026.】R×C列联表(分类数据)的统计分析方法选择与SPSS实现

【2025.】SPSS实现LD50/LC50计算

【2024.】生存分析截断值自动识别软件,超级棒哦!

【2023.】层次分析法帮你选股票

【2022.】简单效应的SPSS实现

【2021.】广义估计方程SPSS实战

【2020.】这种主成分得分图SPSS能够实现吗?

【2019.】卡方分割无需手动,SPSS自动可实现啦!

【2018.】重复测量资料SPSS实战篇

【2017.】SPSS输出结果统计表与统计图的专业性编辑及三线表定制格式赠送!

【2016.】卡方检验之SPSS实现简约版(视频)

【2015.】t检验之SPSS实现简约版(视频)

【2013.】SPSS中如何设置哑变量

【2012.】分层回归之SPSS实践

【2011.】SPSS直接物理拆分为两个文件

【2010.】倾向性评分(PSM)的SPSS24.0实战

【2009.】如何SPSS实现随机分组

【2008.】趋势性卡方检验专题讨论

【2007.】2个因素均为重复测量数据方差分析

【2006.】为什么配对样本t检验,SPSS结果默认输出相关性

【2005.】SPSS软件作图如何去除顶部与右边边框

【2004.】如何让SPSS自动按照四分位数间距分组某变量【技巧】

【2003.】SPSS两独立样本t检验的简易算法(无需原始数据)

【2002.】太伤自尊了,自以为学会了,现在用SPSS连两独立样本t检验都做不好

【2001.】SPSS作图坐标轴不过原点的解决办法

【2000.】临床预测模型SPSS验证实战

------------------------------

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
医学统计中的Spearman秩相关性分析原理及spss中的操作
java进制转化,字符编码,变量
SPSS中的三种变量测量类型详解
如何用SPSS做数据分析(1)
用SPSS创建虚拟变量/哑变量
1分钟判断 脾虚程度是哪个级别
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服