打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
定量研究写作中的常见错误

定量研究的写作格式相对固定,彭玉生教授曾称之为“洋八股”,一般包括提出问题、文献回顾、研究假设、研究设计、研究结果和结论与讨论几个部分。今天,我们主要总结在定量研究数据分析和呈现上的常见错误
常见错误1:描述统计误算均值
定量研究中,变量的描述性统计必不可少,旨在项审稿人和读者展示文章所使用的变量的基本情况。计算均值是很好的描述变量的手段,从统计学上而言均值也具有良好的统计性质。但是,并不是所有的变量都能计算均值。在社会科学研究之中,变量可以划分为四类,定类变量、定序变量、定距变量和定比变量,其中前两者也可称之为类别变量,后两者也可称之为连续变量。对于连续变量而言,计算均值是正确的,如平均收入、平均年龄等;而对于类别变量,尤其是其中的分类变量则不能计算均值,例如婚姻变量,未婚编码为1,已婚编码为2,离婚编码为3,而这样计算出的均值则没有意义,因为这里面的1、2、3仅仅是一个代码,没有实际的含义,所以对于定类变量是不能计算均值的,只能用百分比来描述。但是在定类变量中有一个特例:虚拟变量可以计算均值,也即进行0、1编码的变量,如城镇户口编码为1,农村户口编码为0,这样计算的均值就是编码为1的百分比。下表总结了不同变量进行描述统计的方法:
变量类型
描述方法
虚拟变量
均值、百分比均可
定类变量
百分比;不能计算均值
定序变量
均值、百分比均可
连续变量
只能均值;不能百分比
常见错误2:对于*的理解存在偏差
*是所有研究者最香看到的,因为有*则证明具有统计显著性,统计显著性的意义是我们观察到的差异不仅仅是存在样本之中,也是存在总体之中的,而对于研究而言,只有在总体中有意义才是有意义的。但是,*不是越多越好,也不是少了就不好,一颗*代表在95%的水平上显著,也即有95%的把握认为变量之间的关系是真实存在的,两颗*一般认为在99%水平显著,三颗*一般认为是在99.9%水平上显著。在社会科学,乃至整个统计学研究中,一般在95%水平上显著就是可以的了。因而*的数量没有太大的意义,不是说*越多越好
常见错误3:回归模型中系数解读错误
回归模型中系数解雇错误常见于Logit和Probit等非线性回归模型之中,对于一般线性回归分析系数解读相对容易。而在Logit和Probit等非线性回归模型之中则不能随意解读,首先两个模型中的系数需要进行转换才可以解读,其中Logit模型需要将系数转换为发生比,Probit模型则无法转换发生比,只能计算边际效应。
详见:基础方法 | Logit回归和Probit回归有区别吗?
常见错误4:回归模型中系数比较错误
有的研究希望比较不同自变量对于因变量的影响程度大小,但是不能直接比较回归系数,因为每个变量的测量尺度(单位)不一致,所以不可比。例如受教育年限的单位是年,区间一般是[0,20],而性别变量一般只有两个单位:男、女,因此计算出来系数肯定有很大的差异,这样直接比较是错误的。需要进行标准化系数转换才可以比较,标准化回归系数是没有量纲的,因而可以直接比较。
详见:基础方法 | R方和调整后R方、回归系数与标准化回归系数
常见错误5:R方解释错误
R方代表着模型的解释程度,即因变量的变异有多少可以被模型解释掉。在社会科学中R方一般比较低,因为因变量的影响因素往往比较多,我们很难以穷尽,这有时也被当做批评定量研究的一个方面。R方最常见的解释错误也是存在与Logit等非线性回归模型始终,因为在此类模型中没有R方,只有伪R方,而其含义又有所不同。此外,是不能区分R方和调整后R方。
详见:基础方法 | R方和调整后R方、回归系数与标准化回归系数
常见错误6:统计量汇报不全
在回归模型中也常见统计量汇报不全的情况,这种常见于使用SPSS进行数据分析的情况,因为Stata和R语言等软件直接输出的回归表是较为全面的。一般情况下,在回归分析中系数、标准误和显著性水平是必不可少的,很多研究常见不汇报标准误,虽然系数、标准误和显著性水平三者之间是存在关系的,知道两个就可以计算出第三个,因为系数/标准误=t值,t值通过查表可以找到显著性水平。但是,规范的研究还是建议完整的汇报三者的情况。
常见错误7:滥用对数转换
在研究收入相关的变量时,我们经常能看到将收入取对数。原因是因为收入是一个典型的偏态分布,需要进行对数校正,不然会影响模型的估计。一般情况下,如果收入不取对数往往容易显著,因为其中有极值的影响。但是并不是所有变量都有必要转换成对数,转换为对数带来的麻烦就是不能直接解释,解释时需要再进行转换。只有存在偏态分布的情况下才有必要转换。
常见错误8:随意增加平方项
在研究年龄问题时,有的研究往往增加年龄的平方,以及在经典的明瑟方程中也会有工作年限的平方,增加平方项的变量往往和“年”有关,但是增加平方项必须是有明确的理论依据的。平方项其实就是我们中学所学习的二次函数,即变量之间存在抛物线的关系,比如年龄对收入的影响,会随着年龄增大变多,但是过了中年之后又会随着年龄增大而下降,因此需要增加平方。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
一项对变量进行各种转换的指南, 从低阶到高阶再到更高阶全覆盖!
互助问答第623期:数据标准化处理问题
累积logit模型
Logistic回归曲线的学习 1(转)
logistic模型(logit和logistic模型的区别?)
logistic回归、probit回归与poission回归
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服