目标学习
1.掌握 SPSS 频数分析的基本方法并熟练掌握其具体操作。
2.明确基本描述统计量的含义,并熟练掌握其计算的具体操作。
3.掌握交叉列联分析的基本方法,了解卡方检验的基本思想,能够熟练掌握其具体操作。
4.掌握对多选项问题的不同拆分方法和应用场合,并能够利用多选项分析进行数据分析。
01
频数分析
⚪️ 基本统计分析往往从频数分析开始。通过频数分析能够了解变量的取值状况,对把握数据的分布特征是非常有用的。
例如,在问卷数据分析中,通常应首先对本次调查被调查者的状况,如被访者的年龄特点、职业特点、性别特征等进行分析和总结。通过这些分析,能够在一定程度上把握样本是否具有总体代表性,抽样是否存在系统偏差等,并以此证明以后相关问题分析的代表性和可信性。这些分析可以通过频数分析来实现。
02
基本描述统计量
⚪️ 常见的基本描述统计量大致可以分为三大类:第一,刻画集中趋势的描述统
计量;第二,刻画离散程度的描述统计量;第三,刻画分布形态的描述统计量。
通常,综合这三类统计量就能够极为准确和清晰地把握数据的分布特点。
刻画集中趋势的描述统计量:集中趋势是指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势的描述统计量正是要寻找能够反映数据一般水平的“代表值”或“中心值”均值(Mean) 是一种最常用的“代表值”或“中心值”,又称“算术平均数”,在统计学中有重要的地位。
刻画离散程度的描述统计量:离散程度是指一组数据远离其中心值的程度。单纯以均值等中心值刻画数据并非尽善尽美,还应该考察数据分布的疏密程度,即考察所有数据相对于中心值分布的疏密程度。如果数据紧密地集中在中心值的周围,即数据的离散程度较小,则说明这个中心值是刻画全部数据的代表,中心值对数据的代表性好;相反,如果数据仅是比较松散地分布在中心值的周围,即数据的离散程度较大,则表明中心值不具有代表性。因此,中心值和笑于中心值的疏密程度共同作用才能给出对数据比较全面完整的描述。常见的刻画离散程度的描述统计量有样本标准差、样本方差等。
刻画分布形态的描述统计量:集中趋势和离散程度是数据分布的两个重要特征。为更全面地理解数据分布的特点,还应把握数据的分布形态。数据的分布形态主要指数据分布是否对称,偏斜程度如何,陡缓程度如何等。刻画分布形态的描述统计量主要有偏度系数和峰度系数。
[变量列表(B)]:表示按变量在数据编辑器窗口中从左到右的次序输出,还可以按变量名字母顺序输出、按均值升序输出、按均值降序输出。
03
交叉分组下的频数分析
⚪️ 通过频数分析能够掌握单个变量的数据分布情况。实际分析中,不仅要了解单变量的分布特征,还要分析多个变量不同取值下的分布,掌握多变量的联合分布特征,进而分析变量之间的相互影响和关系。当涉及了两个变量。对此,通常利用交叉分组下的频数分析来完成。
04
多选项分析
⚪️ SPSS中的多选项分析是针对问卷调查中的多选项问题的。它是根据实际调查需要,要求被调查者从问卷给出的若干个可选答案中选择两个及两个以上的答案。
多选项问题的分解通常有两种方法:第一多选项二分法;第二,多选项分类法。
我们打开保险市场调查数据为案例进行实践多选项分析:
把上述的三个变量重新变为一个集合,【分析】→【多重响应】→【定义变量集】
将多个变量整合后,点击关闭;第二步,将多重响应进行频率的分析,这时的【分析】下的【多重响应】中【频率】就可以使用了,当然相关的【交叉表】也可以选择了
然后就得到了相关的数据表格
05
比率分析
⚪️ 比率分析用于对两变量间变量值比率变化的描述分析,适用于数值型变量。例如,根据各地区保险业务情况的数据,分析财产保险业务的保费收人占全部业务保费收人的比例情况。对此,通常的分析可以生成各个地区财产保险业务的保费收人占全部业务保费收入的比率变量,然后对该比率变量计算基本描述统计量(如均值中位数、标准差、全距等),进而刻画比率变量的集中趋势和离散程度。
打开各地区保险业务保费收入数据
选择【分析】→【描述统计】→【比率】
最后得到一张比率数据表,从表中可以进一步分析数据,这里不过多分析,因为熟悉下怎么操作就可以,有时间我专门做一个专题进行详细分析
联系客服