打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
如何看懂SPSS聚类分析的树状图/谱系图?

SPSS系统聚类分析提供两种图形可视化的输出,第一种是软件默认的“冰柱图”,形状类似于冬天屋檐上垂下的冰柱,因此得名。第二种是“树状图”,在新版本软件中也称谱系图,像一个横着生长的树。

冰柱图虽然是软件默认输出,但实际上操作者们却更愿意看树状图/谱系图。树状图直观的展示了聚类的整个过程,问题是,有读者说看不明白树状图。

现在小兵分享自己如何看SPSS聚类分析树状图的方法。

首先,方向

这棵树是从左向右横着生长的,最左侧罗列出所有聚类类别,像树的根系,可以说,你有多少聚类变量或个案,就有多少个根系类,根系类生长聚合,逐渐向右侧生长出若干枝干类,继续生长,最后合并为两类。也就是说,每一条横线,从根系开始就是一类,横线不断合并,类别也相应高度集中。

第二,距离

图形的顶部有一行数字,它是这颗树的横轴,数字是各类别的相对距离,是按距离比例重新设定的结果。这个类的相对距离,能大概告诉我们类别之间距离的变化。

好的聚类结果,类之间的距离应该尽可能大一些,比如上图所示的树状图,聚成2类时,两个类的距离在25这个水平上,而聚成3类时,类之间的距离快速逼近10这个距离水平,聚类数越多,类的距离越是靠近,类的特征也就越来越模糊不清。

第三,画竖线

读懂这颗树,你需要一把尺子,与从左向右的横线垂直90度放下。此时,横线(一条线就是一个类别)被尺子截断,这些端点的个数就是该相对距离下的类别数目。

以上图为例,如果我们是分成两类,请看右侧红竖线,“上海”独自成为一个类别(个别场景下也可以解读位异常),其他城市是第二个类别;如果我们想分成三类,那么这三类的情况是,“上海”独为一类,“天津、北京、广东、浙江”四个城市是第二类,第三类则包括剩余的其他城市。

再进一步,两条红线之间的距离,告诉我们聚为两类和三类,其类中间距离发生了多大的变化,我们可以尝试用这种相对距离变化的幅度来初步判断聚类的效果。

第四,画方框

在树状图上画竖线后,如果你觉得类的成员看得还不够直观,那么还有一个办法,在最最侧的根类纵轴上,画上红色方框,用方框框住隶属于同一类的成员,这样做,可以让定位、查看类成员这件事变得更容易一些。


有读者可能又要问了,到底聚为几个类别比较合适?

不管是冰柱图还是树状图,它更多的是为我们展示聚类的整个过程,展示类的成员隶属关系,让我们从可视化的层面了解到哪些个案被归聚为一类。

树状图/谱系图,只是一个辅助观察的工具而已。

而最终聚为几个类别,这需要你依据对不同类的特征的区隔程度来讨论决定。这就是类特征的归纳提炼过程,在总结类特征,比较类成员变化中形成最终聚类结果。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
聚类分析
我国中职课堂研究热点知识图谱
如何用SPSS进行聚类分析?
JASP系统聚类:树状图暂无标签注释
图解 | 怎么解读一个树状图
市场细分的方法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服