打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
社工统计学杂记 4:泊松回归与负二元回归


《社工统计学杂记》4

墨西哥海湾雄蟹所追逐的雌蟹之美:

泊松回归与负二元回归

美丽的墨西哥海湾,东起美国佛罗里达半岛和古巴岛,西至墨西哥,气候温润潮湿。每年春夏,是马蹄蟹繁殖季节,成群栖息于墨西哥湾的雌蟹和雄蟹匍匐于松软的海滩上,产卵受精,繁育后代。马蹄蟹,又称鲎(读“后”),像虾又像蟹,有两个甲壳,是一类与三叶虫 (现在只有化石)一样古老的动物。雌雄一旦结为夫妻,便形影不离,肥大的雌蟹常驮着瘦小的丈夫蹒跚而行。此时捉到一只蟹,提起来便是一对,故马蹄蟹享有“海底鸳鸯”之美称。

蟹通常驮着雄蟹在沙滩上掘洞产卵,在这对夫妻边上还聚集着一些雄蟹,称为“卫星蟹”。有些雌蟹美貌惊艳,堪称蟹界的“绝代美人”,常招来很多卫星蟹聚于周边,而有些雌蟹则“貌寝”(明朝魏禧《大铁椎传》语,意为丑陋),形单影只,除了这对夫妻外再无其它雄蟹光顾。

公元20世纪某年,有好事者搜集了173只雌蟹的数据,发现其中有四只最为惊艳,周边分别聚集了11121415只雄蟹;大部分的雌蟹没有或仅有寥寥无几的雄蟹(62只没有任何雄蟹;16只仅有一只雄蟹)。这些卫星蟹个数的分步,如下面的直方图所示:

那么,为什么有的雌蟹如此受宠,而有的则如此孤寂呢?

雄蟹眼中的雌蟹之美是什么?

为了回答这个问题,那位好事者又采集了每一雌蟹的四个数据:

1)颜色(1=浅棕色,2=中棕色,3=暗棕色,4=暗色);

2)甲壳的磨损状况(1=双甲壳无任何磨损,2=有一个甲壳磨损或破裂,3=双甲壳均磨损或破裂);

3)甲壳的宽度(用厘米计量,平均数为26.299厘米,最窄的雌蟹为21厘米,最宽的雌蟹为33.5厘米);

4)体重(用克计量,平均数为2437克,最小的为1200克,最大的为5200克)

要探究雄蟹眼中的雌蟹之美,我们可以仿照当年Galton研究子女身高与父母身高之关系的方法,做一个多元回归分析:把卫星蟹的个数当作因变量,把以上四个变量当作自变量。

但是,在这里,我们遇到了回归模型的假设遭到违背的问题。任何多元回归,都假设因变量服从正态分布,即卫星蟹的分布应似钟形曲线(两边对称)而不出现偏态,这显然于上面所看到的直方图不符。为了应对这一回归假设的违背,我们的方法从简单变到了复杂,这个方法就是研究“偏态因变量”的泊松回归(Poisson regression)或负二元回归(negative binomial regression)。这两个回归模型都属重要的广义线性模型,它们的区别在于:泊松回归要求因变量的均值等于它的方差,而负二元回归则允许因变量的方差大于均值

具体到马蹄蟹的美学研究,我们用负二元回归更为精确,因为在这个数据中,卫星蟹的方差为9.91均值为2.92

用负二元回归做分析后,我们发现前两个自变量对卫星蟹个数都没有解释意义(即不存在统计意义上的显著性),而真正让雄蟹趋之若鹜的是雌蟹的宽度和重量:在其它因素控制以后,雌蟹的宽度每增长一厘米将导致围绕周边的雄蟹个数增长18% (p<>统计意义上非常显著);同理,在其它因素控制以后,雌蟹的重量每增长10克将导致围绕周边的雄蟹个数增长1% (p<>统计意义上非常显著)。

追求美,特别是追求异性之美,是人类和大自然的普遍规律。Chasing Beauty Is Universal! 但是,对美的定义,却因人而异,也因大自然万物的种类而异。以上的例子说明,雄蟹并不在乎雌蟹的色泽和甲壳的光泽,它们眼中的美是体态姣圆、丰润、和肥硕。这个例子还说明,泊松回归或负二元回归并不复杂,它只是多元回归的衍生。当研究的因变量出现偏态,我们就需要用到这类特殊的回归模型。这类模型在所有统计软件包中都能找到。关于本例的原始数据和部分分析,见Alan Agresti (2013) Categorical Data Analysis, Wiley 公司出版。

相关链接:

社工统计学杂记 之 开篇语:公式其外,智慧其中

社工统计学杂记 1: 开辟鸿蒙实证研究数据为先;经世济国统计佐证万策

社工统计学杂记2:大师风采

社工统计学杂记3:单变量、双变量、多变量分析


^^ 欢迎扫描并关注“中美社工合作社” ^^

我们致力于做最业界良心

最有趣

最无节操的社工公号

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
SPSS:从入门到精通 | 回归分析(因果关系)【中】
一文掌握:临床回顾性研究常见统计学方法—Logistic回归分析
医学统计案例研究:二元logistic回归研究混杂因素对自变量与因变量关系的影响(抑郁影响因素研究)...
SPSS有话说:二元logistic回归
Logistic回归分析之二元Logistic回归
回归预测分析
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服