打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
统计的艺术:数据洪流与陷阱

原文作者:Evelyn Lamb

作者高度评价了书中对于统计及其广泛应用的深入解读。

《统计的艺术:从数据中学习》(The Art of Statistics: Learning from Data)David Spiegelhalter Pelican (2019)

所有的模型都是错的,但有些模型却是有用的”,这句老生常谈的话其实不无道理。统计学家George Box 的这句至理名言直指许多领域科学家所面对的一个核心挑战——这个世界如此复杂,远不是一个数学模型、科学模型或统计模型所能概括的。纵然关于这个世界的模型并不完美,但从药物有效性到失业状况调查,如果要得出一个结论,这些模型必不可少。在这本《统计的艺术》中,作者David Spiegelhalter告诉我们应该如何利用不断涌入的数据洪流,提升我们对这个世界的理解,同时帮助我们认识在做此尝试时可能遇到的一些陷阱。

如果没有掌握系统性的统计方法,数据跟踪可能让人望而生畏。


《统计的艺术》一书顺应了当下强调概念理解而非计算流畅性的统计学教育理论。如今的统计软件只消一眨眼的功夫,就能轻松完成各种测试,搞定大型数据集的任何测量运算。正是因为如此,与其学习如何计算样本的标准偏差,更重要的是学会如何用严密的逻辑去设计研究、解读研究结果

Spiegelhalter在书中一再强调了“PPDAC”结构的重要性,即“问题-计划-数据-分析-结论”。他讲述了统计学家会如何处理一项研究的各个部分,并相应选择哪些工具。PPDAC先从定义问题开始,再制定计划,包括决定测量什么、如何测量以及哪种分析方式最合适。之后,研究人员会收集数据,根据计划开展分析,并最终判断哪种结论比较合理。

Spiegelhalter是业内饶有建树的统计学家,书中一些最有意思的地方是他讲述的幕后故事,比如他和同事在研究过程中所做的决定。有一次,他要带领一个团队统计英国医院接受心脏手术儿童的死亡率。即便是那些看起来没有歧义的数字,比如接受心脏手术的儿童的数量以及术后死亡人数,其数据来源和定义也存在着差异。

如何处理潜在歧义和极端案例可能会对最终结果产生巨大影响。举例来说,术后多长时间内的死亡应归因于手术?既然要做到完全清楚和客观是不可能的,那么就要让这些研究的读者意识到会让问题复杂化的潜在因素,哪怕只是为了让他们不要盲目相信某项研究结果。对于那些必须判断非正常死亡人数是否指向违法或失职行为的政治官员或陪审员来说,这一点尤其重要。

这些例子告诉我们,要对已知事物保持审慎的信任态度——这也是本书的核心思想。Spiegelhalter在书中写道,统计科学的目的是帮助我们由对照研究进行外推,从而了解这个真实的世界,“最后能够以谦逊的口吻说,我们可以从数据中得到什么,不能得到什么”。当统计学被用来辩论癌症筛查的成本与收益这类具有争议的问题时,人们缺少的正是这种谦逊的态度。

划重点

本书非常出色的一点在于,它用有限的篇幅探讨了大量基础问题。有些概念或许值得进一步深入,尤其是自举法(bootstrapping),亦即在随机重抽样的基础上预计统计数值的分布情况;还有中心极限定理:随着抽取的数据样本量不断增大,其均值趋向于正态分布。当然,作者在决定对哪些问题做进一步展开时,却是经过了一番取舍。试想一本涵盖了各种回归、零假设检验、贝叶斯推断等概念的书是多么艰涩难懂。不过,对于那些想要进一步深挖的读者来说,书中提供了非常详实的注释和参考目录。

作者并没有回避统计学的一些细节问题,比如各种不确定性的性质。正如他在第九章开头所告诫的那样,当数学概率论的车轮驶上统计推断的大道时,即使是那些科学素养较高的读者也会感到非常挑战。有些段落可能需要读者自备笔纸,来来回回读几遍才能完全消化,但是书中的一些宏观解释以及每一章最后的总结还是比较易懂的,此外还有非常有用的词汇表。

本书的结尾指出,许多存疑的统计方式在一定程度上造成了今天大部分学科正面临的重复性危机。作者认为科学家和记者可以一起努力,一方开展更好的研究,另一方进行负责任的报道,共同提高公众的认识水平。经过一系列艰深的统计学科普之后,读者可以立即将这些非常实用的建议转化为行动。

《统计的艺术》是一本优秀的学生读物。对于渴望以认真负责的态度使用统计学的记者来说,以及那些希望带着积极的批判性眼光去看问题的人来说,阅读此书将获益匪浅。

原文以The joy of stats为标题

发布在2019年3月25日《自然》书籍与艺术上


Nature|doi:10.1038/d41586-019-00898-0

版权声明:

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
生死同日的可能性大?
统计:从数据中学到的和学不到的
如何学习统计学,或我的学习之路——初学者写给初学者
专家称人工智能已可预测人类死亡时间,准确率高达95%
统计学的发展——统计学的思想和方法之回归模型
统计学方法在社会学中的应用
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服