打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
一例错误概率应用造成的冤案 |拿相关当因果!
错误的概率应用造成了现代英国法律史上最大的冤案


因果关系的概念以及寻找因果关系的方法从何而来?

1999 年,一个名叫 Sally Clark 的英国律师被法庭判定谋杀了她的两个孩子。1996 年 12 月,她的第一个儿子在 11 周大的时候突然死亡。当时,人们认为孩子是自然死亡。但是就在第一个孩子夭折一年多以后,Clark 的第二个儿子又在 8 周大的时候死亡了。在这两个案件中,两个孩子似乎都没有什么生理上的疾病。于是,他们的突然死亡引起了人们的怀疑。

这两个案件有很多共同之处:孩子们死的时候年龄差不多,他们的死都是由 Clark 发现的,当时家里只有 Clark 和孩子在一起,而且验尸报告表明两个孩子身上都有伤。一开始,人们认为第一个孩子的伤是抢救时造成的。但是,第二个孩子死后,人们对孩子的伤重新做了检查,而这一次他们认为这些伤很可疑。第二个孩子死亡四周后,警方逮捕了孩子的父母,随后 Clark 被指控为谋杀罪并获刑。

同一个家庭的两个婴儿都死于婴儿猝死综合征(SIDS)的概率有多大?据英国检察官称,发生这种情况的可能性微乎其微,所以这两起死亡一定是谋杀所致。这一论据(一个原因的可能性几乎为零,所以一定还有另外一个原因)造成了这桩著名的冤案。这也是因为统计不当和忽视因果关系而造成严重后果的一个重要案例。

图自: www.sallyclark.org.uk

统计学家和因果关系研究者都知道这个案例,其主要原因在于,检方的论据本质上基于这样的逻辑:被告的辩词几乎不可能为真,所以一定是假的。检方为此请来了一位专家证人——Roy Meadow 博士。Meadow 称,同一个家庭发生两起 SIDS 事件的概率为七千三百万分之一。检方由此认为,因为这个概率非常低,所以这两起死亡事件不可能出于自然原因,一定是谋杀所致。

然而,这一统计数据完全是错误的。即使这个数据是正确的,也不应该这样用。有一份研究报告估算出发生 SIDS 的概率为 1/8543。Meadow 根据这个研究报告提出:同一个家庭发生两起 SIDS 事件的概率为 1/(8543×8543),即约七千三百万分之一[1]。这种计算方法错误的原因在于,它假定这些事件是相互独立的。抛硬币的时候,无论硬币落地时是正面朝上还是反面朝上,都不会对下一次结果产生任何影响。因为每一次硬币正面朝上的概率都是 1/2,所以将第一次正面朝上的概率与第二次正面朝上的概率相乘所得出的结果就是连续两次正面朝上的概率,这从数学角度来讲是没有问题的。Meadow 当时也是这样计算的。

[1] 想要了解 Meadow 所用的数据,参见 Fleming 等(2000)。想要了解 Meadow 对使用这一数据的评论,参见 Meadow(2002)。

引发 SIDS 的原因还不确定,但一个很重要的影响因素是孩子所处的环境(比如家里是否有人吸烟和饮酒)。这意味着,如果一个家庭发生过一起 SIDS,那么这个家庭发生第二起 SIDS 的概率就会远大于 1/8543,因为这些孩子的生活环境和遗传基因都是相同的。也就是说,第一起死亡事件会向我们透露第二起死亡事件发生的概率。这个案例和一名演员获得两次奥斯卡金像奖的情况非常相似。金像奖并不是随机颁发的,演员第一次得奖时具备的品质(才华、知名度、人脉)会提高他再次得奖的可能性。

这就是 Clark 一案的症结所在。在这个案子中,两起事件并不是相互独立的,可能还是共同的原因引发的。因此,不能通过简单的乘法来计算这两起事件发生的概率。相反,在计算第二起事件发生的概率时,应该考虑到第一起事件的发生。所以我们需要知道的是,在一个已经发生过一起 SIDS 事件的家庭中,发生第二起SIDS事件的概率。本案中的概率在计算和使用方面都存在十分严重的问题,为此,被告在第一次上诉时请来了一位统计学家作为专家证人,皇家统计学会还专门写了一封信表达了他们对这个案件的关心。[2]

[2] Meadow 因为在证词中使用了这一数据,后来被判渎职罪,并被吊销了医生执业资格,导致他不能再行医(后来他通过上诉得以恢复执业资格)。

不过此案的问题并不仅仅是误算概率那么简单。在整个案件中,检方试图将事件(即这两起SIDS死亡事件)发生的这七千三百万分之一的概率等同于 Clark 无罪的概率。这种错误的推理将事件发生的概率当成了被告有罪或者无罪的概率,这就是我们所说的检察官谬误。[3]

[3] 参见 Thompson 和 Schumann(1987)。还有一个著名的案例是 Lucia de Berk 案。Lucia de Berk 是荷兰的一名护士。像 Clark 一样,她一开始也被误判为有罪,后来又被宣布为无罪。De Berk 护理过很多意外死亡的病人,一名专家证人计算了这一情况发生的概率,得出的结果是这一情况完全是巧合的概率只有三亿四千二百万分之一。了解更多关于 Lucia de Berk 案的信息,请参见 Buchanan(2007)。正如 Clark 案一样,这个数据被等价为 De Berk 无罪的概率。检方认为这一概率发生的可能性如此之小,所以它一定不可能发生。

我们知道,一个几乎不可能发生的事件真的发生了。一个家庭中发生两起 SIDS 死亡事件的可能性很小,但是一个家庭中两个婴儿都夭折的可能性也很小。人们不单单会考虑 SIDS 这一解释是否合理,更重要的是,他们会将其与关于这个事件的其他解释进行比较。因此在这个案件中,最好将同一个家庭中两个孩子都被谋杀(检方的假设)的可能性与同一家庭中两个孩子都患了 SIDS 的可能性进行比较。

一个家庭中两个孩子都死于 SIDS 的概率与这两个孩子都感染的概率是不同的。关于这个案件我们还有其他的证据,比如物证和犯罪动机等。必须将这些证据与概率结合起来看(比如说,一个人如果没有犯罪动机、没有作案机会或者没有行凶武器,那么他杀人的概率肯定要低于总谋杀率)。[4]

[4] 值得注意的是,SIDS 只是导致婴儿猝死的原因之一。事实上,在 Clark 一案中,有重要证据表明其中有一个婴儿患有炎症,并且这一炎症可能会对婴儿造成生命危险。然而,参与该案的病理学家(该病理学家后来被判严重渎职罪,并被禁止行医三年)在庭审中并未公布这一证据。

最后,无论一件事情发生的概率有多低,只要尝试的次数足够多,最后一定会发生。Clark 一案中,那个误算出来的极低的概率(七千三百万分之一)比中百万大博彩的概率(二亿五千八百万分之一)还要高三倍多。一个人中大奖的概率是极低的,但是如果我们说某个地方的某个人会中大奖,这个概率又如何呢?那就高得多了。这就说明,仅通过概率来判断一个人的清白一定会导致一些冤案。这是因为虽然对某个特定的家庭来说,发生这种事件的可能性很小,但是世界上有两个孩子的家庭有上百万个,这种事件总会在某个地方的某个家庭发生。

2003 年 1 月,Clark 第二次上诉时终于翻案。然而,那时她已经在监狱服刑三年了。

为什么 Clark 案会成为因果推理失败的重要案例呢?尽管此案在计算概率的过程中存在很多问题,但最根本的原因是,此案试图用一个事件发生的概率来支撑某个特定的因果结论。“这只是巧合而已”“这个概率有多大”,当你在说服别人相信某个因果关系时,是否也说过这样的话呢?生活中经常有这样的推理:公司来了一名新员工,而同一天你的订书机不见了;一名巫师知道你最喜欢的女性亲属的名字以“M”开头;两名重要人证记得那名嫌犯穿的是一件红色法兰绒衬衫。但是,如果因某件事情不大可能发生,而说其唯一合理的解释就是因果关系,那一定是错误的。前面已经说过,一个不大可能发生的事件在某个人身上发生的概率也许极低,但是在某个地方发生的概率却不低。除了会造成冤案以外,错误的因果推理还可能会带来其他严重的后果,比如将大量的时间和精力浪费在绝不可能起作用的药品上,或者制定一些无用的、代价高昂的公共政策。

本文节选自《别拿相关当因果!因果关系简易入门》,一本写给普通人看的因果逻辑入门书!

作者:Samantha Kleinberg
译者:郑亚亚
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
用概率判生死:法庭上的数学证据
逆因果(Backward causation)
因果
方法与因果
原因可以增加其结果发生的概率?
「自然之殇」缺失实在性的因果之惑
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服