小扎退学变富豪，为啥我退学就只能被胖揍？

二战期间，为了降低伤亡率，盟军试图对战斗机进行加固。在研究了大量返航的战斗机之后，研究人员发现飞机的弹痕是这样分布的。

如果你是决策者，你会选择将哪里加固呢？图片来源：wikipedia.org

海军分析中心的工作人员认为，飞机的弹孔大多集中在机翼和尾部，于是他们建议将这些受损最严重的地方加固。

统计学家亚伯拉罕·沃尔德（Abraham Wald)却得出一个跟直觉相反的结论。通过计算，他发现参与调查的都是在战斗中幸存下来的飞机，它们并未遭受致命的袭击。相反，机舱和发动机等看似毫发无伤的地方反而比较危险，因为这些区域一旦被击中，就会导致飞机失事坠毁。

机舱和发动机没有弹痕，是因为这里中弹的飞机都坠毁了。图片来源：wikipedia.com

事实证明他的建议才是正确的，战斗机的伤亡率最终得到了控制。死掉的数据不会开口讲话，这被人们称作“幸存者偏差”。

幸存者偏差

“幸存者偏差”是统计学的一种逻辑谬误，它是指我们忽略了数据筛选过程的逻辑陷阱，从而得出了一个错误的结论。

“好多科技大佬都退过学，所以我也要退学”就是典型的幸存者偏差。事实上，更多同样退学但事业失败的人根本没有被公众知晓的机会。图片来源：dazeinfo.com

假设一名高中学校的一个班级在4年中（编注：美国高中有4年）考试成绩稳步上升。无论用什么评价标准，这批学生每一年都比前一年做得更好：平均数、中位数、学生在年级水平的百分比等等。我们能不能以此肯定校长的工作，甚至提名这所学校的领导为“年度最佳校长”呢？

恰恰相反，这些数据值得质疑。如果你有一屋子高矮不齐的人，强迫最矮的那个离开房间也会使整个房间的平均身高上升，但这样做并不会使任何人的身高变高。这就是幸存者偏差的猫腻，在这种情况下，样本中去掉了一些观测数据，那么对于剩余数据的分析也势必会产生变化。

假设我们的校长真不是个好人：他学校里的学生啥也没学到，每年都有半数人辍学，没有任何一名学生实际上考得更好，但这所学校的考试分数反而看上去很漂亮。因为学得最差的学生（也是考试分数最低的学生）最有可能辍学，那么考试分数的平均分会随着更多学生辍学而稳步上升。

”幸存者偏差”背后更值得深究的问题是：我们如何选择评估样本？在进行统计调查特别是抽样调查时，我们必须确认，接受评估的群体中，每一个成员都有均等的机会入选样本，否则最终得出的结论就会有偏颇。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。