打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
概率论系列考点 — 统计功效 | 最小样本量

上篇文章 针对【数据分析岗】概率论类 高频考点,做了框架梳理 

【数据分析岗】概率论类高频考点框架(内含 概率论考点框架+case)

这篇,重点讲解【概率论】系列之 假设检验 常见高频考点 ↓

涉及考点:假设检验、统计功效、最小样本量 

内含 推导 及 考点解析

统计功效及最小样本量是假设检验的 进阶知识点 

也是AB实验中非常常用的两个基本概念

因此,是各大厂面试官考察应聘者对假设检验的 真实 掌握情况

考点举例:

▶ 第一类错误的定义?

▶统计功效的定义,以及应用场景?

▶统计功效较低的影响是什么?▶最小样本量计算公式是什么?▶计算最小样本量的业务指导意义?

以下文章涉及相关推导,有些同学可能看着吃力些 不要担心只要了解 假设检验 | 统计功效 | 最小样本量的 定义 、公式结果 及 应用场景即可应对大部分的笔面试题!

------正文手动分割线------

假设检验

假设检验作为AB实验最基础的知识点。

我们必须熟记第一类错误和第二类错误的定义,以及检验统计量相关的前提条件。

(关于检验统计量后面我们将开展详细的文章讲解,在此不进行阐述)

原假设 | 备择假设

原假设,用H0表示,通常将不应轻易加以否定的假设作为原假设。

备择假设,用H1表示,当H0被拒绝时而接收的假设。

第一/二类错误

H0为真但由于随机性使样本观测值落在了拒绝域中,从而拒绝原假设H0,这种错误称为第一类错误,也称为α错误。

H0不为真,但由于随机性使样本观测值落入接受域中,从而接受假设H0,这种错误称为第二类错误,也称为β错误。

下面用一张图来理解一下这两类错误:

互联网每日可获取大量的用户行为数据,根据统计量的检验方法,当样本量较大的时候,我们采用U(正态分布)检验法。

后面我们也将基于U检验法进行相关的讲解和推导。

统计功效

统计功效(statistical power)是指,当H0为假拒绝H0的概率。也就是1-β的概率。

下面我们以双边检验为例,单边检验只要进行相应的替换即可。

原假设和备择假设如下:

假根据第二类错误的定义当H0为假时,接受H0的概率,下面来详细推导统计功效的计算逻辑。

对于单边检验,功效power的推导结果为:

▼ 划重点:

统计功效的定义及公式展示结果。

统计功效低,那么当AB两组差异真的存在时,我们很可能会错误判断两组差异不存在。

我们一般把统计功效定义在80%(或90%)以上,即β在0.2(或0.1)以下。认为这样的可信度是可以接受的。

最小样本量

最小样本量是在准备开展AB实验时,对目标提升效果预计需要的样本量估算,方便提前估算出AB实验的运行周期。

以单边检验为列,进行最小样本量计算,假设两组样本数量相等,均为n ,则最小样本量为:

双边检验的推导类似,最小样本量为:

▼ 划重点:最小样本量同时考虑了第一类、第二类错误。

以上,就是关于假设检验 | 统计功效 | 最小样本量的考点梳理。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
一文搞懂“第二类错误、检验功效、样本量计算”的内在逻辑
一切皆相对--假设检验的功效
做统计,多少数据才算够?(下)| 说人话的统计学·协和八
玩转假设检验,拯救那些被p值拉低的智商!——探秘样本量和p值的关系以及两类风险
你真的了解参数估计和假设检验吗?
如何理解统计学中的 Power | 宋春林
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服