六西格玛核心工具之一学习：假设检验

假设检验作为六西格玛的核心工具之一，在进行项目改进过程中，常常会用到，可以说它是六西格玛团队项目中应用最多的统计工具。诸如要判断下列结论是否正确：“新员工比老员工得到更多的投诉”，“改进工作后平均产量有提高”，“加工温度为180度时比160度时垫圈断裂强度要高”等等。由于我们观测到数据总会带有误差，不能从简单的样本统计量的结果下定论，必须使用严格的统计假设检验方法才能得出准确的判断结论。下面小编就来介绍有关假设检验的基本概念和简单的检验方法，希望与大家一起共勉，如有遗漏和错误之处，敬请指出。

1.假设检验概述

理解重点
●假设检验是统计学的一个重要分支，它可以明确地确定某一特定目标值是否包含在一个计算出的区间（置信区间）内。
●该值落入或超出置信区间决定了你得出两者相等与否的结论。
●假设检验通常应用于判断两个均值是否相等的场合。

○因为变异的存在，即使来自相同的总体，两组数据也不会完全一致。
○假设检验将告诉你，观察到的差异是因为相应的总体确实不同，还是仅由随机波动造成的。

2.假设检验术语和概念
●原假设（null hypothesis）（H0）或零假设，是被测试的要确定真伪的表述。通常原假设用等式表示。例如：
H0：μ1=μ2或H0：μ1-μ2=0

○上述原假设的含义为两组数据所对应的总体均值相等。（如果命题为真，将两者相减，其差值为0。）
○我们假设原假设为真，除非有足够的证据证明其为假。

●备择假设（alternativehypothesis）（H1），是如果有足够证据可以拒绝原假设H0时所对应的事实状态的表述。例如：
H1：μ1≠μ2或Ha：μ1-μ2≠0

○上述备择假设的含义是两组数据所对应的总体均值不相等。
○如果我们拒绝原假设，实际上就等于接受了备择假设。

●注意：从统计学家的观点来看，我们永远无法接受或证明一个原假设是正确的——我们只能在一定的概率上无法拒绝原假设。相似地，我们永远无法接受或证明一个备择假设是正确的——我们只是拒绝原假设。对于初学者而言，这样的语言很容易让人迷惑。因此，本书使用拒绝/接受某假设这样的表述。

3.假设检验的用途
●让我们从统计学上判断某个值是否引起警报。
●告诉我们两组数据是否在一定的置信水平上真的不同。
●告诉我们一个统计参数（均值、标准差等）是否与某一个特定值相等。
●我们可以用来评估结论的“强度”（结论正确或错误的概率）。

4.假设检验的前提条件
●样本内部以及样本之间相互独立。
●随机抽样。
●数据服从正态分布。
●方差未知。

接下来我们再来详细了解假设检验的实践应用理论。

是一种通过样本对总体的某种假设（如总体均值、方差等于多少，总体服从什么分布等）进行检验的方法。

一、常用核心概念

什么是假设检验：假设就是对从总体参数(均值、比例等)的具体数值所作的陈述。是一种通过样本对总体的某种假设（如总体均值、方差等于多少，总体服从什么分布等）进行检验的方法。

比如，我认为配方一比配方二的效果要好。而假设检验就是先对总体的参数提出某种假设，然后利用样本的信息判断假设是否成立的过程，比如上面的假设信息我该接受还是拒绝。

什么是显著性水平：显著性水平是一个概率值，原假设为真时，拒绝原假设的概率，表示为α，常取值为0.05、0.01、0.10。一个公司招聘，本来准备招聘100个人，公司希望只有5%的人是混水摸鱼招聘进来，所以可能会有5个人混进来，所谓显著性水平α，就是你允许有多少比例混水摸鱼的能通过测试。

原假设与备择假设：待检验的假设又叫原假设(零假设)，一般表示为H0，原假设一般表示两者没有显著性差异。与原假设进行对比的叫备择假设，表示为H1。一般在比较的时候，主要有等于、大于、小于。

检验统计量：即计算检验的统计量。根据给定的显著性水平，查表得出相应的临界值。再将检验统计量的值与该显著性水平的临界值进行比较，得出是否拒绝原假设的结论。

P值：是一个概率值，如果原假设为真，p值是抽样分布中大于或小于样本统计量的概率。左检验时，p值为曲线上方小于等于检验统计量部分的面积。右检验时，p值为曲线上方大于等于检验统计量部分的面积。

假设检验的两种错误：类型 I 错误(弃真)，如原假设为真，但否定它，则会犯类型 I 错误。犯类型 I 错误的概率为 α(即您为假设检验设置的显著性水平)。α 为 0.05 表明，当您否定原假设时，您愿意接受 5% 的犯错概率。为了降低此风险，必须使用较低的 α 值。但是，使用的α值越小，在差值确实存在时检测到实际差值的可能性也越小。类型 II 错误(采伪)，如原假设为假，但无法否定它，则会犯类型 II 错误。犯类型 II 错误的概率为 β，β 依赖检验功效。可以通过确保检验具有足够大的功效来降低犯类型 II 错误所带来的风险。方法是确保样本数量足够大，以便在差值确实存在时检测到实际差值。

单双测检验：当假设关键词有不得少于/低于的时候用左侧检验，比如灯泡的使用寿命不得少于/低于700小时时；当假设关键词有不得多于/高于的时候用右侧检验，比如次品率不得多于/高于5%时。双侧检验指按分布两端计算显著性水平概率的检验，应用于理论上不能确定两个总体一个一定比另一个大或小的假设检验。

一般假设检验写作H0：μ1=μ2。

检验结果：单侧，若p值>α,不拒绝H0，若p值>1/2α,不拒绝H0，若p值<1/2α,拒绝H0

二、假设检验方法

假设检验方法有z检验，t检验，卡方检验(卡方本篇不详述，应用较少)，

常用假设检验方法，如下表所示：

2.1. Z检验

Z检验原理：当总体标准差已知,样本量较大时用标准正态分布的理论来推断差异发生的概率，从而比较两个平均数的差异是否显著。

2.2. t检验

t检验：分为单样本的t检验、配对样本均数t检验、两独立样本均数t检验。t检验应用于两组计量资料小样本比较，样本对总体有较好代表性，对比组间有较好组间均衡性，即随机抽样和随机分组。且样本来自正态分布总体。单个样本t检验适用于样本均数与已知总体均数μ0的比较,目的检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。应用于总体标准α未知的小样本资料，且服从正态分布。

假设检验的分析步骤有：

1）、提出假设，规定适当检验统计量，确定检验水平：

H0：μ1=μ2

H1：μ1≠μ2

α=0.05，样本量较大，且检验来自两组样本平均数的差异性，故选择z检验统计量

2）、计算统计量z值

将已知数据带入z检验公式，

计算假设检验统计量 z=10.4

α=0.05，双侧故 α/2=0.025，1-α=0.975 查表，确认临界值为1.96

3）、确定p值，做出推断结论

我们来按不同的检验方法，各举一个例子看看如何进行假设检验分析的：

1. 案例1：单样本 T检验

某车工所加工轴要求平均长度500mm，随机抽取25根，测得样本均值为501mm，样本标准差为1mm。

问：在显著性水平α =0.05的前提下，是否可以认为他加工的轴长度均值为500mm？

经过计算后，P-value=0.000<0.05，拒绝原假设，不可以认为他加工的轴长度均值为500mm。

2. 案例2：双样本T检验

A、B两加工同条生产线一个零件，各测定13根零件的尺寸，分析两条生产线加工零件的尺寸均值是否相同。

Miniab的计算方法，表格的整理就自己动手哈，T检验的计算截图如下：

经过计算后，P-value=0.015<0.05，接受原假设，两条生产线加工零件的尺寸均值有显著差异。

3. 案例3：比率检验

供应商反馈其产品良品率为 95%，随机抽取100 件零件，其中合格品93件，分析其合格率。随机抽取1000件零件，其中合格品930件，分析其合格率。

经过计算后，P-value=0.007<0.05，拒绝原假设，供应商的合格率有明显的差别。

4. 案例4：双比率检验

例如：分别从A、B两种工艺条件下随机抽取1500件及1800件产品，其中A工艺条件下有340件一等品，B工艺条件下有350片一等品，α=0.05的条件下，A工艺是否比B工艺有更好的一等品率。

经过计算后，P-value=0.475>0.05，接受原假设，A工艺是比B工艺更好的一等品率不显著。

5. 案例5：配对T检验

配对 t 检验比较两个有相互关系的样本的平均值。

例如，有一个团队想要考察某种减肥药品的疗效。选定10人进行实验，收集了每个人服用减肥药前后的体重数据。

假设只有服用减肥药后前后均值超过5kg ，团队才认为有显著疗效。基于95%的置信度进行配对检验。

经过计算后，P-value=0.007<0.05，拒绝原假设，团队可认为有显著疗效。

6. 案例6：列联表与卡方检验

列联表是一个包含分类计数数据即频数的二维表（行和列），可以通过分析确定两个变量（分类）是独立的还是有显著相关性的。

列联表的检验要用到卡方检验，即用服从卡方分布的统计量作为检验统计量；卡方统计量反映了“实际观测到的”和“期望的”频数之间的差异。

案例

例如，市场经理想知道公司机器的可靠性如何影响顾客的满意度和购买决策。他的营销团队一直在收集客户满意度调查结果的机器。

调查的两个问题是关于可靠性满意度和再次购买的态度。

他想知道这两个客户的反应是否相关。如果是这样，他将进行进一步的调查和分析。

可靠性有三个选择，“满意”，“确定”，“不满意”，再次购买态度有另外三个选择，“将购买”，“可能”，“不会”。

他们收集了100个客户反馈，如下表。

判断顾客满意度是否与再次购买态度有关？

经过计算后，P-value=0.000<0.05，拒绝原假设，可靠性满意度会影响顾客再次购买的态度。

7. 案例7：单样本Z检验

例如，左侧图片中激光器，技术改进后电功率由720提升至723mW，右侧电灯的合格率由70%提升至77%。

改进前后，技术指标是否显著提高呢？

我们以激光器改进为例，按照显著性水平α=0.05进行“单侧大于”假设检验：

2.05大于 1.645 拒绝原假设，有显著提高。

因此，假设检验是根据一定假设条件，由样本推断总体的统计推断方法。

六西格玛中可用于验证影响结果的因子是否显著，证明改进前后是否存在明显的差异等。

假设试验用于验证所找出的原因的确造成了差异而不是偶发事件。

参考文献：

网络
《精益六西格玛工具速查手册》，王其荣译，机械工业出版社 2016年

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。