很多人不明白的两个可靠性概念，可能有你！

工作中很多人提问：置信度和置信区间是什么意思，能通俗易懂的讲一下吗？91质量来告诉你！

置信度：以测量值为中心，在一定范围内，真值出现在该范围内的几率。一般设定在2σ，也就是95%，95%是通常情况下置信度（置信水平）的设定值。

置信区间：在某一置信度下，以测量值为中心，真值出现的范围。我们在论文里经常看到CI，CI是置信区间，一定概率下真值得取值范围（可靠范围）称为置信区间。其概率称为置信概率或置信度（置信水平）。

真实数据往往是实际上不能获知的，我们只能进行估计，估计的结果是给出一对数据，比如从1到1.5，真实的值落在1到1.5之间的可能性是95%（也有5%的可能性在这区间之外的）。区间是由抽样的数据根据大样定律结合查表得来的。区间越小精度越高，区间越大置信度越高。

打个比方，我们猜小妮子的年龄，你给出区间是25-35，这个区间很小置信度很低但精度就很高，你说在8岁到80岁之间，那是百分百的置信度了,不过精度太低毫无意义。的确99%准确度高于95%，但是它的精度（精密度）就低于95%。95%的置信度是一般通用的。

更专业的解释:

置信区间的定义

首先我们先定义一些区间估计的概念。

θ：待估计的总体参数

θ_L：由样本确定的置信下限

θ_U：由样本确定的置信上限

α：大于0，小于1的数值

1-α：置信度

如果由样本确定的两个统计量θ_L和θ_U满足P (θ_Lθθ_U)=1-α, 就称随机区间(θ_L ,θ_U) 是θ 的置信度为1-α 的置信区间。θ_L和θ_U分别称为置信度为1-α 的置信下限和置信上限，1-α 称为置信度。我们估计小学生的平均身高是在1.40m和1.50m之间，可靠程度为95%。现在可以用公式将以上的叙述表达出来，即

P(1.40μ <>

式中的μ表示小学生的平均身高。(1.40μ <>是置信区间；95%是置信度，1.40m和1.50m分别是置信下限和置信上限。

置信区间的分类

双侧置信区间：上例中的(1.40μ <>属于双侧置信区间。

单侧置信区间：在有些场合下，我们只关心总体参数的某一侧界限。例如，对于产品的寿命来说，消费者只关心其寿命的下限，对其上限则希望越长越好；而对于许多成本，则正好相反。

区间估计的原理

下面我们以估计总体参数为例，说明区间估计的原理

设有总体X～N(μ,σ²)，σ²已知，估计μ的置信度为1-α的双侧置信区间。

从总体中随机抽取样本容量为n的样本，样本均值为`X。所以样本随机变量可以表示为`X～N(μ,σ²/n)。（由总体随机变量X～N(μ,σ²)，样本容量为n，样本均值为`X，得到样本随机变量为`X～N(μ,σ²/n)的具体推理过程，请见连续型随机变量——抽样分布）

根据样本随机变量`X～N(μ,σ²/n)，经过变换可得随机变量(`X-μ)/σ/?n～N(0,1)。（由正态分布`X～N(μ,σ²/n)，转换成标准正态分布(`X-μ)/σ/?n～N(0,1)的具体推理过程，请见连续型随机变量——正态分布）

已知给定置信度为1-α，则随机变量落在(-Z_α_/2,Z_α_/2)区间的概率为

P(-Z_α_/2<>`X-μ)/σ/?n<>_α_/2) =1-α

经变换可得

P(`X-Z_α_/2*σ/?nμ`X+Z_α_/2*σ/?n) =1-α

即为μ 的置信度1-α 为的双侧置信区间。以上即为由样本参数推断总体置信区间的过程。

置信度与置信区间的关系

在估计总体参数时，一般都会给出一个较高的置信度，如95%或99%等。但是，当样本容量n为一定时，置信度越高，置信区间就越大，也即估计的参数的相对精度就会越低。反之，置信度越低，则精度相对就会越高。解决这一矛盾的方法就是增加样本容量n。

根据相关技术资料整理，仅供学习交流。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。