打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
很多人不明白的两个可靠性概念,可能有你!



工作中很多人提问:置信度和置信区间是什么意思,能通俗易懂的讲一下吗?91质量来告诉你!




置信度:以测量值为中心,在一定范围内,真值出现在该范围内的几率。一般设定在2σ,也就是95%,95%是通常情况下置信度(置信水平)的设定值。

 

置信区间:在某一置信度下,以测量值为中心,真值出现的范围。 我们在论文里经常看到CI,CI是置信区间,一定概率下真值得取值范围(可靠范围)称为置信区间。其概率称为置信概率或置信度(置信水平)。

 

真实数据往往是实际上不能获知的,我们只能进行估计,估计的结果是给出一对数据,比如从1到1.5,真实的值落在1到1.5之间的可能性是95%(也有5%的可能性在这区间之外的)。区间是由抽样的数据根据大样定律结合查表得来的。区间越小精度越高,区间越大置信度越高。

 

打个比方,我们猜小妮子的年龄,你给出区间是25-35,这个区间很小置信度很低但精度就很高,你说在8岁到80岁之间,那是百分百的置信度了,不过精度太低毫无意义。的确99%准确度高于95%,但是它的精度(精密度)就低于95%。95%的置信度是一般通用的。



 

更专业的解释:

 

置信区间的定义


首先我们先定义一些区间估计的概念。

θ:待估计的总体参数

θL:由样本确定的置信下限

θU:由样本确定的置信上限

α:大于0,小于1的数值

1-α:置信度

如果由样本确定的两个统计量θL θU 满足P (θLθθU)=1-α, 就称随机区间(θL ,θU) 是θ 的置信度为1-α 的置信区间。θL θU 分别称为置信度为1-α 的置信下限和置信上限,1-α 称为置信度。我们估计小学生的平均身高是在1.40m1.50m之间,可靠程度为95%。现在可以用公式将以上的叙述表达出来,即

P(1.40μ <>

式中的μ表示小学生的平均身高。(1.40μ <>是置信区间;95%是置信度,1.40m1.50m分别是置信下限和置信上限。


置信区间的分类


双侧置信区间:上例中的(1.40μ <>属于双侧置信区间。

单侧置信区间:在有些场合下,我们只关心总体参数的某一侧界限。例如,对于产品的寿命来说,消费者只关心其寿命的下限,对其上限则希望越长越好;而对于许多成本,则正好相反。




区间估计的原理


下面我们以估计总体参数为例,说明区间估计的原理

设有总体XN(μ,σ2),σ2已知,估计μ的置信度为1-α的双侧置信区间。

从总体中随机抽取样本容量为n的样本,样本均值为`X。所以样本随机变量可以表示为`XN(μ,σ2/n)。(由总体随机变量X~N(μ,σ2),样本容量为n,样本均值为`X,得到样本随机变量为`XN(μ,σ2/n)的具体推理过程,请见连续型随机变量——抽样分布

根据样本随机变量`XN(μ,σ2/n),经过变换可得随机变量(`X-μ)/σ/?nN(0,1)(由正态分布`X~N(μ,σ2/n),转换成标准正态分布(`X-μ)/σ/?nN(0,1)的具体推理过程,请见连续型随机变量——正态分布

已知给定置信度为1-α,则随机变量落在(-Zα/2,Zα/2)区间的概率为

P(-Zα/2<>`X-μ)/σ/?n<>α/2) =1-α

经变换可得

P(`X-Zα/2*σ/?nμ`X+Zα/2*σ/?n) =1-α

即为μ 的置信度1-α 为的双侧置信区间。以上即为由样本参数推断总体置信区间的过程。

 

置信度与置信区间的关系


在估计总体参数时,一般都会给出一个较高的置信度,如95%或99%等。但是,当样本容量n为一定时,置信度越高,置信区间就越大,也即估计的参数的相对精度就会越低。反之,置信度越低,则精度相对就会越高。解决这一矛盾的方法就是增加样本容量n。



根据相关技术资料整理, 仅供学习交流。


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
数据分析中的统计学基础知识
大数据:大数据课堂之概念学习29篇(建议收藏)
医学统计学考前复习提纲
干货分享--统计学知识大梳理(第三部分-最终篇)
概率统计总复习
04-参数估计(2015研)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服