打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
极大似然估计和贝叶斯估计

转载于http://blog.sciencenet.cn/blog-520608-703219.html


极大似然估计和贝叶斯估计分别代表了频率派和贝叶斯派的观点。频率派认为,参数是客观存在的,只是未知而矣。因此,频率派最关心极大似然函数,只要参数求出来了,给定自变量X,Y也就固定了,极大似然估计如下所示:


D表示训练数据集,

是模型参数

相反的,贝叶斯派认为参数也是随机的,和一般随机变量没有本质区别,正是因为参数不能固定,当给定一个输入x后,我们不能用一个确定的y表示输出结果,必须用一个概率的方式表达出来,所以贝叶斯学派的预测值是一个期望值,如下所示:

其中x表示输入,y表示输出,D表示训练数据集,

是模型参数

该公式称为全贝叶斯预测。现在的问题是如何求

(后验概率),根据贝叶斯公式我们有:


可惜的是,上面的后验概率通常是很难计算的,因为要对所有的参数进行积分,不能找到一个典型的闭合解(解析解)。在这种情况下,我们采用了一种近似的方法求后验概率,这就是最大后验概率。


最大后验概率和极大似然估计很像,只是多了一项先验分布,它体现了贝叶斯认为参数也是随机变量的观点,在实际运算中通常通过超参数给出先验分布。

从以上可以看出,一方面,极大似然估计和最大后验概率都是参数的点估计。在频率学派中,参数固定了,预测值也就固定了。最大后验概率是贝叶斯学派的一种近似手段,因为完全贝叶斯估计不一定可行。另一方面,最大后验概率可以看作是对先验和MLE的一种折衷,如果数据量足够大,最大后验概率和最大似然估计趋向于一致,如果数据为0,最大后验仅由先验决定。


参考资料:

 [1] Machine learning: a probabilistic perspective 第三章

 [2]Andrew Ng讲义,Regularization and model selection

    http://v.163.com/special/opencourse/machinelearning.html

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
贝叶斯vs频率派:武功到底哪家强?| 说人话的统计学·协和八
贝叶斯学派与频率学派有何不同?
再谈贝叶斯学派与频率学派的区别
聊一聊机器学习的MLE和MAP:最大似然估计和最大后验估计
浅谈频率学派和贝叶斯学派
入门|贝叶斯线性回归方法的解释和优点
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服