查字典图书网

  

当前位置： 查字典 > 图书网 > > Pattern Recognition And Machine Learning > PRML，Bayesian PK Frequentist，笔记

Chojin 对 Pattern Recognition And Machine Learning 的书评发表时间：2012-08-25 23:08:28

PRML，Bayesian PK Frequentist，笔记

两年多以前有个Machine Learning课以PRML为参考书，当时就觉得这书相当的好。可惜一直以来没认真读完。最近稍闲终于重新读了一遍，比较有收获。
这书给人的最大的印象可能是everything has a Bayesian version或者说everything can be Bayesianized，比如PRML至少给出了以下Bayesian对Frequentist的PK：

Frequentist版本 Bayesian版本
Linear regression <---> Bayesian linear regression
Logistic regression <---> Bayesian logistic regression
Neural network <---> Bayesian Neural network
SVM <---> RVM
Gaussian mixture model <---> Bayesian Gaussian mixture model
Probabilistic PCA <---> Bayesian probabilistic PCA
Hidden markov model <---> Bayesian Hidden markov model
Linear dynamic system <---> Bayesian Linear dynamic system

从作者的叙述来看，Bayesian是道美味可口的菜：避免over-fitting，自动选模型参数（例如GMM的分支数K，PCA所降到的维数）等等；虽然通向它的路途颇为艰难：marginalization涉及的计算是很复杂的。因此书里大量运用了approximation（前期大量Laplace approximation，后期Variational Bayes等）。
Frequentist一方的model/algorithm稍轻松一些，面临的计算困难没那么大：前期很多甚至有closed-form solution，要不就上gradient decent，后期则大量EM算法；但Frequentist要考虑over-fitting的问题（regularizing），又要cross-validation来选model，这减少了training data、增加了额外计算量，不如Bayesian方法来得elegant。

这本书总体上写的是非常清晰的。不过也有些不尽如人意的。比如第8章读完后我仍旧不知道PGM到底是什么，还是借助了Koller那本PGM的某几章才算搞清楚。再如SVM那一章(P328)，Lagrangian function关于参数w,b最小化，关于Lagrange multiplier最大化这一点，也是看了Andrew Ng的Lecture note后才理解为什么的。

最后，分享一下本人的全部笔记：http://vdisk.weibo.com/s/KY31O （http://vdisk.weibo.com/s/bc6IJ -- 这个链接somehow已经失效了...）。

展开全文

有用 63 无用 2

您对该书评有什么想说的？

发表

对“PRML，Bayesian PK Frequentist，笔记”的回应

太和嘉皓 2015-10-02 22:27:21

感谢楼主！！

耐 2014-11-18 01:27:22

刚刚完成老师的Exercise, 完全因为看了楼主的notes,豁然开朗。好感激怎么办T.T楼主不当老师也能当助教的啊！

耐 2014-11-17 22:48:24

太棒了！！！！！！！>.<

旅叶 2014-10-27 20:01:19

是的，同问？没有看到那门公开课是用这本教材的。。

其名为鲲 2014-06-27 16:08:03

这本书国内有影印版吗？

echo 2014-01-27 23:56:24

你好，请问你当时看的是哪门公开课啊，我也想去看看，网上没找到

whjxnyzh 2014-01-08 16:09:58

楼主，我感觉第八章的图模型是本书的精品。。最大的收获就是看了这一章啊，，，还有你说的那个SVM，作者推导的很详细啊，完全没有压力，你说的那两个问题都不是问题。。。。。。。。。

Rover 2013-09-16 16:03:19

这本书好贵，大家都买的正版的吗？

Chojin 2013-07-22 01:46:31

那个文件其实还在那，但是已经被设置成私密（somehow，肯定不是我做的，可能标题含有的某两个字母而被认为是色情...），并且还不能重新设成分享...

Anyway, 已经换了个新链接

宾州星际哥 2013-07-22 00:48:36

同求笔记••••

Anymake 2013-07-14 22:03:13

您好！读书笔记链接失效了，方便更新一下吗？

极度视界 2013-03-21 08:09:34

多么鲜艳的帽子，不是我的，我也不会要。

doubling 2013-03-21 00:26:56

嗯，也是，对于非Bayesian干嘛非要科普bayesian呢。

极度视界 2013-03-20 23:38:38

你还是先理解你要反驳的观点是什么，再反驳吧。

doubling 2013-03-20 23:24:43

你要具体，那我们就来具体的。
1， Vapnik 的VC dimension以及后面一脉相承的sample complexity分析里面对象都是一个分类函数，所以可以才能用VC dimension或者Rademacher complexity等等来度量这个分类函数所属的函数集的复杂性。而Bayesian的目标并不是一个分类函数，而是整个分类函数的分布。所以Frequentist的复杂性度量在这个level就不太适用了。
2，基于上述原因，DA McAllester提出了PAC-Bayesian来度量。
3，我的理解，Bayesian对概率的理解和频率学派对概率的理解和解释不一样，你所说的sample complexity是基于频率学派的概率，对于pure Bayesian意义不清楚。
4，在你反对某件事之前，请先试着了解它。

极度视界 2013-03-20 12:09:57

没有，就觉得你在扯淡了。华而空壳。

doubling 2013-03-20 08:56:18

呵呵，这是戳着你的痛处了？人身攻击可就没意思了。

极度视界 2013-03-20 08:18:02

弄几个名字，就来招摇撞骗，回去哄孩子去吧。
话说曾经有人用各种名词组合成文章，还能蒙过评审。

doubling 2013-03-07 11:55:15

to upstair: 先明白error bound的定义再想想为什么Bayesian inference一般不采用这个东西。站在Frequentist体系里攻击Bayesian没啥意思。Frequentist和Bayesian的烂仗多了，再打也没意思。况且我所知道的Frequentist 统计学家对松垮跨的upper bound嗤之以鼻的也不少。

极度视界 2013-03-07 10:41:23

只需要train，不需要test？

doubling 2013-03-07 04:27:50

Bayesian还要什么泛化界？

极度视界 2013-03-05 20:50:43

这个书的一个问题是，把全部的精力用在了“提出模型+参数计算”，机器学习的标准的泛化误差几乎没讲。
有些数值示例是最好的了，作者要把它放在（XX，2008）这书上，但是这本书好像夭折了。

天风海涛 2012-12-27 23:36:49

笔记非常不错，明白不少东西。听君一席话，胜读十年书。

小小魔 2012-12-08 19:39:17

嘿，还真是，谢谢啦

Chojin 2012-12-08 15:02:56

to 小小魔：你是不是把最后的那个句号也copy了...

小小魔 2012-12-06 13:39:40

显示“文件被删除或取消分享”了，能否再分享一次？

Chojin 2012-10-23 13:04:26

to jock：没见过，倒是Bayesian learning的书有一些

to 漫步夕阳：链接还在啊

漫步夕阳 2012-10-22 22:59:18

分享链接已失效，能否再分享一次?

Richard 2012-10-14 14:19:26

Frequentist的书用哪本？对于初学，从哪本开始比较合适

Chojin 2012-09-18 12:15:39

确实这些pair里SVM与RVM跟其他的不一样，SVM甚至都不是一个probabilistic model。列出来只是因为它们都是sparse model。

doubling 2012-09-18 07:21:42

RVM还真不是SVM的bayesian version。虽然这两个都sparse了，达到这个目的的过程真的不一样。

范深 2012-08-26 16:15:23

我下载了您的笔记！觉得非常不错~学习学习

图书栏目

查看更多