有保留的推荐。
书的优点:很全,较新,成体系,连贯性很好。
书的缺点:错误挺多,抽象晦涩,理论性很强。
我个人是做视频的高层信息理解分析的,偶然之间接触到概率图模型的几个算法,后来跟着实验室的其他老师和组里的同学一起学了这本书。听了大家的讲解,让我收获很多,原来只是自己看的算法,学了这本书的相关章节后感觉理解的深刻多了,也多了很多新的理解。再加上10年的龙星计划机器学习班,Erik Xing老师的讲解让我对很多疑惑多了些思路。这是在这个课程上,知道这本书其实03年左右已经在美国有些学校里作为draft教材了。所以,不算特别新,但是这是概率图模型里比较新的教材了。
Bishop的书PRML,从8章开始,就讲了概率图模型其实,我觉得相对来说这本书更容易懂些,而比较起来,PGM这本书则晦涩难懂多了,我觉得。比如图模型中的三个典型结构,PRML中讲解的就清晰容易懂,个人感觉。从另一方面来比较,JORDAN的书,一直没出版,看了些电子版和打印出来的,觉得其实相对没那么晦涩的。
我看了一下,大概是PGM的作者一直在做理论吧,所以算法理解的深度高,所以才理论那么强?
回到PGM这本书,其实,我觉得我还是很喜欢这本书的,在我开始关注概率图模型的几个算法时,就注意到作者要出版这本书,但是一直没找到相关资料。大概也是这个时候,才意识到国内外学术差距有多少年的吧。我想如果开始时我能接触到这本书,并了解些,我开始看概率图模型的算法,比如HDP,LDA等模型时,应该会容易些,也会理解的深刻些。但是曲径通幽,问题还是解决了的,而这本书也终于见到了,但是,推荐想了解概率图模型的人看这本书。
看之前,有些概念需要理解,一些概率统计的基础知识要有的,别像我这边一个师弟,拿多项式分布来问我奥,这不是说不行,而是说这些基础不了解,你看起来会很吃力,囫囵吞枣,会消化不良的啦。
再者,其实,优化这部分基础也是要有的,我不是计算机科班出身,也不是数学科班出身,所以虽然上了不少数学课(微积分),可对优化我始终停留在皮毛上,看这本书时,补了不少优化的东西。所以,如果你也和我一样,也建议补充一下吧。
我们这的老师说,这本书的结构很重要,我一直在思考这个问题,到现在还是朦朦胧胧的,他有一次评论我的文章说我对这些理解的还不够深刻。我想他说的是对的,但是,我在努力理解深刻,尤其是结构这个问题,我希望有高人能够把自己的理解写出来,最好是结合某一个算法或者一类算法,不要那么抽象或者大范围。
之所以想写这个评论,不是因为我牛,也不是因为我在这个方向牛。而是因为我从第一次接触概率图模型的几个算法,我就喜欢上了这个方向,当时遇到了很多困难,像蚂蚁一样往前走,面临着延期的压力,可我还是坚持下来了,我希望以后博士毕业后能继续这个方向。可现在要毕业找工作了,我尽最大努力找个偏向于科研的方向的工作,继续我喜欢的方向,可本人很菜,而且科研的单位能有几个?如果最后无法继续,我也算对我喜欢的这个方向留了点纪念。如果我能够如愿以偿,继续我喜欢的方向,我会再多写点自己的理解,算是继续。
对了,这本书的中文翻译版快出来了,如果你想看看中文版的,到时候不妨翻翻。
清华大学出版社,概率图模型:原理与技术,已经出版了,应该马上可以买了。具体可以见博客:http://blog.sciencen
转上一则博客,或许会对本书有更全面的认识,不受我的影响。http://hi.baidu.com/
回头看大家的评论,才发现自己的这块砖头真是起到了作用了.
Relation between PLSA and NMF and Implications
http://ezcodesample.
最近想看看这一块,谢谢Chen_1st
@华林,
目前关于概率图模型的中文资料可能确实不多,我当时看时能找到的中文资料就很少。@raullew,其实据我所了解的,我想之所以没有得到广泛应用也是因为不成熟吧。计算量是一个问题,模型是非常复杂的其实,变量之间的独立性就难以捉摸,这个就是结构的存在?再者,即使是模型定了,模型的推断也是个大问题,没什么好的方法,我记得林达华有篇博客里介绍过几个典型的推断算法,其中一个是BP,提到收敛性是一直没解决的问题,当然这也不影响其的应用和推广。还有各种其它的变分推断,采样等实现,每一处都是个不小的坑。我听一位作文本的朋友说,LDA在文本分析中都跑起来特别慢,所以他一直犹豫是不是要看下去。
恩。熟悉了HDP,其实看着LDA相对简单些,虽然这个也不容易。但是HDP确实复杂,现在看完这个后,用的效果来看,效果并不像我想的那样好,我是想用HDP到crf和hmm类似模型中,现在也有很多人在用了,我在写综述看文章时发现,其实现在概率图模型现在用的比较好的地方也就是图像处理中了,而且发展主要是结合mrf,crf等,其实视频处理数据的应用效果也不是很好。我在用时,一直在调整,挺失望的对这类模型,但是反过来说,任何模型都不是那么好用。
而且和做文本处理的朋友讨论,HDP根本无法在文本数据中跑,太慢了,呵呵,这也是我担心的问题。我用在视频数据中就很慢。
非常佩服HDP的作者啊,真是一群牛人啊,把数学的东西整的真是转的很啊。
今天写TrueSkill的日记(http://www.douban.co
PGM把图模型的表示和推理相分离,这样就可以做到:确定好图模型的数据结构之后,不管图模型结构怎么变,推理方法都仍然有效,不需要修改。而其他的书一般都是针对具体问题(换言之,固定的图模型结构)谈推理,缺乏这种软件设计上的易复用特性。