有保留的推荐_Probabilistic Graphical Models书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 算法 > Probabilistic Graphical Models > 有保留的推荐
英子 Probabilistic Graphical Models 的书评 发表时间:2010-10-01 13:10:45

有保留的推荐

有保留的推荐。

书的优点:很全,较新,成体系,连贯性很好。
书的缺点:错误挺多,抽象晦涩,理论性很强。

我个人是做视频的高层信息理解分析的,偶然之间接触到概率图模型的几个算法,后来跟着实验室的其他老师和组里的同学一起学了这本书。听了大家的讲解,让我收获很多,原来只是自己看的算法,学了这本书的相关章节后感觉理解的深刻多了,也多了很多新的理解。再加上10年的龙星计划机器学习班,Erik Xing老师的讲解让我对很多疑惑多了些思路。这是在这个课程上,知道这本书其实03年左右已经在美国有些学校里作为draft教材了。所以,不算特别新,但是这是概率图模型里比较新的教材了。

Bishop的书PRML,从8章开始,就讲了概率图模型其实,我觉得相对来说这本书更容易懂些,而比较起来,PGM这本书则晦涩难懂多了,我觉得。比如图模型中的三个典型结构,PRML中讲解的就清晰容易懂,个人感觉。从另一方面来比较,JORDAN的书,一直没出版,看了些电子版和打印出来的,觉得其实相对没那么晦涩的。

我看了一下,大概是PGM的作者一直在做理论吧,所以算法理解的深度高,所以才理论那么强?


回到PGM这本书,其实,我觉得我还是很喜欢这本书的,在我开始关注概率图模型的几个算法时,就注意到作者要出版这本书,但是一直没找到相关资料。大概也是这个时候,才意识到国内外学术差距有多少年的吧。我想如果开始时我能接触到这本书,并了解些,我开始看概率图模型的算法,比如HDP,LDA等模型时,应该会容易些,也会理解的深刻些。但是曲径通幽,问题还是解决了的,而这本书也终于见到了,但是,推荐想了解概率图模型的人看这本书。

看之前,有些概念需要理解,一些概率统计的基础知识要有的,别像我这边一个师弟,拿多项式分布来问我奥,这不是说不行,而是说这些基础不了解,你看起来会很吃力,囫囵吞枣,会消化不良的啦。

再者,其实,优化这部分基础也是要有的,我不是计算机科班出身,也不是数学科班出身,所以虽然上了不少数学课(微积分),可对优化我始终停留在皮毛上,看这本书时,补了不少优化的东西。所以,如果你也和我一样,也建议补充一下吧。

我们这的老师说,这本书的结构很重要,我一直在思考这个问题,到现在还是朦朦胧胧的,他有一次评论我的文章说我对这些理解的还不够深刻。我想他说的是对的,但是,我在努力理解深刻,尤其是结构这个问题,我希望有高人能够把自己的理解写出来,最好是结合某一个算法或者一类算法,不要那么抽象或者大范围。

之所以想写这个评论,不是因为我牛,也不是因为我在这个方向牛。而是因为我从第一次接触概率图模型的几个算法,我就喜欢上了这个方向,当时遇到了很多困难,像蚂蚁一样往前走,面临着延期的压力,可我还是坚持下来了,我希望以后博士毕业后能继续这个方向。可现在要毕业找工作了,我尽最大努力找个偏向于科研的方向的工作,继续我喜欢的方向,可本人很菜,而且科研的单位能有几个?如果最后无法继续,我也算对我喜欢的这个方向留了点纪念。如果我能够如愿以偿,继续我喜欢的方向,我会再多写点自己的理解,算是继续。

对了,这本书的中文翻译版快出来了,如果你想看看中文版的,到时候不妨翻翻。

展开全文


推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读

对“有保留的推荐”的回应

英子 2015-03-30 09:02:43

清华大学出版社,概率图模型:原理与技术,已经出版了,应该马上可以买了。具体可以见博客:http://blog.sciencenet.cn/blog-2374-877942.html

Brat 2015-02-11 11:59:27

大概什么时候能出来,楼主可以透露一下出版社么,我想先预定

英子 2015-02-10 14:58:26

概率图模型:原理与技术

Brat 2015-02-09 13:51:34

还有中文版的名字叫啥捏?

Brat 2015-02-09 09:17:05

楼主可以给个出版日期么?等的好辛苦。。。还有啊,翻译会对书中的错误做修正么?

Brat 2015-02-09 06:56:43

中文版上电商还要多久捏?

凡晨小雪 2015-02-03 12:36:45

同期待中文版

webster 2015-01-28 09:09:56

期待中文版

英子 2015-01-27 13:05:12

中文版马上就出来了,已经印刷了。大家到时候可以看看。

Chen_1st 2015-01-18 01:55:59

是阿,中文版啥时候出来呢?

另外,搜狐大数据中心招人,欢迎楼上各位私信。

jia 2015-01-14 21:59:49

10年我也参加了 龙星计划,在交大徐汇,对Eric Xing老师的一封信还在,记忆犹新啊。现在这个书已经有清晰的pdf版了,但是现在中文版还没出来!效率实在是太低了!

super 2014-01-23 11:30:40

翻译版在哪里,什么时候出

lisihan88922 2012-09-22 11:19:48

求PGM的中文版书名,在哪里可以买到这本书,急求,谢谢

Chen_1st 2012-05-15 18:13:05

@英子

呵呵,谢谢。

@辉辉行天下

是美女啊,不过好像有主了。

英子 2012-05-15 16:02:46

转上一则博客,或许会对本书有更全面的认识,不受我的影响。http://hi.baidu.com/chen_1st/blog/item/ec2c89393eb7fefd54e7239b.html

英子 2012-05-15 16:01:22

吼吼,我不是女强人,不过现在连生孩子都可以不分性别了,学科就更不用说了。

兔子二 2012-05-14 15:38:57

一个女生,居然喜欢这么晦涩难懂的,佩服啊! 呵呵!

英子 2012-04-05 11:29:26

清明节假期,从读其中的17章,我觉得我现在想给这本书5星了。最近计划什么书都放一边,从新看这本。以前看的太浅。

austameng 2012-03-03 12:53:44

我最近在看英文版的,感觉很晦涩,请问中文版的哪里有

英子 2011-11-12 14:49:29

回头看大家的评论,才发现自己的这块砖头真是起到了作用了.

Relation between PLSA and NMF and Implications

http://ezcodesample.com/plsaidiots/NMFPLSA.html

最近想看看这一块,谢谢Chen_1st

doubling 2011-11-12 10:39:50

@cheney8023  无论是PCA,LDA, CCA,pLSI都好,其实在计算层面都是对矩阵进行分解,区别在于这样的model是怎样导出的,用什么样的语言描述这个算法,以及进行点估计还是Bayesian式的估。其实这也是LDA能够实现large-scale的原因。

daniu 2011-08-24 10:29:25

哪位那里有第六章的译本,分享下,急用,在此谢过

Chen_1st 2011-04-15 09:58:31

@cheney8023

1. pLSA是一种非负矩阵分解方法,请查看讨论他们之间关系的文章。
2. LDA是pLSA的bayesian版,这个应该没有什么问题吧。

cheney8023 2011-04-14 23:10:15

@Chen_1st 'LDA可以看成是bayesian版的矩阵分解。 ' 求解释

英子 2011-03-18 14:44:33

呵呵,你给自己找到了答案。

凡晨小雪 2011-03-18 13:05:11

其实是我这个问题问的不好,本来做研究,只要有问题就值得研究。

英子 2011-03-18 08:37:35

@凡晨小雪
我其实没什么经验可谈,以前这么说是不知深浅,见谅。不过,应用才刚开始吧。只要用得好,其实哪个方法都有价值吧。嘿嘿,这个问题太大了,本人水平有限。

凡晨小雪 2011-03-18 04:50:28

英子,依你视频分析方面应用的经验,你觉得LDA,HDP还有继续在这个方面进行应用研究的价值吗?

Chen_1st 2011-01-22 23:44:19

把“Chen_1st老道”里的“道”去了比较准确

英子 2011-01-22 22:11:33

Chen_1st老道,把LDA和矩阵分解联系起来,我第一次听说,留个记号,想想这个想法。

raullew 2011-01-22 19:41:10

谢谢英子的实际经验:)

英子 2011-01-22 17:09:54

@华林,
目前关于概率图模型的中文资料可能确实不多,我当时看时能找到的中文资料就很少。@raullew,其实据我所了解的,我想之所以没有得到广泛应用也是因为不成熟吧。计算量是一个问题,模型是非常复杂的其实,变量之间的独立性就难以捉摸,这个就是结构的存在?再者,即使是模型定了,模型的推断也是个大问题,没什么好的方法,我记得林达华有篇博客里介绍过几个典型的推断算法,其中一个是BP,提到收敛性是一直没解决的问题,当然这也不影响其的应用和推广。还有各种其它的变分推断,采样等实现,每一处都是个不小的坑。我听一位作文本的朋友说,LDA在文本分析中都跑起来特别慢,所以他一直犹豫是不是要看下去。

[已注销] 2010-12-27 21:26:50

CRF和HMM似乎从原理上是相反的(判别模型和生成模型),可是我在网上搜索关于图模型的中文资料真是不多,图书馆压根就没有~~在这之后对图模型很感兴趣,偶然在好友的PRML中发现有图模型的叙述很是高兴。真希望能早日读到PRML和PGM。

英子 2010-12-20 10:24:31

其实在PR,IR上应用比较多的一个原因也是因为这方面效果比较好吧。从效果上来看,目前相对比较好的就是图像处理中的应用了,我在关注HDP算法时,发现确实是这样的,这个Erik Xing是这么说的。再者,加上本身这些模型的计算和推断比较复杂,存在很多问题,所以无法得到更加快速和有效的推广吧。

raullew 2010-12-20 00:51:06

其实我就是因为查过Koller的应用研究,基本集中在生物、医药、CV等典型的科研领域,才会有此疑惑。而我又不做这些应用。。。我关心的是data mining的任务,这东西的问题范围极广。。。

Chen_1st 2010-12-19 23:07:52

依据我有限的知识,图模型是从多个领域里衍生出来的,比如有向图模型最经典的应用领域应该是专家系统,无向图模型可能和模式识别更有渊源。IR和PR应该是目前应用比较成功的两个领域,但对于一些图模型的研究人员来说(Koller应该就是其中之一),他们的目标应该不是分类聚类工具那么简单,人工智能的范围有多宽,他们的眼界就有多宽。但是,就像你了解的一样,人工智能的各门类的发展并不是平衡的,也并不总是高歌猛进的。IR、PR不过是商业上比较成功而已,不妨查一下Koller或者她的合作者的研究领域,看看他们具体在做些什么工作。

raullew 2010-12-19 00:40:36

我想问个问题,PGM具有比较灵活的建模能力,为什么最多的应用是在IR、PR这样的CS领域,而没有应用到更广泛的工业界、企业、社会问题中去?方法比较general,应用却比较狭窄,岂不是很可惜?是因为其他领域已经被Stat的人用别的方法做掉了吗,还是学术界不大care

Chen_1st 2010-12-09 00:31:27

mrf,crf你也用过的话那其实图模型你应该基本上都了解了啊。

图像和视频我都只是知道些皮毛

英子 2010-12-08 22:13:59

恩。熟悉了HDP,其实看着LDA相对简单些,虽然这个也不容易。但是HDP确实复杂,现在看完这个后,用的效果来看,效果并不像我想的那样好,我是想用HDP到crf和hmm类似模型中,现在也有很多人在用了,我在写综述看文章时发现,其实现在概率图模型现在用的比较好的地方也就是图像处理中了,而且发展主要是结合mrf,crf等,其实视频处理数据的应用效果也不是很好。我在用时,一直在调整,挺失望的对这类模型,但是反过来说,任何模型都不是那么好用。
而且和做文本处理的朋友讨论,HDP根本无法在文本数据中跑,太慢了,呵呵,这也是我担心的问题。我用在视频数据中就很慢。

非常佩服HDP的作者啊,真是一群牛人啊,把数学的东西整的真是转的很啊。

Chen_1st 2010-12-08 10:47:06

我觉得HDP在图模型里算比较复杂的了吧,又是分层又是非参数,我都没认真研究过。感觉你可以熟悉一下CRF, 剩下的东西就基本上都可以类推了。

英子 2010-12-07 14:11:07

恩。是啊。我在用HDP模型,用C++实现。开始时觉得算法简单,程序难。现在觉得算法难,程序简单。可用这个模型,除了对LDA等topic models熟悉一点,对其它的概率图模型结构还是不懂。真不知道PGM的作者怎么掌握那么多东西。

Chen_1st 2010-12-06 13:32:21

呵呵,的确没有电子书,我这里也没有,也别给我发邮件了

@英子:主要图模型各种变体太多,优化方法也多,弄懂一种模型可能不难,但要弄清楚各种模型之间的联系和差别就比较费时间,PGM文字太多图示和公式太少,可能是个问题,毕竟有些东西用公式或图表示会更清晰一点。另外我觉得你水平不弱啊,国内的科研水平一直在提高,和新拿到博士学位的同学比,感觉自己多学了那么多年其实并没有啥明显的优势。杯具。

英子 2010-12-06 13:05:28

在这里添上一句,关于PGM这本书,英文版和中文版的,我以及我认识的人均没有电子版的,所以请不要再给我发豆邮或者留言索要电子版。谢谢。没有任何版本的电子书,请务必看到这条信息。

英子 2010-12-06 13:02:27

恩。如此做,使得书的结构很好,但是有时候水平很弱的人,比如我,学习时会感觉每一部分都是个大坑,无法往前走。就像程序中一样,有时候一个程序通用性很强时,反而会给某个具体问题的使用带来一些繁琐和阅读困难吧。用我们这一老师说的话,Koller的书写的结构性那么强,说明作者本书的水平也很高的。能编写通用性很好的程序的人也都是高手啊。

Chen_1st 2010-12-03 17:10:19

今天写TrueSkill的日记(http://www.douban.com/note/109996835/)时想到你所说的这个书的结构问题,顺便讨论了一下:

PGM把图模型的表示和推理相分离,这样就可以做到:确定好图模型的数据结构之后,不管图模型结构怎么变,推理方法都仍然有效,不需要修改。而其他的书一般都是针对具体问题(换言之,固定的图模型结构)谈推理,缺乏这种软件设计上的易复用特性。

迪云 2010-11-24 16:24:42

额...PGM这本书你们有电子版没有???

Chen_1st 2010-10-17 15:30:34

想不到你把这个定义为笔墨战争。

英子 2010-10-17 11:47:37


我现在知道什么是笔墨战争了,也知道为何很多时候能生出那么多事了,比如我没说PRML没错误啊。所谓评价,只是一个人作为读者说一下他的读后感,但是是否客观,是否能统一所有人的思想,这些不是要考虑的内容。没有对错,没有是非。

就此打住,不再回复。如果关于这本书的内容,有什么讨论或者疑惑,欢迎大家一起讨论,这些东西一般优化解还是能得到大家统一认可的。

Chen_1st 2010-10-17 04:13:47

PRML的errta更长吧?我不是牛人,因为PGM的确不比PRML更难。相反我觉得PGM是用,PRML才是本。当然,用比本往往会更变化多端一点,但终究脱离不开本的范围。

英子 2010-10-15 18:24:18

错误是挺多的啊,我在学习时,11章后面两节中,有几个公式错误。后来翻译时,我记得13章中有一段话也有错误,这些都给作者发过邮件了,作者说后面的是BUG,说再版已经更正。这些是我发现有的,另外你可以看看作者公布的一些修改说明,errta文件,好多页呢。当然,瑕不掩瑜。
大概我们是做工科的,感觉PRML相对来说更浅显易懂,而PGM,里面太晦涩了。呵呵,看来Mahout是理论牛人。

Chen_1st 2010-10-14 20:46:50

没觉得PGM比PRML更晦涩啊,相对而言,PGM我倒觉得更适合入门。

PRML的重点是用bayes观点来阐释机器学习,虽然这个和图模型的关系如同表里,但他的侧重点不再图模型上。第八章的确讲了一下图模型,但相当简略,后面章节对这个内容其实用的很少。PGM对图模型的介绍就要全面得多了。我觉得如果你通读了PRML,没有理由会感到PGM困难啊。

这本书的结构由表示,推理和学习三部分,是图模型的三个侧面,不知道你们老师强调的重要性是什么。另外,为什么人为这本图书有很多错误呢,我没觉得啊。