该书特点:以实例为重,给出了常用算法的伪代码,和《模式识别》、《模式分类》等专著比起来,该书略去了各个定理的证明部分,并通过大量枚举具体的分类实例,来简要说明算法的流程和意义。
根据个人的体验,觉得这本书作为第一本数据挖掘的入门读物是再恰当不过的了。任何想深入讨谈分类、回归、相关分析或者预测的问题,无论你想使用的是神经网络还是支持向量机,还是最原始的贝叶斯分类器,这本书都提供了一个比较完整的该领域的轮廓。
虽然对于具体的分类器和算法的分析浅尝辄止,但是该书最大的优点是能让初学者以最快的速度总览全局,掌握该领域的基本要点,而且该书对于数学和统计的相关概念,是我看过的相关书籍里要求最低的,高中生应该都能看懂的。
当然,对出版社的鄙视也是必须的,因为无所谓“完整版”只是把之前06版阉割的那么几十页附录,放回去了罢了,这本来就是应该的。而内容与06版本无差别,就是翻译的06年原版。对于翻译,个人还是略有微词的,就是无论怎样,至少在第一次提到某个术语时,应该引一下英文,这点不光是这本,应该是所有学术类翻译专著的通病,既然用了黑体字强调术语,就应该同时再给出英文。很多这种地方,都没有补上英文。就这本书而言,整体的翻译质量还行。
最后,该书的纸张和装帧还是不错的。封面保留了英文原版,这点比几个影印版好看许多。
搞数据挖掘的可以收一本,我个人觉得看这本中的伪代码和图片示例,比从其他很多专著里漫天公式中找代码书写思路容易许多。