内容全面,但比较简略
2013-11-12
这是一本从数据库角度阐述数据挖掘的书,主要关注从商业数据库的大量事务数据中寻找有用信息的各种方法。数据库和大数据是贯穿全书的核心。
全书大致可以分成两部分。前一部分重点是数据仓库的构建以及在此过程中的数据整合与化简,对于数据库的设计与数据整理很有启发,但是没有数据库基础的人读着挺难的。后一部分则对几种常规数据挖掘任务,如比较、分类与预测、关联、聚类等进行介绍,对部分简单的算法给出了伪代码描述,同时也对应用于大数据的和复杂数据的算法进行了介绍,总的来说内容全面,逻辑清楚,但是有些地方比较简略。有数据库基础的人可以拿它入门,但是要更深入的了解算法还需要深入阅读。