这本书重点介绍了分类(监督学习)、特征提取、聚类(无监督学习)这三个部分,每个部分都很详细介绍了各种方法。
比如在分类中,就有贝叶斯、神经网络、支持向量机等方法介绍。另外还捎带介绍了马科夫、隐马、条件随机场等上下文相关的分类方法。
特征提取中,介绍了较多的特征选择的原理以及方法,稍显不足的是没有针对性不足,比如文本分类的特征提取方法,如TFIDF、信息增益、互信息、开方检验等。
聚类中也介绍了不少方法。
总之,如果研究机器学习方面,买一本,经常看看,经常琢磨是非常不错的。但是,这些方法应该同实际结合起来,在实际的应用中,简单的方法往往是最可行的,这点需要注意。