这个简单的书评只是我个人的观点,所以我觉得先了解一下我的背景是有帮助的:本科计算机,数学功底尚可,研究生方向机器学习、数据挖掘相关应用研究。
缺点:
1,阅读此书前,读者需要具备基本的统计学知识,所以书的内容并不“基础”。
2,书中很少涉及到公式推导,细节并不是很多。
3,对于那些想要做机器学习、数据挖掘相关应用的人来说,书中的部分内容过于“统计”,比如basis expansion和spline等。
4,部分内容介绍并不详细,例如neural network,也并没有介绍图模型相关内容。
优点:
1, 机器学习本身很多内容直接来自统计学,如回归和分类模型,所以了解这些内容在统计学中是如何表达的,尤其是较为精确的数学表达,将会非常有帮助。
2, 书中有很多作者自己的总结,也有新观点,例如第10章中“Off-the-Shelf Procedures for Data Mining”,这在其他书中比较少见。
3,关于tree和boosting的介绍非常详细,横跨第9章和第10章。可能跟这部分内容是作者的研究领域有关。
就像标题里说的,本书只是提供了机器学习、数据挖掘、模式识别等领域的统计学观点,所以还是建议继续阅读其他的相关书籍,以期达到融会贯通。
共勉。