这是一本很棒的,不对,是非常棒的数据分析的入门的书,前面有书友说评论这本书说得太简单了,但我觉得作为做来一本非常好的入门的书,也就是真正意义上的深入浅出,要做到两点,一是简单易懂,二是系统全面,而这本书确实很好的做到了这两点的平衡。
简单易懂就不多说了,整个书的排版样式虽然有人说占用的空间很大,但是图片和表格确实更容易让人理解。而且在每一章节里面都采用了三折式的表达方式,即引入问题->初步解决->解决不对(或者有新的问题)->再次解决。这种类似侦探小说的写法确实很容易吸引人看下去。其它更多的细节也体现了这一点,读者可以用心体会,其中对我收获最大的是动动笔,建议大家都先自己做做再看答案,收获会更大一些。
关于系统全面,整个书从数据分析的基本过程:确定问题->分解问题和数据->评估数据和问题->组合产生结论开始。
比较系统全面的介绍了数据分析基本概念以及做数据分析的一些理念和主要方法,如实验、假设校验,启发式的做法,合理的误差。虽然每一部分都很简单,如优化只有线性规划,图形表示也只有散点、直方等常见的图,回归也是主要介绍了线性回归,好像数学都只介绍到了线性这个级别。
不过这本书最系统的在于培养或者说希望介绍的数据分析的系统性在于,让你知道什么是数据分析,数据分析能够采用哪些方法(数学的、非数学的),而且不是为了数据分析而分析,关键在于心智模型,在很多时候,数据分析是为了解决实际问题,在无法做到理想的分析时,如何退而求其次来转化并解决实际问题。这部分内容在我看来是这本书当得起深入浅出这四个的真正关键所在。
书的主要内容fitree已经介绍过了,就不再一一详述,说一些各章节的主要感受,以供后来者参考。
第3章,最优化里面提到的最优化的结果出来以后,市场上根本卖不动。启示:
1 数学最优的东西并不一定是实际最优的,在优化的过程中,实际的因素远比数学本身重要,适度可行的优化比数学上最优更有意义
2 优化模型本身一般来说很难完全与现实世界一致,那么优化更重要的不断将结果与现实做比较,从而校正本身,能用的才是好的。
第5章启示:
1 实际问题的分析可以简单并凑效
2 更多的信息收集才是王道
第8章启示:
在无法采用大量的数据来证明自己的观点时,采用简单的启发式效果可以以一种简单的方式达成目标
第9-11章:
这本书里面最不适合的案例可能就是这个了,感觉与实际情况很不符合,不过瑕不掩瑜,只是为简单的说明线性回归和误差的问题。
其它的就没有什么了,总之,这是一本好书,哪怕你看完一遍以后再也不看了,也值得花一两个小时好好读一读。