如果你跟我一样是喜欢跟着书敲一遍代码的话
2016-03-04
诚如题目:如果你跟我一样看这种书是喜欢跟着书敲一遍代码的话,我想这本书如果你想要跟着作者把上面书中的例子全部过一遍,你是需要具备以下这样几点知识储备的。
第一.python(不只限于简单的语法,越熟越好)
第二.利用beautifulSoup这样的第三方库爬虫获取数据,并对数据进行整理的能力。
第三.经典的机器学习是算法要理解,最好是做到会推演。
第四.scipy,numpy,sklearn,matplotlib有所接触和了解,也是越熟越好。
第五.最最重要的就是要有钱配个好一点的电脑。
你看到这里肯定会想你丫这不是在黑人家吗,怎么还给个力荐呢。其实完全不是在黑,是真这样感觉的。比如第五点,书中有个用LDA对维基百科英文版做主题空间聚类的,我把维基百科英文版下下来,一个XML文档压缩包11G,解压出来40多G你电脑不好点怎么搞。说算法要理解会推演。你算法最基本的原理都不理解,就算知道调用sklearn包中的哪个函数,你都不知道函数要怎么用。爬虫和数据整合能力。恩,给你个XML文档你总要会自己把这些文档变成向量,矩阵吧。
说了这么多好像你丫的说的需要的这些能力都是数据挖掘书里培养的重点能力啊。这书这些都是不讲我TMD买来看个球啊。
如果你跟我一样是个苦逼的二流学校的小硕,一个人苦逼的在实验室敲代码、看书,周围没有什么人能解答心中的疑惑。你会发现这本书买回家后感觉就像是多了一个在这个领域的师兄,他也许不会告诉你那些入门的重要的基本功怎么搞,那些需要你自己在其他地方去寻找,但这本书。诚如书名那样--机器学习系统设计,会手把手交教你怎样一步步从数据预处理,到开始试一些简单的模型,然后调参,衡量模型缺陷,更换模型继续调参的过程。这些我想是你从那些算法书,导论书上看不到学不来的。所以这本书其实是一本好书,只是看你自己现在的段位是否有功力推得动这本书的问题了。
说了这么多了,你也许会想:你丫忽悠了这么多,你丫自己现在的修为到哪个程度了?能推动这本书吗?
我很遗憾的告诉你,对不起,我不能。。。学渣努力去啃这本书的剩余部分(居然还没看完就来评论),然后赶紧补上面的五种能力,哦不,是四种能力(穷逼没钱升级电脑= =)