1. 这本书的价值是提供了一系列有趣的「实验作业」和「对应的数据」,以及乱七八糟的 Python 代码,迫使读者在同样数据集上自己写一个更好的。
2. 作者的 Python 代码写得真的真的很渣。
3. 作者的 SVM 写错了,不是 Platt 的原始 SMO 算法,里面的 error cache 形同虚设。
4. 里面用的 Yahoo 位置的 API 已经过时了,建议用百度的玩。
你好,此书中svm章节中介绍了简化SMO及完整SMO算法,书中有说error cache在完整版SMO算法中的作用,不知道你所说的'形同虚设', 是不是指简化SMO算法中的error cache? 我看了下Platt的原始论文,《机器学习实战》中的完整版SMO算法 与Platt的原始SMO算法的差别 应该是对于eta=0 的处理上。刚开始接触这些,所以好多糊涂的地方,希望能多多指教。
作者是用伪码的思维来命名的,让不熟悉python的读者也能看的懂,本来就不是为了教人怎么用python的
如此巧妙的命名方式,站在读者的立场思考问题的思维,居然被说成是代码写得真的真的很渣。。。虽然隔了2年才看到这本书,还是要反驳一下
分别看。机器学习就看偏理论的,例如 Bishop 的『模式识别与机器学习』,Python 就看纯编程的,结合 Numpy 等的文档。两者结合起来的书既缺乏理论深度,又缺乏技术精度,纯娱乐的。
@springjava 各种啊,完全不是 Python 的写法,命名法不符合 PEP8 的标准,很多算法都有更紧凑的表达方式(比如 list comprehension),而且 SVM 彻底写错了,我查到算法的论文自己实现了一个。