一本较综合的收集了网络相关知识的入门书
2010-12-30
虽然是最近才出的一本书,里面涉及到知识大部分可以在网络上找到,如第一章后面列举的爬虫,就有同样的英文文档,而且是很早以前的,作者根本没有自己去做些分析。第二章的bigtable,consistent hash都是现有论文或文章。
书中大段的代码其实也是没必要的,光盘里都有,书的内容应该更充实,比如爬虫的性能,主要技术(书中谈到了单线程非阻塞和多线程阻塞,然后就拿java的selector,threadpool来简单的说一下),错误恢复,增量更新等等,这些都没有深入的讲解,也许作者本身在这方面作的研究和实践也是有限的,我感觉要花更多的时间去深入的摸索一下,然后再来写这样一本书会好些,而不是打着“国内第一..."的旗号来急于挣钱。
作为在校学生,有兴趣了解这一方向,发一到两个星期时间来读完这本书也是可以的。