1. 代码排版不够清楚,特别是长代码,缩进不太看得清楚2. 文中有许多下载的原始数据,由于是国外的网站,自己下载不仅会遇到网站无法打开或者打开慢,或者原始链接指向的文件失效,有一定难度且浪费时间,不过网上有原始数据及源代码,可以百度搜索一下3. 适合有一定基础的人,不适合初学者4. 里面涉及到好几个python包例如re(正则匹配法),beautiful Soup(网站解析包)等。需要对这些包有一定的了解