1 基本上把mapReduce的思想讲清楚了,hadoop更多是使用方面的。基本上看个前三章,就能对mapreduce和hadoop有基本的理解。
2 它其实还没有严格来区分mapreduce和hadoop,根据我的理解。mapReduce是一种算法,一种思路。hadoop则实现了这种思路。为了应用这种思路,需要实现很多外围的功能,比如网络传输,任务分配等。这些内容hadoop都已经做好了,所以非常方面用它来实现自己的目的,只需要写自己的mapreduce的应用程序即可。
3 mapreduce的精髓个人认为是,把数据分布存储,然后用分布的机器各自计算这些存储数据,最后再合并统计。这样就实现了用多台廉价机取代单台昂贵机的目的。
4 hadoop目前不支持windows,只支持linux和unix,有条件的支持mac os。