在这个大数据时代,管理海量数据是必备技能,也是数据挖掘、数据统计分析,信息检索与数据化运营的基础技术,这本书作为斯坦福大学信息检索和挖掘课程的首选教材,重视理论和实践,深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面。其最大的特色在于不仅仅满足信息检索理论学习的需要,更重要的是给出了实践中可能面对的各种问题及其解决方法。
印象中,很多人都盛赞过这本书,Infoseek公司创始人Steve kirsch甚至称“对每个希望掌握大规模数据处理的从业人员来说,这本书是一本圣经”因为“作者的这项工作令人赞叹,他们已经把近5年内信息检索研究界最令人瞩目的成果写进了本书。”
对于每天面对的海量数据,第一个挑战莫过于如何有效地存储数据,第二个挑战是怎样通过关键词搜索的方法来提供快速访问信息。在这本书中详细介绍了如何面对这些挑战,读后真是受益良多~!