文/飞熊
提到大数据,我会想到数据挖掘,想到那个著名的尿不湿和啤酒的故事。这是我的第一感,也反映了我个人阅历的限制。我想,看这篇文字的人,不一定知道数据挖掘,也不一定知道我头脑中那个尿不湿和啤酒的故事到底是什么。当我们读完这本《决战大数据》时,我也有类似的感觉,我发现我有很多不知道,很多不清楚,甚至连作者想表达的核心是什么,都非常模糊。
本书作者车品觉是阿里巴巴的数据委员会的一把手,我丝毫不怀疑他对大数据本身的理解,还有在大数据实践方面所作出的努力和取得的成绩。但是,我对他著书立说上的能力,深表怀疑。这本书不是写给普通读者的,在这些很像工作札记的文字里,缺少一个相对清晰的结构,对基本概念介绍的忽视也为我们的阅读设置了很多人为的障碍。
何为大数据?如果作者对这个核心概念都不使用一个完整的篇章去介绍的话,其他围绕这个概念的论述都显得非常乏力。
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流 软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极 目的的资讯。(在维克托•迈尔-舍恩伯格及肯尼斯•库克耶编写的《大数据时代》中大 数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法)大数据的 4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、veracity(真实性)。
这段话来自于百度百科,而在这本讨论大数据商业应用的书中,却没有完整的段落来介绍基本的概念,更不用提大数据的内涵和外延了。
作者反复强调的是他的六字真经——“混通晒存管用”,确实为大数据的商业应用提供了一定的借鉴价值。但总觉得有什么东西云里雾里的,没讲透。