互联网时代的浮夸风_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 科技 > Big Data > 互联网时代的浮夸风
陈辑熙 Big Data 的书评 发表时间:2015-11-25 21:11:58

互联网时代的浮夸风

    这是个浮躁的时代,任何一种新的经济现象初现端倪,都有一群狂热分子立即将其贴上“颠覆”“时代”的标签,仿佛不这样做就无法吸引眼球。所以,前有O2O时代,后有共享经济时代,现在有大数据时代。这些“时代”把读者弄得晕头转向,以至于已经无法分辨自己究竟处在哪个“时代“了。
    不过,我的书评标题还是出现了“时代”的字眼:第一,这是我认可的一个关于“时代”的概念;第二是我觉得大数据经济终究的互联网时代的一个产物,它无法颠覆互联网时代,而只能依附于互联网时代;第三是我认为大数据之所以能“建构”一个“时代“,是互联网时代浮夸风盛行的结果。怎样的经济现象才能算得上是一个时代,我没有去查询相关资料的标准定义,因为这个时代的标准在不断地被改写。但我觉得一个经济现象必须已经渗透到我们的日常生活的方方面面,才算得上是创造了一个时代。互联网是,移动互联网也算,O2O还有待观察,但是至少共享经济不算,大数据不算。
    本书首先的一个大问题是没有回答“大数据“是什么。从引言开始作者就大张旗鼓地鼓吹大数据给我们生活、工作与思维带来了一场大的变革,然后开始举出各种例子来论证这个观点,但是纵观这些案例,我们遗憾地发现,在大数据的舞台上,始终只有几家著名的互联网公司翩翩起舞,这个舞台和普通人几乎没有直接关系,至少目前是这样;更遗憾的是,引言里所例举的这些例子,在后面的章节中被反复提及,作者似乎也难以想到更多更好的案例了。
    本书结构非常清晰,主要是从思维、商业和管理三个方面介绍了大数据带来的变革。
    第一部分,思维方面,作者认为大数据有三个特点:更多,即可资利用的大数据本身不是随机样本,而是全体数据;更杂,即我们在运用大数据的过程中不再追求精确性,而是混杂性;更好,即我们从大数据中得到了结果不是因果关系,而是相关关系。
    首先是“更多“。的确,互联网科技的发展,为我们储备了数量极大的数据,并且还在不断爆发式增长。但作者对于”更多“的定义是:不是随机样本,而是全体数据。而全体数据又有”全面、完整、系统“的特点。我们能利用的数据真的是”全体数据“吗?实际上,数据的全面性和完整性是个伪命题。数据化意味着我们要从一切太阳底下的事物中汲取信息,甚至包括很多我们以前认为和”信息“根本搭不上边的事情。(P20)姑且不去讨论这种数据化方案的可行性,但至少可以预见,这一方案在很长一段时间内是难以实现的,甚至是根本不可能实现的,因为我们不会、也无需把我们个人所有的行为都进行数据化。近些年可穿戴设备所遇到的发展瓶颈,已经是最有力的证明。
    其次是“更杂“。大数据中数据种类极多,更杂也是发展的必然趋势。但作者对此的判断是,在许多技术和社会领域,我们更倾向于纷繁混杂,混杂性不再是我们极力避免的东西,而是一种标准途径。(P58)但现实其实是,面对数量庞大、种类极多的大数据,依目前的技术,我们仅仅能从其中提炼出一些宏观层面的的有价值的信息,大数据的巨大价值依然没有被挖掘。但这只是局部,而非整体;只是现状,而非趋势。在我们通过混杂的大数据提炼出一些有价值的信息并获益之后,作者沾沾自喜地认为,这就是大数据的全部,而我们也无需再追求精确,而应该走混杂性的标准途径,这种思想观念和”更好“中的“改变对因果关系的追问,转而追求相关关系”如出一辙。正如作者所言,数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。这个判断是正确的,但是如果我们按照作者所说的,不追求精确性而走混杂性的“标准途径”,不追求因果关系而只关注相关关系,那么我们能看到的,将永远只能是大数据冰山的那一角。
    最后是“更好”。大数据价值极大,自然能带来“更好”的价值。但作者对于“更好”的阐释是“不是因果关系,而是相互关系”,我们只需要知道“是什么”就够了,没必要知道“为什么”。这种观念在前文已有批判,此处再补充一段译者的“心灵鸡汤”,也是我非常认同的一段话:“从小处讲,作者试图避免的’数据的独裁’和’错误的前提导致错误的结论’,其解决之道恰在于挖掘因果逻辑而非相关性;从大处讲,放弃对因果性的追求,就是放弃了人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落。如果未来某一天计算机完全接管了这个世界,那么这种放弃就是末日之始。“的确,我们应该让数据自己“发声”,但是我们自己也应该说话;我们应该追求相关关系,但更要追求因果关系。没有因果关系的相关关系,才是真正的“伪相关”关系。只追求相关关系而放弃因果关系,非常可怕。
以上三点,更多、更杂、更好,可以看成是作者对大数据特点的判断。作者在极力描绘大数据变革的未来的同时,眼光却始终停留在大数据发展的现状上,甚至把现状当成了未来。
    尽管第一部分的论述乏善可陈,但是已经算是全书精华了,因为后面的论述更是不堪一击。
    第二部分,大数据时代的商业变革。其实全书分为三个部分并不算准确,因为每个部分的标题和内容不完全对应,但也许这正是作者追求“混杂性”而放弃“精确性”的实践成果。
    首先是对数据化的阐释。这一章很关键,甚至可以看成是作者对于大数据概念的一个姗姗来迟的解释。作者在这一章里提出了两个观点:第一,量化一切是数据化的核心。但是除了“文字”“方位”“沟通”这些我们已经实现数据化并且高度成熟的领域(例如搜索引擎为代表的文字数据化,在线地图为代表的方位数据化和各种社交软件为代表的沟通数据化)之外,作者也难以再想到别的可以数据化的东西,转而用空洞的“世间万物的数据化”来概括。作者甚至认为“很多人对’物联网’有着宗教般的狂热……其实不过是一种典型的数据化手段罢了“。原来我们致力于”物联网“,不是为了生活的便利,而是为了数据化。第二,信息技术变革的重点应该转向关注信息本身而非技术。从现实上来讲,数据化已经是一个既定事实和必然趋势,但在利用大数据的技术手段方面,我们还很薄弱。从理论上来讲,数据化需要技术,而大数据的利用更需要技术。所以无论是从现实还是理论层面上来讲,这个观点都是不成立的。正如谷歌的首席经济学家哈尔•范里安所说:”数据非常之多而且具有战略重要性,但是真正缺少的是从数据中提取价值的能力。“(P161)我想,作者之所以形成这样的认识,归根结底还是前文所说的”让数据自己’发声’“,而放弃了人类的话语权。另外,作者之所以只关注相互关系而不关注因果关系,某种程度上也正是因为技术的不成熟,难以探知因果关系,而并非因果关系没有价值。
    其次是对数据价值的梳理。这一章比较清晰地从数据的再利用、重组、可扩展、折旧值和数据废气、开放数据等角度为我们梳理了数据的价值,视角独特而新颖。不过,结束全章的阅读之后,依然只能看到大数据的“冰山一角“。
    最后作者认为在大数据时代,数据、技术和思维会形成三足鼎立的局面,认为如今我们正处在大数据时代的早期,思维和技术是最有价值的,但是最终大部分的价值还是必须从数据本身挖掘。作者为了说明数据在三足中是最重要的一足,特别强调了微软收购数据拥有者ITA Software公司的价格(7亿美元)要高于数据分析者Farecast公司的价格(1.1亿美元),但它却忽略了这件事情发生在其所谓的“大数据时代早期“,而他同时又认为大数据时代早期思维和技术是最有价值的。笔者认为,大数据时代数据、技术与思维的价值链要素是存在的,但讨论其角色定位并无太大意义,因为他们往往是一体的,即便不是一体的,也可以像微软一样既收购数据公司又收购技术与思维公司。
    第三部分主要讲了大数据时代的风险和应对措施。隐私保护问题的确是我们面临的一个主要问题,作者提出的建立更着重于数据使用者为其承担责任的的隐私保护模式非常新颖,但可行性有待检验。“预测“与”惩罚“问题有点儿杞人忧天,因为首先大数据没有如此精准的”预测“能力,作者不是也一直强调走混杂化的标准途径而不追求精确化么?而即便能够精准预测,也很难想象人类会基于对个人未来行为的预测来进行罪责的判定。数据独裁问题,作者其实说的只是”数量独裁问题“,和大数据没有太大关系。
    综上,这本书最大的优点,就是告诉了我们,大数据时代还没有到来;当然,对我而言,最大的优点是告诉了我,大数据时代不会到来。这本书最大的缺点,就是其中体现的价值观念,会让我们这个社会变得更加懒惰、肤浅和浮躁。

展开全文
有用 1 无用 0

您对该书评有什么想说的?

发 表

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读