不要太过迷恋大数据_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > > Big Data > 不要太过迷恋大数据
夜晚的书斋 Big Data 的书评 发表时间:2013-05-13 09:05:39

不要太过迷恋大数据

朋友推荐了一个智能电台,说是会记录我的喜好,播放我喜欢的音乐,刚开始用觉得好,过了一段时间,我感觉对“自己”都厌倦了,但这个电台仍一如既往的播放着属于我的风格,我想听点新鲜的东西,想换个风格尝试一下,但在它的推荐下绝对听不到。

我真的很佩服这个电台对我喜好的分析,它比我自己还要了解自己,它记录了我的全部播放记录,每一次的选择操作,它得出一套“完美”的个人收听方案,并用一首接一首你所熟悉但也熟悉你的旋律印证:这就是一个“音乐”的你。

生活在大数据的时代,也是有点苦恼的。你在互联网上的每一步操作,包括浏览、点击、评论、购买等行为全部被记录下来,甚至你的身体状况、病历史、信用记录等个人信息也被传到网上,对你来说,不只是建立了一份电子档案,而是一个“生存在互联网上的你”被完整的克隆出来。重要的是,这些克隆人全是由一组组详实的、可供分析解读的数据基因组成——这便构成了我们所称之为的大数据。

世界大数据专家维克托•迈尔-舍恩伯格(Viktor Mayer-Schonberger)曾说:“大数据的核心就是预测。”智能电台向我们推荐的音乐、购物网站推荐的图书、新闻平台推荐的每日要闻,这些类似的应用都是一种预测行为,它们对我们的数据基因进行分析,然后预测每个人的兴趣爱好,再从内容库中搜索、呈现相应的内容。这只是一些简单的,看上去对我们的工作和生活比较有利的预测。但是,当它预测我们可能会生病而不让我们买保险,预测我们有可能拖欠还款而无法贷款时,情况就不那么乐观了。

对我们来说,生活在大数据时代,危险性已经不只是隐私被泄露,而是你的行为被预知的可能性。当这个大数据足够庞大时,那个互联网上由一组组数据基因构成的克隆人便基本上代表你的意志。所有关于你的操作完全是按照它的标准去选择,已经由不得你了,正像一开始谈到的那个智能电台,播放的音乐已不再属于我,而是那个克隆体。

可能有点危言耸听,不过现在的数据专家正在尽力解决这个问题,大数据毕竟不能凌驾个人意志之上,终归还是要以人为本。我们人类有一种本能就是忘记,随着时间的消磨,忘记可以冲淡一些伤痛、可以宽恕一些罪行,还可以让我们只记录下最美好的时刻,从而体会到更多回忆的乐趣。但是,大数据显然没有忘记这项功能,每个人的信息,而且是全部的信息都会被记录一生一世,哪怕这个人曾有过一些污点,却像烙印一般,始终不能清除。

因此,舍恩伯格呼吁大数据应该具备“遗忘”的美德,并不是所有的信息都要记录,很多数据需要不客气的删除,这才是真正的大数据安全解决之道。

其实,大数据的工作重点在于预测群体的动向,而非个体的选择;它更多关注的是宏观的走势,而非微观的变化。很多适用于群体的数字和概念,遇到个体便失去意义,例如预测某地区被流感传染的概率是10%(每100人中会有10人被传染),但对于个人来说,他得病的概率要么是0,要么是100%,并没有什么中间值。大数据的采集虽然来自于个体,但它的应用应该远离个体、尊重个体,这也是对个体一种有效的保护方式。

很多时候,我们对大数据的应用也并非那么畅快。大数据的思维方式是相关关系,而非因果关系。由于机器学习的操作,大数据通常告诉我们“是什么”而非“为什么”,通过大数据,我们由A得到B,其背后的逻辑关系是看不到的,我们会看到多个现象、多个结果,却不了解其间的过程。这是对人类思维方式一项挑战。人类思维的重要特点是自动引发联想,从而寻求事物之间的因果关系,这就是思维的乐趣,也是人类拥有智慧、富于创造,不断深入认知世界的原因。

大数据代表的是全部数据,我们能得到的永远只是部分,有限性是人类的一种局限。大数据的便利性在于提供了更多的渠道来源,更多的选择,由于各项资源的有限性,我们只能选取最重要的数据为我所用。我们之所以发现统计学,也是从有限的样本中进行分析统计,得出相对精确的结果。大数据可以增强样本的随机性和客观性,但并不代表我们就要获取全部的数据。

况且,世事无常。大数据的预测性也便带来了它的局限性,它不会算出意外,不会算出运气。而我们这个世间有太多的无法预料,我们会有意想不到的惊喜,会有一见钟情,会有怦然心动,人与人之间的交流会带来各种各样的情意与乐趣,这些自然是大数据体会不到的。

展开全文
有用 5 无用 0

您对该书评有什么想说的?

发 表

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读