如果不是此书,我不会意识到数据大潮竟如此这般排山倒海来袭。
因此越看,越是触目惊心;越看,越觉得确有此事。
谷歌的线上图书馆计划原来是为了完善搜索与翻译系统;亚马逊用大数据相关推荐替换掉了写作团队推荐;纽约市的大数据分析团队通过数据分析找出了最危险的非法改造房……这一切,我们以前不曾注意到的一切,都在提醒我们——接下来的世界,必将由大数据改造。
作者对于大数据的三个观点更能给人以启示。样本=总体,精确渐变为模糊,因果性让位于相关性。科技的发展让调查样本=总体变成可能,样本规模的变大也极大地避免了偏差的产生。而之前由于样本容量有限,对研究结果精确性的偏执,在样本容量呈数量级增大后的今天变得不值一提。强求因果,也许只是牵强附会。相关也许就足够说明问题。一如搜索“流感”不一定是自己得了流感,也许是身边有人有流感症状。
想想看,在不久的将来,通过大数据预测未来成为一种普遍施用的技术,会怎样?人便将登上“懒人成就”的最高峰——连做决策的必要都没有了。大数据会为你通盘考虑,然后告诉你最好的方案是什么。从此,决策者的名字将恒定为大数据。而那些没有使用大数据的人、组织,都会因为决策中难免的选择了次优或差的方案而输掉比赛,从而被淘汰。
最后便到了大数据的弊端。在公共领域,人的隐私被公然侵犯;在法律方面,人的自由被剥夺——通过大数据对人行为的预测,人的意图昭然若揭,人在犯罪之前就会被运用大数据的警察抓住;在人的发展方面,人类的进化将停滞不前——人的决策权被剥夺,再也无需自己思考。正如核武器,大数据在被发明之前,人类还没想好怎样处理它所能带来的危害。看到这里,让人不禁毛骨悚然。
最后用书中引用的一句话来结束:凡是过去,皆为序曲。大数据到底会给我们造成怎样的影响,现在谁也无法定论。但是,可以肯定的是,大数据时代绝对是人类绕不过去的必经。