比较全面的学者思考
2013-08-05
大数据时代:
最让人感到惊艳的想法
1. 相关性代替因果性
有了海量的计算能力,加上数据库之间的互相的交叉应用,可以更方便的发现两个变量之间的关系。换言之,可以用简单的尝试-犯错的方法,尝试不同数据间的关系,用一个个模型来代替“前大数据时代”的一个个猜测。
2. 预测的可能性
因为对每一个个体具有了长时间的数据跟踪,可以发现其选择偏好,从而,对其行为进行预测。同时,也有可能对一个个地区进行长时间的数据跟踪,根据跟踪的结果进行预测。因为具有了很长时间的数据,和数据的多数的维度,因此,预测的可能性大了很多。其中最重要的,一个是对于以往不能量化的指标的量化统计,包括历史信息;另一方面是对于以前有处理难度的东西进行的处理,对大量数据的处理的能力。
3. 对数据和数字的区别
数字是指被我们记录下来的各种信息,而数据则指代可以被我们进行处理的信息。利用各种各样的传感器,我们可以利用各个类型的数据;利用对于文字信息的处理,我们可以获得文字的数据化。从而达到对于这个世界的计算。
4. 对于行业的研究
作者对于行业的研究,现实对于大数据企业,可以分为数据供应商、数据分析商、数据创意商,第一个是所有的平台,第二个是实现目的的手段,最后一个是要实现的目的。相比之下,后两者都可以替代但前者则具有行业本身的垄断性,因此,会得到很大一部分利润。比如针对个人用户的信息收集,一个领域可能只有一个,比如facebook,比如twitter。而创意就和现在的普通的做app的小公司一样,利用一个点子,进行创意或者死亡。但估计问题是小公司获得大数据有很大的难度,最后只能依附于大公司。
5. 对于伦理的讨论
对于伦理的讨论有点老套,可能和传统的哲学和犯罪学有点相似吧。不能依据人的意识进行罪行推定,只能依据行为进行判断。同时,对个人隐私的保护要求公司对信息的保密,但到底什么程度才算是人真正的隐私,本身就是很难判定的。要求公司定时删除数据的想法虽然有意思,但实际上操作很难,毕竟,储存数据的成本过低,几乎没有意义。