在网络公司,又是做跟数据打交道的事,接触到很多舍恩伯格提到的内容,花了3小时扫了一遍《大数据时代》,对以往零星的感受算是作了梳理。
大数据时代的三大特征:
不是随机样本,而是全体数据;
不是精确性,而是混杂行;
不是因果关系,而是相关关系。
对于三大特征,深有感触的在于
1、如舍恩伯格提到的,依托于统计推论的问卷调研,往往需要比较明确的研究假设和精确的执行,因而更多带有验证性的色彩,相对来说,大数据下,不同的数据组合,常常能够发现很多意料之外的内容,从而推进创新性的运营方式。
2、在大数据的背景下,相关关系往往足以支持决策,这是对于社会科学的巨大颠覆,或者说是巨大的进步,以前经常说社会是很难以捉摸的,虽然社会学甚至更标榜自身科学性的经济学,其理论都只能解释社会行为的一小部分内容,因为社会足够复杂,无法还原完全的因果关系。但是,当数据足够大时,这种对于社会现象还原完全因果关系的可能反而在一定程度上成为了现实,A行为后会有B行为,我们无法分辨出具体的因果,但是它就是事实。不过,从自身的经历来看,虽然相关关系足够重要,但还没有发展到可以放弃因果关系的程度,很多数据现象的发现,还是需要通过调研去细化并确定方向,目前的数据处理能力还没有到能够帮人做具体行动决策的程度。