一本大数据的普及读物
2014-06-06
今晚无事,一晚看完了这本《大数据预测》。先来谈谈书本身的内容。这本书的作者是数据预测分析领域的专家,因此,书中结合了大量的预测分析的应用实例,并对其实例做了一定程度的分析和解读。包括金融,管理,科技,财经,运动等各行各业。比较好玩的例子有如,网页广告如何根据个人浏览记录来精准投放广告,车载系统如何预测驾驶员在分心,公司如何预测员工是否会离职,银行如何预测信用卡是否被盗刷,如何通过数据预测股市走向等。
在实例之外,作者还很厚道的提供了很多关联预测指标。比如不同电子邮件地址与购物的关系,信用程度与交通事故风险的关系,吸烟与健康的关系,法官判刑与个人情绪的关系等等指标。
此外,作者为防止一些数据庞杂,而造成分析结果出错,也通过许多实例说明正确挖掘数据的重要性,比如说冰激凌的销量与鲨鱼咬人事件成正比,总不能说吃了冰激凌的人容易被鲨鱼咬吧。
但是,此书也并非像作者所说“你想了解有关预测的所有事情,都在书中能找到答案”。首先,书中并未告诉你如何获取数据,筛选数据,使用数据。其次,书中没有告诉你分析数据的方法。而且,书中没有告诉你通过数据预测时的技巧和注意事项。因此,看完此书,你不要奢望你就可以成为“数据分析师”。
总体而言,这本书是一本好书,撇开其丰富的实例不说,这本书对于不了解大数据时代的人来看,会比较全面的了解大数据时代给人类社会方方面面的重要影响,从而对未来社会的发展有一定的预示或预警作用(以后千万别做坏事,连想都别去想)。对正在进行数据分析的专业人士而言,这本书也能在一定程度上起到“他山之玉”的作用,给自己的分析带来不少便利。
然后说说看过后对大数据的几点思考(手机输入的,请各位原谅我不详细阐述了,点到即止吧)。
1、大数据时代的到来与互联网和计算机的普及、发展很大关系。没有这两个,就无从谈及大数据时代,更无法从事大数据分析。未来,对于互联网和计算机的需求会越来越高。
2、大数据所要求的是所有相关数据分析,而不是抽样数据,因此面对每天,每小时,每分,每秒全球以几何倍数增加的数据而言,这基本是不可完成的任务。
3、大数据时代,可能衍生出一些专业的数据收集,分析行业和专业人士。大家如果有兴趣,赶紧考一个什么资格认证吧,说不定哪天就端到金饭碗了。
4、大数据时代,对个人,组织的隐私是个巨大挑战,因为,在巨大数据下,每个人和组织的习惯,动向,信息都会被分析出来。所以,正如我之前说的,千万别干坏事。
5、数据预测,随着发展,必然渗透到各个领域,如用于犯罪行为倾向预测,那“少数派报告”描绘的场景,真的可能有一天会出现在我们身边。所以,数据预测,对于社会伦理将是个巨大挑战。
by:flamy1