你已经体验到的大数据时代_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 科技 > Big Data > 你已经体验到的大数据时代
星腾 Big Data 的书评 发表时间:2012-12-19 01:12:14

你已经体验到的大数据时代

你认为什么是大数据?如果没有仔细关注过这个领域,也许这是一个很难让人轻松回答的问题,而自己之前也没有那么清晰。但对于数据的直觉和一直以来的理解,告诉自己,如果你能掌握更多的数据,其中会有很多有意思的事情发生。

因为我们每个人都有数据在不断产生,而自己也在追踪着数据,习惯性地使用Manictime来记录自己的电脑上软件的时间,曾经一度从运营商后台保存着自己话费详单背后的电话和短信记录,有时也会打开Outlook上的插件xobni,来看看过去一段时间自己邮件又有怎样的走向,或者有什么惊奇的事情发生……而这些数据,对自己来说,当他们没有被挖掘的时候,几乎不会产生特别重大的意义。

但当我们拥有更多的数据时候,我们最重要的是从这些数据中找到对于我们有意义的东西?也许我们个人无法完成,但是已经有很多前瞻者做出了很多的尝试。

最早对数据或者信息特别有感触的时候,是看《当我们变成一堆数字》一书时,我们每个人都在产生大量的数据,而作者则在探究,我们这些数据都在被谁所用,我们自己又可以做什么?至今还印象深刻的一个例子,是通过地板上的测量仪器,随时了解在房间内的人的各项生理信息,而这对于照顾老人则极其有帮助,如果发现一些异常信息,则可以及时提醒来保障生命。

还有一篇比较记忆深刻的文章,是同人于野 的“数字如潮人如水”(http://www.geekonomics10000.com/463) 商业机构通过对每个人数据的掌握,通过自己的算法,为你提供更好或者个性化的服务,亚马逊、Netflix即是如此,其中也简单的提到了Faercast这家让消费者可以逆袭来购买到更便宜机票的公司(目前已被微软收购,整合到Bing搜索中,不过只提供美国的预测,在《大数据时代》中,作者有更多的介绍)。

后来当我们走进微博这样一个充满数据的虚拟社会时候时,通过李开复的一条微博,知道了惠普研究院正在做的研究一项,他们通过抓取Twitter的300万条tweet数据,基于情感分析,来预测一部电影的票房收入,而结果也是惊人的准确。另外时至今日,没有听到过基于新浪微博特别成熟的应用案例。(而我也相信,如果在上映前就进行预测是一件极其不靠谱的事情)

当看到更多零散的信息,让自己知道Netfix的推荐竞赛,通过Twitter不仅可以预测电影票房、预测股市、流感的传播,还有塔吉特给怀孕少女寄送相关的优惠券等等,虽然我相信这是我们不远将来会被大规模应用的事情,但还没有人说,这就是大数据时代,也许这正是大数据时代的前传。我们对数据和信息可以带给我们什么充满了期待。而这种期待,也很快随着“大数据”一词的扩散,慢慢的变成现实。

进入2012年后,大数据的呼声便开始此起彼伏,无论是科技博客,还是各种业内人士,抑或行业论坛,媒体专题,都会有大数据的相关探讨,但对于自己来说,如果没有见到一本书,或者一个非常系统的系列文章时,很难对“大数据”有更加细致的认识。

但当看到这本书时,将许久之前的些许了解都串联了起来,Viktor从大数据时代的思维变革、商业变革、管理变革三个大的角度为我们进行了阐述。

思维上,从大数据时代我们关心的是全部数据,面对如此之多的数据时,我们可以不那么热衷于精确性,在前两个因素之下,我们不再热衷因果关系,而更注重相关关系。初听起来也许觉得作者太过于绝对,而且很大程度上挑战了我们一贯固有的思维模式,但是在文中作者就大数据时代的特性充分阐释,并告诉我们为什么现在的“大数据”应该是这样?而我们可能关心的部分,又为何不那么重要,或者需要等待更久去实现。

其次在商业变革上,作者从数据的前世今生说起,我们获取的众多数据从何而来,无论是百年前的航海日志,还是到目前一切事物的数据化。而当我们有了这些数据时,又可以如何利用?我们可以将数据重组利用,还可以通过提高扩展性获得新的用途,甚至在遇到陈旧数据时,我们要有所取舍,比如推荐系统中对于较早数据的舍弃。特别“数据废气”对于提高整个系统的服务性有极大的帮助,同时也期待更多数据的开放。

当有了数据还有使用方法的时候,我们最不能忽视的就是大数据时代的大数据公司,比如Twitter这样的数据提供者,还有将数据进行分析基于数据分析能力的公司,还有一类便是基于非常出色思维的公司。而Viktor特别说的一点是,大数据时代,超大型公司占据规模优势,而小公司则独具灵活性,处在中间的公司要么进行转化,要么面对更加残酷的竞争,直至破产。

然后在管理变革上,感受最深的还是大数据时代个人隐私的控制与风险,当我们有更多的个人信息被透露时,通过大数据,我们能知道隐藏在数据背后的你是谁,甚至你心里在想谁。无论是数据的告知与许可、关键数据的模糊还是匿名处理,很多用户的隐私已经受到了威胁。当然不出意外,在现实中的例子有很多,如研究人员通过匿名数据进行研究时,我们依然可以通过一些独特的数据关联,然后定位到个人。Netfix公司的匿名数据还是被用户认了出来。在大数据时代,这个时候我们已经不能放心期待拥有数据的公司不作恶。但作者也为我们的隐私提出了解决之道,让数据使用者承担更多的责任,避免数据独裁。而这些大数据的不利影响也会随着大数据行业的发展而得到控制。

事实上,大数据的应用已经遍地开花,书中上百个例子如医疗及公共卫生行业,乔布斯通过大数据辅助癌症治疗,通过智能手机上的应用程序来监测病人的身体颤动,甚至如丹麦癌症协会通过大数据来研究手机使用是否致癌,还有微软这样的公司来分析病患的再入住率等,在互联网行业,让你非常讨厌的ReCaptcha验证码,Google翻译的进化,Zynga通过数据分析修改游戏等我们日常使用的服务及产品背后的大数据。金融行业通过大数据来鉴别个人的信用风险,快递领域通过数据来确定行驶路线,减少等候时间,政府通过大数据来找出最容易发生火灾和井盖爆炸的地点,商场通过大数据发现产品之间的关联,比如最近大家在探讨的为什么避孕套和口香糖要放到收银台附近。大数据时代,一切的一切都存在着可能,而这一切的改变我们也正在体验之中。

回过头来,再回答大数据是什么?Viktor的答案是“大数据就是我们可以在更大规模的数据上做到更多我们无法在小规模数据基础上完成的事情。”你认同吗?

很喜欢结语的那个题目,“已经发生的未来”。其实无论如何,人类总是希望自己掌握更多的数据,更加了解自己,而事实上,大数据时代,一切的迷雾都将会拨开。而这本书已经开始将我们对于“大数据”上的迷雾抹去。

引用谢文老师的一句话,这是“迄今为止,世界上最好的大数据专著”,如果你关注大数据或者关注未来人类的未来,这本书值得一读再读。

展开全文
有用 69 无用 7

您对该书评有什么想说的?

发 表

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读

对“你已经体验到的大数据时代”的回应

fangfangle 2013-10-13 12:10:57

Viktor的答案是“大数据就是我们可以在更大规模的数据上做到更多我们无法在小规模数据基础上完成的事情。

DECO 2013-06-02 16:32:29

这本书很好,内容很新颖,见解很独特,大数据时代的到来,智能挖掘数据背后的规律应该是这个时代的最大资本。数据的资本,你体会到了吗?

青莫夭 2013-05-30 15:22:01

@EricLeo,典型的tautology

星腾 2013-04-23 15:41:33

哈哈 ~@小卒#圣诞帽

种个太阳砸死你 2013-04-23 08:58:46

我晕,竟然看到你的书评了~

醉声梦使 2013-04-02 20:05:52

大数据就是我们可以在更大规模的数据上做到更多我们无法在小规模数据基础上完成的事情。

蹭蹭松饼菌 2013-02-26 16:51:02

不懂作者写的是什么

逆时针的钟Lord 2013-01-28 11:09:30

阿里的大数据在商业活动的运用,已经很不错了。
在网购的经历中,经常会遇到买大件,推送小件的情形。

EricLeo 2013-01-19 15:45:39

大数据是什么?Viktor的答案是“大数据就是我们可以在更大规模的数据上做到更多我们无法在小规模数据基础上完成的事情。”

绝对是真理,只是感觉跟没说一样啊!

葱油饼™ 2013-01-18 19:56:28

阿里巴巴已经率先为范,他们已经拥有自己的大数据工程师,根据他们的说法,现在要做的不是简简单单的通过顾客的购买经历筛选出与其相近的产品向顾客推荐,这是徒劳的,相近的产品非但使顾客产生购买欲,甚至会产生负面效果,即产生后悔感,削弱购买欲望,而是通过数据的分析,进行准确定位,在顾客已购买的商品的基础上,筛选出衍生品,最理想的状态是预测到顾客5年内需求,这需要综合多种数据的分析。

[已注销] 2012-12-19 23:31:28

统计学将迎来新春天啊!

[已注销] 2012-12-19 16:19:08

啥意思?