未来的世界_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 科技 > Big Data > 未来的世界
Little Lu Big Data 的书评 发表时间:2013-10-07 05:10:29

未来的世界

一、 缘起

在读这本书之前我已久仰其大名。先是年初在某通信行业it部门小头目那儿看到他在看这本书,说是上级领导发话的,行业内的都要看一看。年中又去一个金融单位,一It部门的头头说,中央主管部门的领导推荐了,让大家都看看这书,单位买了好几十本,人手一本。这本书在社会上也火了很久了,各网上书店热卖。但这些都不为我所动。我又懒又固执,对各种畅销流行的东西条件反射地抵触。

真正触动我的是这样一件事。前阵子我上了一次很久很久没上过的QQ,一登陆QQ竟然推荐给我一系列的人,好像是说“这些人你也许认识”。我一个一个点过去,他们全是我的同学或相识的校友,尽管他们并没有用真名或者并没有填毕业院校(我也没有),但QQ系统准确的判断出我是认识这些人的。我一个一个加了过去,越加越有一种恐惧感。对于这个QQ的推荐系统我唯一能想到的是它应该是通过好友比对找到我认识的这些人,但其精准程度着实吓了我一跳。

这让我有一种紧迫感,必须要搞清楚大数据究竟要怎么闹腾,因为显然,它很轻易就触到了我真实的个人信息。



二、 读后感

仅就这本书而言,读后的感觉平平,并不象推介词鼓吹的质量那么高。

书中的观点很简单:因为现如今技术发达,我们不必再像以前那样捉襟见肘的吝惜存储,我们可以收集一切数据来做全量分析。而这样下去的结果是,在这个所谓的大数据时代人们不会再过多追求精确度,不再关心事物之间的因果关系,而是在乎通过数量关系推断的相关性。

这样的观点我不认同。

通篇看下来,作者唯一的依据是大样本,取全量,他因此而批判以往的统计学家的工作,甚至否定数学毫无道理。

当我们收集更多的数据就可以得到更精准的预测,因此就批评统计学家以往的工作,这是无稽之谈。即便按作者的说法,过去以抽样的方式那也是由于客观条件限制,那关统计学家何事?从抽样到全量,统计学家们所采用的分析方法根本无需作任何变化。而且世界进入如作者所言的大数据时代,统计学家的工作不是被抹杀而是变得史无前例的重要吧,因为一切都依赖于统计结果,一切都用数据说话。

他的说法让我猜想他也许只是一个it业的吹鼓手,一个趋势预言家,而非严谨的科研人员。

再者即便如作者所言,大数据时代将摧毁因果关系,取而代之的是相关关系。好吧,即便如此,遭受到毁灭性打击的应该不是数学,而是物理、化学、生物、医学这些具体科学。数学研究的可不主要是因果关系。

再看作者关于精确度的论调。作者一边鼓吹使用大数据,因为扩大样本容量会提高精确度,一面又宣称大数据时代人们将是不再追求精确而更多的接受模糊。精确、模糊,你到底是要哪样啊?让我来解析一下这些文字背后的本质吧。样本容量的增大可以提高准确度但不可能达到100%(再多的历史数据也只能推测未来,谁能确定未来呢,又不是上帝),而这种分析数据的方法,是一种名曰统计的方法,统计分析是一种数学方法,数学是研究数量关系的,用数学的方法只能的到数量关系(相关性)当然得不到因果关系。

作者通篇在晒全样本的优越感,这也值得怀疑。即便我认同全样本分析得到的结论一定优于抽样,这里仍有个效率问题。譬如以前的抽样预测准确性可达到90%,启动大数据后可使准确度能达到98%以上,仅就准确度而言是大数据优秀,但如果加上数据收集和处理,哪种方式会更经济高效? 这个结论恐怕就不好下了。

作者认为,以目前的存储分析能力将有史以来的数据都保存下来是小菜一碟。好吧,人类有历史几千年,数据量不大存储容得下,但地球据说已有几十亿年历史了,在亿年单位面前,不知作者的存储还足够大么?我在2000年的门口去担心亿万年后的事,有点杞人忧天了,但想想电的使用不过百年,废旧电子产品带来的环境污染难以消除,以这样的速度推算,大数据带来巨大数据垃圾应该不会太久吧。


三、 大数据时代,消费者如何招架?

不管你觉得有多少疑问,摆在眼前的现实是--云这东西已经在各大小科技公司如火如荼的搞起来了,很多人都已经用上了云。商家心急火燎的推广云系统很容易理解,掌握了用户信息就能最大程度的控制用户,控制了用户就等于控制了市场。在这方面最好的例子是QQ,它的庞大用户量是它最大的财富,这样的用户基础使它可以做任何事。QQ之后还有谁能和它拼用户量的?大概只有搜索,可搜索不记名。站在了云时代的门槛,我才真正体会到那个 no evil的深意。

我想读这本书真正兴奋的是商家们,新一轮的市场将被启动,又可以再薅一轮用户的羊毛了,而且这次他们将象如来佛一样牢牢地把用户抓在手心。而作为一名微小的用户的我在读这本书时一直在问自己,云时代我要如何防守?

首先的担心是将来除了云系统没的选。从互联网诞生至今大家身在其中玩的不亦乐乎,但很大程度上,用户一直处于被动接受的地位,商家创造市场。如果所有的商家只提供云系统,那你还用不用?

一旦用户将个人信息注册入云系统,你的网上行为被收集,用户就彻底处于待宰状态,从技术角度来说商家可以为所欲为。那么用户该如何才能不被云商控制呢?我所能想到的只有从法律法规的角度来约束商家,技术上是没救了。前几天我给一通信业大佬的某系统的管理员发信息,由于长期为使用,我的用户名和密码都忘了,系统登不上。报上姓名后,管理员很快给了我用户名,还有密码。我在口头谢过他后,心里确很不爽,这个系统密码竟然是用明文保存的!比这更劣质的事还有很多很多。。。所以在大数据时代到来之前,请充分制定约束商家行为,保障用户合法权益的法律法规。

没有人想进入奥威尔的1984,那个一言一行都处在被监控中的肃杀世界。一个被数据、技术控制的世界该多凄凉?

展开全文
有用 2 无用 0

您对该书评有什么想说的?

发 表

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读