姑妄看之的《大数据时代》_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 科技 > Big Data > 姑妄看之的《大数据时代》
青云 Big Data 的书评 发表时间:2014-06-11 18:06:04

姑妄看之的《大数据时代》

     
       大数据时代已然来临,和别人侃大山不蹦出几个数据潮词,别人会以看古董的眼光瞄着你,崇拜新生事物,处在快进时代的我们当然要去看下此书。这也是我等俗人看此书最大目的,我的结论是观点有用,引发思考,但在实际工作中作用不大,所以说是姑妄看之。

    1、就像罗辑思维的罗胖是拜互联网教,此文作者是拜谷歌教,言必称谷歌在公共卫生预测中的成功案例,一咏三叹,反复吟唱,此案例在书中至少出现N次(N>3)。成功的人就成神人,如金三胖;成功的企业就成教,如谷歌。拜神思想古今中外,概莫能外。
     我的疑问是苹果也应是个大数据公司,为什么作者对他举的案例很少,是因为苹果公司的系统数据封闭,作者想举却无法获取?

     2、不是随机样本,而是全体数据 。这个观点我赞同,既然目前我们技术上已经可以拿到全样数据,为什么还要抽样数据呢?不过我觉得像人口普查这样的全样数据可能是准确的,但像什么观点、偏好、能力这样的社会调查就是取到全样数据也不准确。原因很简单,你调查的对象是人,人是会思考而且善变的种群,心如涌泉,意若飘风,你如何搞得清?搞得准?反正调查我不想做实验品。
      比如以前有个对男女出轨的事例,男人出轨的比例是女人的4倍。后就有个好事者问道,就像一个成功的男人背后必有一个默默支持他的女人,而一个出轨的女人面前必有一个猴不可耐的男人,那为什么男人耍坏的比例如此高?
    
     3、不是精确性,而是混杂性。这个观点我赞同,这个世界要像精确了解太难,我们对世界的把握怎么看都是一个区间。好像巴菲特也说过类似的话,模糊的正确超过精确的错误,他的意思是说一个企业的价值评估只是一个区间,你找不到最低点和最高点。如果有人说股市最高点、最低点多少多少,你可以用玩味的眼光看着他说,噢你的股评不错,具有股评家的潜质哟。他的回答一定是,奇怪,你怎么知道我的职业?

     4、不是因果关系,而是相关关系。这不是易经中的观点吗?告诉你现象是这样的,是上中近三古时期三圣归纳出来的,不告诉你为什么是这样,你照这样做当然会避凶趋吉。译者反对这个观点当然有道理,就像易经在中国拥护者众,当然反对者更多,说什么不科学、迷信、糟粕,中国近代化落后的原因之一。可想而知在数据男、理工男、果壳男中间连伪科学都不给他定义,生怕此经和科学这么崇高神圣的字眼挂上丁点关系。我只是奇怪舍恩伯格看过中国人都没有看懂的易经吗?还是作者直接就是拿来主义,用了中国神书的观点?

   5、作者在书中举出很多案例,但可惜的是没有一个是告诉过程,即告诉你案例背景、问题、解决方案,缺了一环,但我们感兴趣的是建模过程。在作者笔下此过程犹如黑箱,是这个的建模太过高深作者怕我们看不懂,故没有举例。这也是我所说姑妄看之的理由,没有实例,只有观点,全书看完,学到了什么?

    6、最后对隐私保护措施之一的数据精算师吐下槽。企业内部数据精算师既对股东负责又要对公众负责,这样的人会不会精神分裂呢?估计神经不大的人怕怕的。外部数据精算师会保证公开公正吗?反正我觉得吧,这个就像企业外部审计一样,这些审计师的薪酬是企业给的,我看审计年报就是扭曲中的公开。
        作者所说外部数据精算师不就是审计师吗?何况此工种在审计师事务所中存在已久,他们叫做数据审计师,就是那种每到一个公司审计时不到财务部而直扑电脑房的码农,直至企业年报出来财务部也没有见过的那个神秘人土。

展开全文


推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读