《大数据时代》读后感_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 科技 > Big Data > 《大数据时代》读后感
荒岛野孩 Big Data 的书评 发表时间:2014-08-17 12:08:32

《大数据时代》读后感

前后用了一周零碎时间看完,总体感觉比较一般吧,不够仍有一读的价值。
“大数据”在国内也算是被炒了好几年的话题了,但说实在的,至今仍没有谁给它下很明确的定义,对于我更是一个非常模糊的概念,不过看完本书也算是有一点理解。

本书的作者在第一部分给大数据下了3个定义,亦是本书的核心观点:
『不是随机样本,而是全体数据』
作者多次强调”小数据“与“大数据“之间翻天覆地的变化,不像以前有限的工具于资源,只能通过抽样的方法去获取非常有限的数据,如今,有了获取存取数据更廉价,又有与之相符的处理手段,因此,“大数据”挖掘出来的信息价值是前者所无法比拟的。
在这部分,作者强调数据的重要性比有效的算法重要得多。我倒不是很同意,大数据应该是不仅是大,更应该是一种杂乱乃至混沌的状态,越大包含的信息确实更大,但相应地从中挖掘出有价值的信息也要难得太多。以我的愚见,在现在乃至不远的将来,算法应该是“大数据”的核心,至少应与数据本身同等重要,毕竟数据处理的开销并非作者所说的那么廉价,可能存在一个极限,限制了人类所用到达的规模,而此时,算法的重要性便凸显出来了。
另外,必定存在一种边际递减,数据规模达到某个值,数据的增加带来的价值逐渐驱于零。
书中有提到一个关于国际象棋机器博弈的例子,作者的观点是机器只要拥有了足够的表空间,在人类的面前的优势的便有足够压倒性的优势。的确,现在国际象棋人机博弈机器的机器胜多负少,但仍无法达到绝对碾压,以机器之力,仍无法计算所有的博弈空间,而且,在这里,重要的算法而非数据。更别提围棋人机博弈了。
所以,私以为不应轻视算法的重要性。

『不是精确性,而是混杂性』
因为有了足够的规模,所以相对地牺牲精确性以提高效率。这个观点我比较赞同。这模糊混杂,从某些方面来说,可以说是“大数据“的优势,放弃对精确度的要求,也给了解放了算法的一个限制,由此带来的效率是可以抵消相应的损失的。
书中还提到新的数据库结构,这点觉得很有趣,不像结构化的数据库那样有有序,新的数据库结构能适应”大数据“的本质。
但是,作者强调”小数据”抽样调查的结果是准确的。其实,抽样是对数据规模过大的一种有效的妥协,但并非就是准确的,尽量提到精确性当然是为了使结果更合理,而且,抽样的方法在以后仍很重要,另外,抽样本身也是一种对精确性的牺牲啊。

『不是因果关系,而是相关关系』
这算是本书中最具争议的观点了。译者在序中也对此观点提出了不同的观点。知道“ ’是什么‘比‘为什么’更重要”,对从小就接受“知其然,知所以然”的观念的我来说,这观点确实足够冲击,但经反复思考后,很多时候结果要比原因各重要。就好比,一般情况下,你知道重力的公式要远比重力加速度的大小的成因对你更有意义。对一些商业公司来说,很多时候也是如此,消费者喜欢比为什么喜欢对其来说更有意义。
好比,一些东西的细节对你来说未必重要,因为人的精力是有限的,某些细节的隐藏是必须的。就像面对对象编程,网络协议的分层结构,对使用者来说,关心的是接口,而不是内部细节。
但是,若对整个人类来说,”为什么“无疑是跟重要的,因为这才是人类与机器的差别,”为什么“背后所蕴涵的意义,远比”是什么“更接近世界的本质,这也是人类的本质所在。

以上三个观点就是作者所提到的”大数据时代的思维变革”,虽然已不是什么新颖的观点,但不得不说,非常值得思考。

第二和第三部分写作者设想的”商业变革”与“管理变革”
应对“大数据时代”,从一家公司的对待数据的观点以及如何定位角色——”一切皆可量化“,”数据创新“,”数据技术思维三足鼎立”,到社会的管理变革——“数据主宰的隐患”,”信息管理“,有些观点早已不新鲜。涉及的面太广,非三言两语所能道尽。
时代的
(=。=啊呀,我也太懒,也觉得没什么好写啦,啊哈哈哈哈~)

=====================================================
关于译者的
此书有3篇序,而译者序简直有些无厘头,“其实你应该每个版本都买一本”,“这本书是200%的好“,甚至还有我厌恶的淘宝体。汗|||
译者还是比较用些的,有不少专业的词或俚语或其他的加了注释,只可惜整本书读起来,有不少句子显得不通畅甚至难懂,大概是因为译者的时间太短了,原作也许也是写得比较匆忙。
=====================================================

说点自己的感受。
思维变革,商业变革到管理变革,作者布局与视野还是挺大的,只可惜全书看完并无惊喜,却有一点小失望,自己对其期望过高吧。
一开始的时候,更多地是与作者的观点相左的,因为作者的观点都很极端,如,极端强调数据本身的价值,丝毫不考虑存取与算法的开销,而且,读起来有种有种“大数据”万能,改变一切的错觉。鄙以为,一切皆可量化,大数据的巨大价值,这一切应建立在可行性的基础上才有讨论其巨大的意义的可能。
而书中引用的各种商业公司的所谓“大数据”的成功常识,多数都是挺模糊的,他们有了数据,然后通过某这方法,发掘出了有用的信息,听起来就是这么简单,他们有了数据,然后成功。
但,静下来想想,如果你固守旧有的思维,不先放下“成见”,那便很难接受一种新的思维,毕竟时代在前进,思想也应是如此。
人与人是不同的人,在面对时代的浪潮,有些人就是能看得更远,他们的观点前卫乃至他人无法理解,因为这超出了这个时代,他们因此而伟大。

展开全文
有用 0 无用 0

您对该书评有什么想说的?

发 表

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读