故作惊人语的《大数据时代》_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 科技 > Big Data > 故作惊人语的《大数据时代》
阿九 Big Data 的书评 发表时间:2013-08-01 18:08:21

故作惊人语的《大数据时代》

花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是“迄今为止最好的一本大数据专著”。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这“最好”的专著吧。

买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打三分。这本书可以买来看看,写得比较完整全面,案例比较多,有一定的参考意义,写PPT吹牛用得上,但是有什么巨大的意义就谈不上了。很多观点不能同意。

一、主要观点上可以探讨的地方
作者提出了关于大数据的“掷地有声”的三个原则。这三个原则凡讲大数据必被提及,很多人奉为圭臬。但是我觉得每一点都值得探讨。这三点分别是:不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。
看完之后感觉都有点不是那么回事。
1.不是随机样本,而是全体数据
这个说得好像人类从来就不知道使用全体数据可以得到更全面的结论,而非要去煞费苦心发展出一套抽样技术一样。人类早就知道处理全量数据的好处,而之所以要进行抽样分析,原因不外乎两点:一是处理能力跟不上,二是数据收集能力跟不上。作者认为人类之前主要受限于数据的处理能力而不去处理全量数据,但在目前机器处理能力有了巨大的提升的时代,限制绝大多数应用的瓶颈不是计算能力而是数据采集能力(不要去提那些极少数需要超级计算机的场合,那个和多数人无关、和本书的商业主题也无关)。但是即便如此,抽样所要针对的很多应用场景是不太可能收集全量数据的情况。比如人口普查,无论计算机力量如何强大,当前很多数据还是要人工去收集,所以这个普查还是要用抽样的方式。有意思的是,作者用人口普查是抽样分析来说明非“全量”时代我们被迫采用了抽样,而最终也没法说我们是否已经可以用全量数据来做人口普查了。实际上至少在目前,对于人口普查,抽样还是必然的选择(嗯,你可以设想,以后人人都装一块芯片,你可以在你的PPT里讲给你的客户和老板听)。再比如我们统计里的经典问题:怎么估算一批零件的使用寿命?怎么去分析一批奶品里的三聚氰胺?以前我们不可能去做全量测试,因为这意味着这批零件就废了,这批奶也全部用于测试了,这样测出结果也没啥意义了(嗯,你也可以说:我我们去收集历史上所有此类零件的使用情况来进行分析吧.....嗯,加油吧,雄心勃勃的骚年)。现在呢,还是必须依赖抽样。
即便不提这些例子,仅从逻辑而言:收集、处理数据的行为本身也在不断产生着新的数据。我们又怎么证明这些数据不是你需要的“全量”的一部分呢?
作者的行文中,关于什么是“全量”,处于不断的摇摆之中。有时指“我们需要的所有数据”,有时指“我们能收集到的所有数据”。作者举了人口普查的例子,这个全量显然指前者。而在很多商业案例中,又显然指后者。我们有能力处理越来越多的、在以前不敢想象的大量数据,但是至少目前看,我们还没不可能说我们处理了“全量”。我们最多可以说我们能处理我们能搜集到的“全量”,但如果据此产生了我们已经没有遗漏数据了的感觉,认为所有数据尽在掌握了,那我认为是一种很可能导致错误的错觉。

2.不是精确性,而是混杂性
这个么,说得好像以前的人类在使用“抽样”数据时竟然都认为取到的数据是“精确”的一样。在使用抽样数据的时候,我们就知道要容忍一定的误差。我们甚至知道在就算取得了“全样”数据的时候,也可能因为有各种原因而导致的不精确,统计实践中对此有相当多的案例。人类从未奢望过我们通过数据分析取得的多数结论是精确的。我们从来都要在信息混杂的情况下做出大多数的决策。

3.不是因果关系,而是相关关系
这是很多人(包括作者)认为最有价值、最重大的发现,而实际上却也是最收到批评的一个观点。连译者周涛教授在序言里都表示看不下去了,他至于认为如果放弃对因果关系的分析,是人类的堕落。我不说这么高的哲学层面,只从逻辑和技术上讨论一下。
计算机能够提供给我们的结论(到目前为止以及在可见的未来),都是相关性。计算机从未提供过明确的因果关系给人类。是否因果关系,是人类在数据基础上,进行的人为判断。一直有相当多的应用,也是只考虑相关性,不考虑因果关系的:确定因果关系,是需要更大的精力、更多的投入的。所以只看相关性而不看因果性也不是什么新的结论(实际上已经是个很旧的结论了)。而这个相关性是不是可以作为决策的基础呢?这个一样离不开人的判断。有一个这样的故事:通过大量的数据分析,慈善组织得出结论:一个国家、地区的电视机的普及率与发达富裕程度很有关系(冰箱、洗衣机、空调、高跟鞋、牛仔裤,etc.,也会和发达程度有这样的相关性),于是他们就向贫困国家赠送了很多电视,认为此举可以促进改过的经济发展。你可以鬼扯电视的普及与经济文化的密切相关,但是实际上最终发现更可能是经济发展导致了电视的普及,而不是反过来。所以,我们真的不需要因果分析吗?说得玩笑一点:这个世界真的不需要脑子了吗?
作者举了一个例子:谷歌分析搜索关键字来确定哪里可能发生了流行病。认为这就是利用了相关性而不是因果性。这是没有利用因果判断吗?现在在投入巨大的机器资源进行分析之前,分析师已经预计了得病的症状可能会导致人们去网上进行相关搜索(影响了搜索行为)。谷歌存储的用户上网信息肯定远远不止一个搜索关键字,分析师为何不开足马力把“全量”数据、各个指标都分析一遍呢?比如用户上网地点?上网时间?上网频率?上网语言?浏览器版本?客户端操作系统?etc...为何会像导弹一样精确地将机器资源投放到了关键字上呢?

总之,对于这些原则,作者为了显出新意,说得过于绝对。而排除掉绝对的成分后,这些观点也就不显得是创新了。作者把三个数据分析人员一直秉持的原则,当做全新的东西讲了出来。时代在变化,我们或许应该经常重新审视这些原则,来确认自己的思想是不是僵化了、是不是过时了。我赞同作者重新审视这些看法,但是我觉得没必要讲得这么极端。

二、细节论据上可以探讨的地方
除了三个大原则不足以令人完全信服,在一些细节上,作者的引证也不是很严谨。
如第51页,对于拼写检查的算法的优化。作者提到,通过输入大量的数据,4种常见语法检查算法的准确率提高了很多,以此说明大数据发挥了作用。这确实是个很有启发性的例子,可以去做更深入的分析和研究,但是.....仅仅4个例子,够得出很有力的结论吗?4个算法,作者没注意到这是一个非常小的样本吗?不能因为这是4个用了大数据的采样,就认为这是一个支持大数据的有力结论了吧。(顺便我很想问问他们:为什么不测试个几十上百的算法呢?是不是面对如此“大量”的计算,也只好折中选择了一个抽样的小样本呢?甚至连样本数量是否合格都不顾上了吗?)

三、这本书有什么用处?
对于这样的一本书,我不明白周涛教授在译序里为什么要建议大家(以后)每个版本都应该买一本。为什么要买?难道作者理清自己脑子的过程很值得我们关注吗?

译序里说:“作者渴求立言立说的野心”,但是我恐怕作者是达不到这个目标的。关于作者的简介为:“《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为‘大数据商业应用第一人’,....早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。”
总体感觉是作者有很多想法,见识过很多案例(这些案例都丰富地体现在书中了,也很有参考价值)。但并非是一个曾经和数据真正绞尽脑汁搏斗过的人(这是我瞎猜的,没有考证过他的经历。考据者请不要告诉他做过什么咨询案例,这离真正体会数据的折磨还很远。)。

第183页说道:“...执行官们信任自己的直觉,所以由着它做决定。但是,随着管理决策越来越受预测性分析和大数据分析的影响和控制,依靠直觉做决定的情况将会被彻底改变。..."真的会么?如果你面对某一家企业做咨询,那可以这样讲。一种新技术的采用很有可能大幅提升企业的战斗力,并超越竞争对手。但是作者是期望对行业立言的人,面对整个社会我们这样讲就不严谨了。引用一个例子:中国棋院的一次训练会后,总教头马晓春对隔天要去各自的母队参加围甲的棋手们说:祝大家周末取胜。棋手们笑了:我们只有一半的人能赢啊。同样,如果大家都采用了大数据技术,那么也总有企业要在竞争中落于下风。而既然我们实际上无法真正分析“全量”数据,那CEO们还是会有很大的决策空间,哪怕很多决策实际上“不科学”。最起码,他们需要决定将有限的企业资源投入到对什么样的大数据进行分析,并如何应用分析出来的结果。嗯....我认为,这多少还是要依赖一些直觉的。

那么大家是否应该看一下这本书呢?我的答案是应该看一看。既然大数据是当前的潮流、相关的研究/商务活动层出不穷,那么做IT工作、数据工作的人对于“最好的”专著无论如何都必须看一下。书中集中展示了很多案例,值得作为参考和启发思维。此外,为了作为谈资、为了在写大数据PPT时有所依据,大家也得看看这本书。根据场合不同,可以对里面的内容复制粘贴、理解重写。这些内容,我相信买一版也就够了。需要提醒PPT人员的是,演示前请想清楚如何回答可能被提及的质疑。如果你对这本书的观点都深信不疑,那么你将会遇到很多的质疑。

对于下载网络版本担心没有图的朋友,请不用担心丢失信息:除掉湛庐特别制作的一张本书思维导图的彩页。这本书没有图。是的,一张都没有。大数据,大概太大了,大到作者无法用任何图来阐明了。

展开全文
有用 681 无用 43

您对该书评有什么想说的?

发 表

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读

对“故作惊人语的《大数据时代》”的回应

小千 2017-02-04 21:32:00

高大上,我等凡夫俗子用不上

Maicon 2016-12-21 21:19:42

哈哈哈哈哈哈哈,我看的时候就在想特么统计学必定不精准啊,必定数据越多某种意义上越准确啊,数据相关性是人对因果判断的辅助工具啊,说什么废话

阿瞒看世界 2016-11-28 20:50:37

说的漂亮!凡事不能以偏概全,老拿个案说事。还是要多多取其精华思想,才是正事。

枣柯 2016-11-08 16:49:36

唉,大数据的书千篇一律,当作品茶时光扫几眼得了。这玩意儿还不如杜克大学的课程。虽然英文听得我有时候真的很想吐

piggyfly 2016-06-08 19:15:43

先就关于全体样本的评论而言,个人认为书中讨论的是未来的趋势,而不在于现实的可行性,这本书更多的一种思路方向的指引而非拿来即用的现实工具,同时,大数据应用也本非涉足于方方面面,而对于评论中提及的不合时宜的场景也有吹毛求疵之嫌,可用则用,不可用则弃之。

瑾夕 2016-01-28 17:09:59

当做普及性教材读个入门

戚名钰 2015-12-18 16:38:01

没有宣传的那么好

大体上是这样 2015-12-04 19:12:53

本来准备看,但是楼主你的书评太到位了,我觉得只看你的书评就好了!

asparkle 2015-11-09 23:29:54

感觉作者对于数据分析的未来发展有点吹大发了…书里面最有用的地方在于举的那些已经实现的例子…

颢墨 2015-10-24 03:06:35

说得很好。

对统计人员的污蔑也是很不负责任的。提到不是精确性而是混杂性的时候,污蔑统计人员用精确性说事儿。可是人家统计就是用概率说事儿的啊。。。

爱一行君 2015-10-11 17:18:57

这本书基本我通读了下。对于本文作者的乱喷行为只能用呵呵来表示。同意上面部分评论所说的,咬文嚼字!连我这个只是刚看的人都知道,作者的本意并不是厚此薄彼,也是要A不要B,而是说,在这个时代 看来,不确定的产生,互联网科技的演进,数据更加突出其商业应用的方面。比如更加强调相关性,强调混乱里的读取。数据背后的核心思想,并不在于抽样方法的异同,不在于数据来源的情况,而是这些数据的应用的思维。大数据的核心应该是应用。尤其是在商业,医疗等等领域。
本文作者有凸显自我观点之嫌,说白了,过于极端。陷入了读书的死胡同,所谓的批判式思维,管中窥豹而已。

时光雨之蓝 2015-10-08 17:20:40

楼上正解,此文作者太装逼了,逻辑根本比不上大数据时代作者的万分之一,这冷水泼的也是没水平。大数据时代后面讲到大数据危害你压根就没看吧。

朝乾夕惕 2015-10-05 12:05:35

楼主这么个评判方法我也是醉了 全盘否定 从人到书 你这么个读法随便一本书给你都是浪费
关于你提到的三个核心思想 所谓样本等于全部 在作者给出的例子里体现的已经很明显,它指的是样本容量在我们需要的时间限度里比以往扩大了不止一个数量级,所谓全部作者从来也没说就说就是覆盖到全部每一个个体,你能写出这通批判却揪住一个字眼咬文嚼字,忽略掉背后真正的价值和含义,我为你的逻辑感到悲哀 这本书本来就带有预见性,作者半句话没说这是现状,只是技术问题难以解决,你自己也说芯片问题,以后难道就没有可能对于要研究的问题采集到全部个体的信息?
关于精确性和混乱的问题,作者说的很明白,很多时候不需要那么高的精确度,怎么到你那里就成了不要了呢?
关于相关性和因果性,译者也只是说要多思考,到你那里就变成看不下去了,要真看不下去了还推荐你每本都读?我们的知识体系本来就是建立在相关性的基础上,既然你这么推崇因果性,你来解释下到底为什么1+1等于2?这能解释得了?科学里有多少定理和公理是解释不了的?所谓因果性,有因才有果,那因的因在哪里?穷其因可能找得到?本身因果性的下面就是大量的相关性理论作为科学基础,为什么到你那里就变得一文不值了?你举的例子也是非常可笑,通过电视机来判断一国的现代化程度,可悲你读完了全书这么多大数据的知识,却举了这么一个浅显错误的例子来说明大数据的应用,一点也不理解大数据所谓巨量信息和算法师的意思到底是什么

全篇书评全篇批判,最后还来了一句值得一读,既然被你说的什么都不剩,我倒想我问问你从书里读到了什么?所谓辩证读书的意思是不要尽信书,而不是不要信书
国外的学术书籍清一色这样,依靠例子和推理堆砌,追求严谨而不是文学性,读起来生涩很正常,又不是读小说,麻烦不要因为觉得读的没那么爽就轻视书里蕴含的思想,否则真是读书无用,金玉良言也弃如木石

Samuel_hh 2015-07-23 09:49:09

实用

hjbrave 2015-07-19 15:44:49

一个国家、地区的电视机的普及率与发达富裕程度很有关系,于是向贫困国家赠送了很多电视,认为此举可以促进改过的经济发展。但是实际上最终发现更可能是经济发展导致了电视的普及,而不是反过来。
以为是A导致了B,实际是B导致了A。这就是充分条件与必要条件的混淆,这就是所谓的因果倒置。很多时候我们误以为A导致了B。

hjbrave 2015-07-19 15:39:35

同意你的观点:在目前机器处理能力有了巨大的提升的时代,限制绝大多数应用的瓶颈不是计算能力而是数据采集能力。
这印证了我的观点:一种形式的丰裕必然带来另一种形式的稀缺。
计算虽然强大了,但是数据采集几乎还是要用人工。

One Clock 2015-07-07 14:08:33

别逗了,根本没仔细看书。。。。

Roc 2015-06-18 22:51:58

书里面写的最差的就是译者序,论断片面,怀疑没有读懂

TonTon 2015-03-29 09:48:40

同意应该看原版 前沿类的书根本就是不可译的

你在想什么 2015-02-28 14:17:04

开始写的还可以 通俗易懂 事例多 但是后面就有些逻辑混乱 啰嗦了

扇贝 2015-01-19 12:56:14

个人觉得你应该再仔细看一遍,如果有能力的话还是看英文版吧,毕竟三天多的时间(而且还是空闲的时间),我不觉得你能在这段时间完全理清思路,除非你的零碎时间就是三天72小时,最后希望你介绍几本更有价值的书吧!

左佐右佑 2014-11-30 14:57:00

刚看完这本书,我觉得这本书虽然写了很多废话,但是也不是楼主批的那么一无是处,最后作者对于大数据的反思还是很精彩的。读罢感觉,其实人有时候真是会有一种盲目的自大和自卑,经过几次相关性的成功,就会觉得相关性好像无所不能,经过一次失败又会觉得相关性完全不顶事,所以自己一直觉得,对未知的领域怀有一种敬畏应该会很重要

阿七 2014-11-23 14:31:40

完全不考虑因果关系会导致过拟合

寥若晨星 2014-11-12 11:04:58

楼主驳斥书中三个原则的方法是“说得好像人类从来就不知道···”,书的作者并没有这样的意思,显然楼主没有做到中立理解和最大限度的宽容原则。这三个原则如果单从那三句话来看,是有很多可以批判的地方,就像你说的,他讲的太极端了,但是不要忘了作者对三个原则做出的那些的阐释。而且就凭这个给作者贴上“为了显出新意”的标签就太有主观色彩了吧。楼主为了批判而极端化了作者的原意,那我是否也可以说楼主“为显新意”了呢?总之也许是大家职业的不同,楼主是搞与这块的有点关系的,可以体会到我无法体会的一些东西。因此我对楼主此文的批判只是在上述方面。【就是批判此文哦,与人无关。而且批判是指我对于此文的独立思考后的看法,不带褒贬色彩】

Hick_fox 2014-11-05 09:44:15

感觉翻来覆去凑字数 ,就是举的例子还有点意思···~~~不像一些国内作者出的大数据书,东拼西凑~

泓溪 2014-10-28 12:52:34

亲爱的,求点个想读 http://book.douban.com/subject/26100363/

犹如炽焰 2014-10-21 00:45:52

楼主没有搞懂大数据。
其实大数据的本质是把所有的数据收集起来,然后让电脑根据过去猜测未来,其实就是玩的概率!但同时牺牲了你的隐私。没错,玩的是概率!牺牲了隐私!概率!牺牲了隐私!!!概率!牺牲了隐私!!!

tongzier 2014-10-09 09:57:31

你说的也挺绝对

逗伴 2014-10-07 13:47:58

书评的价值超过书籍本身的典范。

流浪的猫 2014-09-11 16:15:03

按照楼主的看法,其实楼主跟楼主说定位的作者是一样的,作者的3个观点并没什么问题,只是读者是如何去理解这3个观点。作者可以试试把这3个观点带入商业场景、互联网参与的商业活动中。还有“全体”并非数学上的穷尽

snower 2014-08-14 22:12:17

我的QQ545480010

snower 2014-08-14 22:11:52

请问在哪个公司?可以联系下吗 最近在找数据分析方面的工作

木易焦 2014-08-13 12:01:10

说的你好像读完过这本书一样。

如果我是我 2014-08-08 16:02:33

刚看了一点,至少很多案例对入门了解大数据和扩展思路还是很有好处的。有个问题想请教,每个网站能搜集到的数据都是通过各自的网站统计出来的,那如果旁人想整合对比数据的时候如何能调出其它各个网站的数据,如书中飞机票对比的例子,它是如何知道各个机票每天的价格的?

S拉拉长™ 2014-08-07 08:21:00

的确有不少槽点,案例确实很有启发,做ppt和当谈资非常有用

艾龙 2014-07-14 18:02:51

三天就看完这本书,你能看多懂,不懂就别在这花那么长时间误人子弟了,与其花这么多时间写评论不如仔细看看。说实话感觉这是大数据方面的挺不错的一本书,是从思想上让你转变的。他没有涉及到具体技术,但他是催化技术的理论。极力推荐

火山木 2014-07-05 13:22:16

楼主都没有看明白就瞎吐槽,小心误人啊,当然不会自己思考的难免被误。
大数据有他应用之处,作者并没有否认抽样的必要性,只是大数据往往可以提供另外的思考途径,看到早先被忽略的东西,这些可能会有很重要的应用。

Deja vu 2014-06-27 10:45:23

楼主对整体的理解不对吧?人家作者说的是“尽可能多的数据”,没有说要强制得到全体数据。

熊小罗 2014-06-19 19:36:15

看了前半部,作者的吐槽深得我心。
但是评论中有很多要求看后部分的,我看完后半部,再来评论。

ivande 2014-06-18 03:52:02

只能作为启发性的读物吧。虽然很全面,但确实不够深入

薄荷枫叶 2014-06-15 18:49:11

这本书可是有三章呢,个人认为除了第一章的争议点之外,二、三章都写得比较具有前瞻性。书要辩证地看,很多读者嫌啰嗦,可是就连作者这样细致地讲来,还有人没读明白呢……

郭贝勒 2014-06-09 16:33:32

刚看了大概三分之一,还是多少吸收到了大数据的相关概念,这对我来说就算好事了,毕竟对大数据太不了解,不过估计现在放眼全中国,也没有人敢拍着胸脯说对大数据精通吧... 楼主有自己的思考是好事

飞天鱼1990 2014-06-02 15:16:10

拖拖踏踏的看完了这本书,得到一个讯号就是,单个去了解一个个体得到信息总是不能得到非常准确的信息,而数据的群体性,混杂性,在大数据的层次上就会有得到更好的结论。总的来说,这本书是提供了一个比较好的理解世界的思路,但是作为个人,希望有一根书可以提供更加详细的部分因果关系导致的相互关系的具体详细的案例,每一个浅尝辄止的案例是不够的

望江南在豆瓣 2014-05-09 10:08:00

首先,对我来说,是打开一扇窗,看到另一个方向的好书。好多的例子,不错
其次,的确如何您所说的,他的因果关系、相关关系、全数据反抽样都要严肃思考和推敲。尽信书不如无书。

李春雨不上线 2014-05-09 09:18:19

Brilliant Summary-Response Essay!

白水泥 2014-04-24 14:38:18

所谓大数据其实就是一个大忽悠

光魔手 2014-04-24 09:00:36

虽然是这么中肯的评价,但是很有必要买一本来读一读。你不也是读了以后才这么说的么,说不定别人读了以后感知不一样呢!

离歌笑 2014-04-18 00:37:54

所以之前被《长尾理论》欺骗过后这次我已经学会了跳读和扫读这种商业作品.........觉得写得比较好的地方是为什么不能将大数据应用于预防个人犯罪

阳光206 2014-04-09 15:57:46

之前没有仔细看楼主写的内容,今天仔细看了一下,楼主用心了。看一本收能写出这样评论,书的价值,读者的收获都值了。

谦信 2014-04-07 20:20:28

非常同意啊

混沌还是馄炖 2014-04-07 17:37:58

此书废话很多,内容不连贯,内容还是有些用处和新鲜观点。因果关系在很多情况下,难以得出以及应用的上,如同相关性,各种原因,退而求其次。很早时候人就知道百分之百的安全性完全可以做到,但那样各样成本会很高,不追求精确以及因果很多时候是因为各种客观条件限制。任何例外都有存在,譬如书中作者比喻,随机抽样好比在汽车时代骑马一样,那么火车,飞机,高铁怎么算。

顾小拧巴 2014-04-06 23:59:11

LZ明显没看完就评,本书后几章重点写大数据存在的问题的,没有完全否认因果关系,大数据仅仅是一个参考而已。。。

月光疾风 2014-04-04 20:32:58

理论片面而深刻 才有启发性

其唯VING 2014-04-03 22:33:22

LZ,“计算机能够提供给我们的结论(到目前为止以及在可见的未来),都是相关性。计算机从未提供过明确的因果关系给人类。”这一句显然是错误的吧。计算机科学理论上有不少是逻辑派的。不过如果不是搞理论的知道的比较少。

2014-03-28 15:57:04

看完了以后,我也是对其重“相关关系”轻“因果关系”而感到无法苟同,这几乎相当于人类智慧的倒退,另外,作者把数据的作用看的太过绝对了,他在数据的三个类别:资源型,创新型,技术型,居然彻底否定后两个, 认为只有数据本身才是有价值的,这个想法很可怕,是一种典型的反智逻辑。

过去的都是序曲 2014-03-28 11:11:06

我觉得这本书还是值得看的,书中的观点确实有些绝对,但有些东西可以借鉴。可能是个人的看书目的不同,我之所以选这本书,是秉着了解我所生活的这个世界,所以这里的观点都持保留意见。

黛轩主人 2014-03-27 10:54:29

写序的周涛,是电子科技大的周涛么?

CasperCheung 2014-03-27 01:03:23

槽点精准

烦躁豆 2014-03-26 15:36:35

我没看过该书,三原则中的前两个不好准确评价,但好像吐槽的人也并不多。
但就只对第3点而言——研究的“不是因果关系,而是相关关系”,这是机器学习理论最为精华的部分,我想LZ是不是没有领会呢?
简单一句话:
因果关系强调的是事物本身的机理知识,当它非常难以得到的时候,我们就用一个近似相关的机器学习模型替代它。

涤疵 2014-03-25 21:06:16

完全同意你的观点——放弃对因果关系的分析,是人的堕落,如果人堕落如斯,就没有权利再要求捍卫自己的自由意志,这是个非常矛盾的说法。

diwang1999 2014-03-21 14:57:12

对作者的观点大部分比较同意,除了第三点。书中的“相关关系”可以从逻辑学里的“归纳”来讲,“因果关系”可以从“演绎”来讲。归纳就是一组前提来支持结论为真,但不是百分百的支持。演绎就是一个结论可以百分百支持结论为真。我想作者的观点更多的是想告诉我们多用归纳的方式思考,而不是楼主理解的那样抛弃因果思维。

小同心 2014-03-03 23:33:18

还没看完,但想想我们的生活,现在也差不多是大数据的时代的初期了。qq空间会提醒你可能认识的人;亚马逊会列出你感兴趣的物品等等。全球每年产生的数据不知有多少ZB了,你上网的各种痕迹、交通摄像头拍的数据、卫星手收集的数据等等,都会保留记录下来。建议再看看《数字化生存》这本书,。

Stone2CN 2014-03-03 22:54:20

这本书的第三部分和结语写得很好。

源创 2014-02-26 11:54:49

虽然这本书废话很多,砍成一半还略显多余,但是楼主明显是没仔细看书,很多评论有失偏颇

Warroir 2014-02-19 00:05:00

个人感觉这本书并不是一无是处,当然这不是理工科教材类经典,其中举得一些例子,有些不够详细,有些不够严谨(比如其中一个例子刚好是我的一个外国朋友做的研究,我对相关的论文和研究方法略知一二,一个不小的研究项目被本书作者几句话带过,难免会产生一些误解)。这本书更像是科普读物,非相关专业的人也都看得懂,比较适合轻松了解,同时书中众多例子和参考文献会给有兴趣的人一个入场券,希望了解更多的人,大可去直接联系相关研究人员做深入讨论。

乒乓球鸡蛋 2014-02-09 00:13:23

最近做一个PPT,正好想用一下里面的观点,被你一瓢冷水泼醒了,还真是批判性思维啊,我得想好被质疑了该怎么回答,再添加所需内容,不然被问倒了都

九斗 2014-01-22 13:26:06

两周读完,楼主的确吐槽到心坎里了。
内容或许有可读性,但是200多页太浪费时间了,20多页就足够了。案例都是就那么几个案例翻来覆去。至于作者的观点,多些思考就行了。
建议只想了解的人看一下译者序就够了。

Sun_rain_ice 2014-01-08 17:04:50

书还没看,不过lz说的还是受益匪浅。决定去看看,就当“课外读物”吧~

Ethan 2014-01-08 13:10:13

观点可以探讨,但是这本书的价值还是摆在那的。

polarbear 2013-12-30 15:15:33

马克思说得好,批判继承,先批判再继承些好的

Vincent.Zhang 2013-12-29 20:32:48

作者阐述大数据时代全景,不管是高屋建瓴,还是供ppt吹牛逼,应该都完成了提供大数据全景这么一个目的,给读者一个全新的视角,还是很成功的

西山 2013-12-29 19:49:09

这是一本比较高屋建瓴的书,它定义了整个行业,从技术到商业到法律。个人感觉三个原则非常到位,任何事都可以有例外,并不是举出几个反例可以抹杀齐价值的

阳光206 2013-12-27 11:43:12

书到货了。还没开始看呢。各位看过的太认真了。

小飞哎呀呀-在卖 2013-12-21 16:07:24

楼主不必太较真,这是“先河之作”,不要用现在的眼光来看。以前能有这样的学识已经很牛了,书的内容写的不深入,但是全面,好理解,如果能补充上现今的观点就很好了。总之,这是一本基础,入门级别的书,不用太较真

Matthew Wu 2013-12-18 10:52:10

作者其实在书都后边说了“当然在某些情况下,我们仍然需要精心策划的数据来做因果关系研究和控制实验,如测试药物的副作用或者设计关键的飞机部件。但是在日常情况下,知道“是什么”就已经足够了,不必非要弄清楚“为什么”。大数据的相关性将人们指向了比探讨因果关系更有前景的领域”。作者并没有绝对的摒弃对因果关系的追求。

Matthew Wu 2013-12-18 10:46:50

楼主你书的后半部分没看吧?书的作者后面说了 “大多数人” 只需要追求相关关系就好,对于科研,研究人员,还是要搞清楚“因果关系”的!

贝塔斯伐洛克 2013-12-08 22:06:33

作者说出了我的心声,强迫自己看了两张就想大骂what the hell,无奈经济学老师还奉若至宝,言必提也就罢了,考试还来上十五分。。。。简直不能更蠢了。。。。

没有名号可以使用 2013-12-04 12:20:33

同样是看了一半,实在是看不下去了

神风 2013-11-27 22:41:01

真是逗。。。你们有认真读人家的书,然后做读书笔记吗?你写的书评,我看完“不是随机样本,而是全体数据” 就读不下去了,关于牛奶和零件的质量验证,作者明确写的不是一瓶瓶牛奶的验证。 作者有明确指出的问题,您都没有读懂,更别说从书中读出来的延伸的东西了。有写书评的时间,再去读一遍吧!

朕是小小君 2013-11-25 14:53:30

看了一半。觉得整本书差不多就这样了

张家口的雲 2013-11-24 09:47:39

关于相关关系和因果关系的问题,个人认为许多人会曲解作者的意图,希望多看看书中81到89页的内容,对此问题是站在哲学层面还是技术(或业务应用)层面看待这一问题,对我们来说,更多的是在后一层面来看待所谓的大数据,如果这样,作者说的不无道理,对于大数据时代的数据应用,可能重视相关关系在操作层面更重要,既所谓的让数据说话。

Raffaelloshum 2013-11-22 00:36:52

和3D打印都是一个问题,一个技术的提升就扩展到无限大。逻辑上全部的数据就是不可能的,前提是所有数据都数字化,即使如此也只是定量分析。很多问题都需要定性分析,大数据只能是辅助。

萨不拉尼 2013-11-12 20:50:28

还没有读完,但觉得作者讲的更是趋势性的东西,过去或现在存在的反例未必说明他的预测不准

朕是小小君 2013-11-11 11:24:54

尽信书则不如无书 辩证的看

sailwind 2013-11-06 18:48:48

那作者倒是推荐几本相关领域更好的书呀??

阿飞 2013-10-15 17:59:25

物理定律也不知为什么那样,但还是用了,原作者的观点也许是有用的。

虎崽Daddy 2013-10-14 12:04:40

楼主意思是把这书当流行电视剧看了,好有点谈资。

我不喜欢 2013-10-12 18:10:29

楼主书后面部分没仔细看吧。。。

Tchenv 2013-09-30 23:30:45

呵呵!!!给楼主和上面所有人

_WUQIMING 2013-09-27 10:13:06

同意,很多观点和我差不多。这本书,没有多大提升。不过看一下还是可以的,毕竟里面的一些内容还是可以作为“讲座”需要的

左思 2013-09-09 20:31:14

大数据技术更重要的是描述吧,因果机制是更深入的揭示,可能随着技术的发展会成为另一个创造价值的点

哭泣的手 2013-09-03 10:39:12

LZ有推荐的关于大数据的书吗?

坏笑着的瓢虫 2013-08-30 11:14:27

是呀,其实不需要那么厚一本书的,和几页就能说完的事说了十几页

[已注销] 2013-08-30 10:10:48

LS,我发现很多书都是这样。因为实际内容没多少,所以只能这样颠来倒去地说咯

坏笑着的瓢虫 2013-08-30 10:06:12

我也是觉得逻辑性好像不是太强,很多地方又在重复说一些东西,看起来很容易就看到后面忘了前面,不过我还没看完,楼主看的好快~

[已注销] 2013-08-25 21:46:13

critical thinker!

败家宝佳 2013-08-22 01:06:55

绝对的critical thinker!!!!赞一个!!!!

三观正 2013-08-20 20:46:45

吐槽吐到了我心坎里。知音啊

藿香正气 2013-08-09 17:31:16

您是第一个到达这里的人,快来点“有用”。