《大数据时代》读后小结_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > > Big Data > 《大数据时代》读后小结
sandydan19 Big Data 的书评 发表时间:2015-08-05 11:08:38

《大数据时代》读后小结

  1--什么是大数据?
       在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》[1] 中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
       小数据要求数据越精确越好;而大数据需要与各种各样的混乱作斗争,随着数据量的增加,错误率也会相应增加,就需要容错能力。在整个来源不同的各类信息的时候,因为它们通常不完全一致,也加大了混乱的程度。

  2--大数据应用场景
       海量数据被收集起来,主要用来做分析。通过分析过去的信息以预测未来发生的概率。如果是市场营销领域,大数据应用便是为了更好地预测客户的下一步购买行为,从而将相应商品的广告信息递送给客户。

  3--大数据应用的必备条件
       大数据必备条件:海量存储和高效运算。(人类存储信息量的增长速度比世界经济的增长速度快4倍,而计算机数据处理能力的增长速度比世界经济的增长速度快9倍)
       最初,大数据的概念是指需要处理的信息量过大,超出了一般电脑在处理数据时所能使用的内存量,因此工程师们必须改进处理数据的工具。这导致了新的处理技术的诞生,例如谷歌的MapReduce和开源的Hadoop平台。这些技术使得人们可以处理的数据量大大增加。而且这些数据不再需要传统的关系型数据库表格来整齐排列。

  4--大数据应用的算法
    大数据通常用概率说话。
    在少量数据情况下运行得最好的算法,当加入更多的数据时,也会像其他的算法一样有所提高,但是却变成了在大量数据条件下运行得最不好的。大数据的简单算法比小数据的复杂算法更有效。
  拥有更大数据量所能带来的商业利益远远超过增加一点精确性,所以通常我们不会再花大力气去提升数据的精确性。

  5--大数据应用的隐患
    个人隐私安全的侵犯。匿名化对大数据的无效性是由两个因素引起的,一是我们收集到的数据越来越多,二是我们会结合越来越多不同来源的数据。只要有足够的数据,无论如何都做不到完全的匿名化。更糟的是,最近的研究表明,不只是传统数据容易收到反匿名化的影响,人们的社交关系图,也就是人们的相互联系也将同受其害。

展开全文
有用 1 无用 0

您对该书评有什么想说的?

发 表

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读