大数据影响未来
2014-02-15
前前后后花了一周的时间读完了这本大数据时代,简单记录一下读书笔记。
大数据有3个特点:第一,大数据不再是抽样的数据而是使用总体数据,样本=总体,启用全数据模式;第二,大数据允许数据不那么精确,可以存在误差和混杂。数据量大本身会带来这样的问题,但不会影响对数据的利用;第三,大数据关注的相关关系而不是因果关系。大数据只告诉是什么而解释为什么。
大数据时代的来临,在于一切都可以量化,不管是人的身体指标,还是数据巨大的图书。数据的价值是巨大的,对数据可以进行多次利用,不断深挖数据的价值。这就要求新型的公司具有大数据的思维,懂得如何搜集数据,用技术手段使用数据,具有大数据思维来利用数据进行创新和指导实践。
当然,大数据也不是必然都是好的,也会带来很多问题。首先大数据时代用户的隐私问题越来越堪忧,其次,大数据可以预测个人的行为,这样的预测有可能会被滥用而影响公平和正义。为此,我们需要新型的大数据管理变革。包括对隐私的保护,数据使用者需要承担相应的责任;用户的将要做而没有做的事情不需要负任何责任;专业的大数据算法师来规范内部和外部的大数据使用,保证对用户隐私保护,和公平正义。
书里的大数据例子很多:
如谷歌通过用户的搜索行为提前预知流感的爆发;
farecast通过对大数据分析预测机票的价格走势为用户决策提供服务;
飓风用品与蛋挞的故事,这个与啤酒喝尿不湿类似;
丹麦通过用户手机数据来研究手机辐射与致癌的关系;
汽车座椅数据,通过坐姿研究来发现问题;
怀孕预测;
纽约大型沙井盖预测模型;
如果本书能以一个具体的例子,详细讲述一下如何利用大数据的话,那就更好了。