如今市面上的书种类虽然繁多,但是稍一归类就会发现其实无非分为四种:成功学、故事会、工具书和方法论。具体到每一本书来说当然会有高下之分,但是就这四种类别而言,实在难说谁好谁坏,不同的人有不同的需求而已。目前这四类书我都在阅读,我的阅读策略是“成功学'有病'的时候看、故事会有节制地看、工具书用到的时候再看、方法论要边做边看”。
《学会学习》就是我最近在看的一本方法论书籍。阅读方法论书籍的时候要注意两点:第一,方法论书籍必须要边做边看,无论是学习方法、时间管理还是投资理财,看完书必须要进行实践才会发生效用,否则永远只是纸上谈兵;第二,书中的方法论必须要针对自身实际情况进行调整,完全的拿来主义往往是行不通的。
并不是所有的方法论书籍都符合以上两点要求。有的书籍给出的方法论根本不具备可操作性,无法付诸实践也就无法检验方法的有效性,这样的书就是耍流氓;有的书籍提供的方法过于死板,无法针对自身进行灵活调整,这样的书就是鸡肋。我一直特别推崇日本的方法论书籍,受日本实用主义的影响,日本此类书籍往往实用性高、接地气、操作性好,有那种老师傅手把手传授,唯恐你听不懂的感觉,《学会学习》就是这类日本书籍的典型代表,作者斋藤孝原本就是日本国内的畅销书作者。

黄金圈理论
-
《长尾理论》读书笔记
2016-01-06
第一章:长尾市场
传统娱乐市场的市场存在两个限制:
①区域限制:必须找到本地顾客是传统零售业的一个软肋,在地理位置的限制下,消费者太分散等于没有完全没有消费者。
②物理限制:物理世界的另一个限制是物理学本身。
在过去的一个世纪里,娱乐业化解这两个限制的方法:聚焦于大热门,即热门经济学。它诞生于一个供给不足的时代,我们没有足够的空间为每一个人提供每一样东西,这样的世界是一个匮乏的世界。但是网络的兴起使得我们正在进入一个丰饶的世界。
无尽的长尾市场:
案例:在线流媒体音乐服务商(虾米、QQ、酷狗…)下载次数/曲目排名:长尾曲线
突破规模限制(数字生产成本为零):长尾具有可怕的规模,足够多的非热门产品组合在一起可以形成一个堪与热门市场相匹敌的大市场。网络的长尾市场可以提供传统零售商根本无法提供的产品。数学集合论原理:一个极大的数字(长尾中的产品)乘以一个相对较小的数(每一种长尾产品的规模)仍然等于一个极大的数。
突破地理限制(网络流通成本为零):在长尾曲线的右端,曲线并没有降到零点,需求量并不是零,无数的曲目中几乎每一首都有人购买。这是因为
网络产品在征服了地理位置和规模的限制之后,这些企业不但扩展了现有市场,还发现了崭新的市场,即长尾市场。这个市场的规模比人们想象的大,而且会越来越大。
第二章:大热门的兴衰起伏
工业革命之前(衰)
本地化的文化。小范围文化的早期阶段,决定因素是地理位置而不是共同的兴趣。
①人口由于地理距离被分散,文化因此被分割。
②缺乏快速的交通和通信手段,文化的融合以及新理念和新趋势的传播受到限制。
工业革命之后:(兴)
大众化的文化:流行文化
①社会因素:现代工业时期的来临和铁路系统的发展造就了风起云涌的城市化浪潮和欧洲大城市的崛起,这些新的商业中心和交通枢纽史无前例地将形形色色的人聚集在一起。
②技术因素:新兴大众媒体:商用印刷技术→摄影技术→留声机→电磁波广播→电视(大一统文化的终极传媒就此诞生)
网络诞生之后:热门文化的终结(衰)
音乐流行榜的终结:音乐工业整体上在衰退,热门音乐市场的衰退更惨痛,顾客转向非主流的选择,散向了无数的亚流派。传统广播时代塑造的音乐热门文化被网络共享音乐、iPod等个性化音乐提供者所摧毁。
发生在音乐界的事同样发生在大众媒体和娱乐业的其他领域:电影、电视、报纸……大热门文化已经是强弩之末,但它对大众观念的影响却仍然挥之不去,当今的媒体和娱乐业仍然是围绕着寻找、投资和创造大热门的模式运转的。
传统的市场如果一个东西不是大热门,它就是个失败者,其中的逻辑很简单:把衡缺的资源分配给最值得的东西——也就是最流行的东西。货架空间的分配是一个零和游戏:一种产品取代另一种产品。现在,我们正在从一个大规模的市场退回到利基市场,而定义不同市场的不再是地理位置,而是共同的兴趣爱好。
第三章:长尾的三种力量
长尾理论:
我们的文化和经济中心在加速转移,从需求头部的少量大热门(主流产品和市场)转向需求曲线尾部的大量利基产品。在一个没有货架空间限制和其他供应瓶颈的时代,面向特定小群体的产品和服务可以和主流热点具有同样的经济吸引力。
新的供给必须有新的需求相伴,长尾时代的六个主题:
①在任何市场中,利基产品都远远多于热门产品。
②获得这些利基产品的成本正在显著下降。
③但仅仅供应更多的品种并不能改变需求,消 费者必须有办法找到适合他们的特殊需求和兴趣的 利基。从自动推荐到产品排名,一系列的工具和技术都能有效地做到这一点。这些“过滤器”可以把 需求推向长尾的后端。
④一旦有了空前丰富的品种和用来做出选择 的过滤器,需求曲线就会扁平化。热门产品和利基产品仍然存在,但热门产品的流行度会相对下降,利基产品的流行度则会相对上升。
⑤尽管没有一个利基产品能实现大的销量, 但由于利基产品数不胜数,它们聚合起来,将共同形成一个可与大热门市场相抗衡的大市场。
⑥当以上几点全部实现,需求曲线的天然形状 将会显现出来,不受供给瓶颈、信息匮乏和有限货 架空间的扭曲。而且,这种形状受少数大热门的支 配程度,远不像我们想象的那样大。相反,它的分布就像人口本身一样分散。
长尾的出现源于获得利基产品的成本下降:
成本为什么下降?
①生产工具的普及:最好的例子就是个人电脑。
②传播工具的普及:最好的例子就是互联网,互联网降低了接触更多人的成本。
③连接供给与需求:将新产品介绍给消费者,推动需求沿曲线向右移动。搜索引擎和智能推荐意味着消费者寻找非主流内容的“搜索成本”降低了。
生产工具的普及使得生产者的队伍急剧壮大;超高效的数字经济学创造了新的市场和新的交流中心;最终,利用集体智慧联络供给与需求的能力带来了崭新的推荐和营销方式。
第四章:新生产者(普及生产工具)
生产工具的普及:
重要在于生产工具普及的方式而不是这个概念本身。工业社会的劳动是被迫、非自发的有偿工作,网络时代的劳动将变成主观积极的,这导致了我们正在由被动的消费者转变为主动的生产者(UGC),我们是为兴趣而生产的。
这种趋势是消费主义向参与性“生产主义”的转变:“消费者经济”是一种由生产者控制的系统,其中消费者只不过是将“内容”转换成金钱的能量源。
维基现象:
百科全书编撰方式的转变:独立博学家编撰→更大范围的团队合作→开放式的集思广益(维基百科)维基百科依赖于极度的分散化和自我组织,是一种纯碎的开放。
集体生产的力量:
维基的真正非凡之处在于它能在长期内不断地改进自己,有机地治疗自己,那支庞大而且仍在日益扩张的监护者队伍是一个免疫系统,对任何威胁到维基的事情都能做出警觉而又迅速的反应。
用户自创式的维基模式有四个主要优势:①实时更新的能力②篇幅的无限性和视觉辅助(比如图片和图标)③大量连接到其他资源的外部链接④更好地显示不同的观点和争议之处。
声誉经济:
业余者为什么要自愿参与?
我们可以把长尾理论归结为一句话:需求曲线开始于头部的传统货币经济,终结于尾部的非货币经济,头尾之间是两者的混合体。头部产品可以获益于强大但却成本高昂的大规模市场流通渠道,这里是专业者的领域,商业性因素占据统治地位,金钱驱使着一切;在尾部,生产和流通成本几乎为零,商业因素不重要,人们是为了自我表现——“声誉”的吸引力不亚于金钱。
声誉是用一种产品吸引了多少注意力来衡量的,它可以转换成其他有价值的东西:工作、头衔和各种诱人的商机。这种现象称为“曝光文化”,它反映了网络的逻辑——一切都是为了引人注意(眼球经济、注意力经济)。
长尾中的版权问题:曲线的头部,各大制片厂、唱片公司和出版商拼命地捍卫着他们的版权。曲线中部,也就是独立音乐人和学术媒体的领地,是版权问题的灰色地带。如果继续向尾部靠近,进一步深入非商业地带,我们就会看到越来越多的创作者正在毫不犹豫地放弃某些版权保护。
自我出版热:
大多数书籍都不会热销。绝大多数作者都没有打算通过出版书籍赚钱,他们只希望他们的书被他们所重视的特殊群体读到:比如与他们背景相似或志趣相投的人。自我出版并不是赚钱的一种方式,而好似对其他人传达信息的一种方式。今天,自我出版的经济门槛已经降低到极点,几乎每一个人都能做到。
各种各样从长尾中起步的生产者并没有对商业前景抱有太大的期望,他们本没有太多成本可言,因此可以承担更多的风险,他们不需要许可,不需要资本,创作工具并不昂贵,而且富有才华的人分布广泛,远比我们想象的要多,从这个角度看,长尾有望变成创造力的熔炉,新理念可以在演化为商业形式之前继续融合和成长。
新参与机制:
过去的单一行业结构(专业者负责生产,业余者只管消费)现在变成了双向市场,生产者和消费者的界限不再清晰。
第五章:新市场(普及传播工具)
网络二手书教材市场:孔夫子
集合器:
长尾集合器:能将数之不尽的各类产品集合起来(通常集合在同一个地方),将他们变得易于寻找、唾手可得的公司或服务。每一个集合器都可以降低市场的进入门槛,允许越来越耳朵的产品跨过那道障碍,找到属于自己的顾客群。集合器是一个很宽泛的概念,从理念到人,任何事物都可以被集合。
商业集合器主要分为五大类:①有形产品(亚马逊、淘宝)②数字产品(iTunes、网络流音乐)③广告/服务(Google、百度)④信息(维基百科、Google)⑤网上社区/用户自创内容(贴吧、博客、论坛)
还有很多集合器是跨领域的:亚马逊(物理产品和电子产品)、Google(信息、广告、数字产品)……
从混合到纯数字
有形产品和数字产品都是长尾中的机会,但是相比之下后者能沿长尾伸展到更远的地方。
因为:①纯数字模式下,每一种产品实际上没有任何存储成本;有形产品需要巨大的存储成本②数字服务几乎没有运输成本,它们可以通过宽带网运送货物。近乎为零的边际生产和销售成本,这是零售行业的最高境界。
我们并不能在传统零售商和长尾零售商之间划出一道简单的界限,这里存在一种渐进式的过渡:先是纯原子经济学,再是字节和原子的结合,最后是纯字节的理想世界。
存货的消亡:
降低成本的终极方法就是完全消灭原子,用字节处理一切,纯数字集合器企业只需要把产品存储在硬盘上,然后通过宽带运送他们,生产、存储和销售成本接近于零。这是最高境界的即需即制市场:由于产品是数字的,它们可以根据需求状况克隆和传送无数次,一个畅销大热门和一个无人问津的冷门只是数据库中的两个不同条目而已,在新技术和硬盘经济学的时代,两者没有任何区别。
数字音乐、熟悉阅读、视频、电脑软件、网上报纸和杂志。
第六章:新时尚领军人(连接供给与需求)
新时尚领军人就是我们自己,口头讨论已经演化为公共讨论,这是一个人人都有麦克风的时代:蚂蚁也有扩音器了。
群体智慧的力量:
被放大的口头传播效应印证了长尾的第三种力量:利用消费者的情绪来连接供给与需求、普及生产工具是第一种力量,是它让长尾壮大起来;普及传播工具是第二种力量,是它让长尾变得唾手可得。但光有这两种力量还不够,直到第三种力量发挥作用,帮助人们在数之不尽的选择中找到自己的最爱,长尾市场的潜力才会真正释放出来。
新时尚领军人物:传统的职业专家→名人明星→小名人:顶尖博客、热门列表→群体行为:创建标签
过滤器法则:
在一个无限选择的时代,统治一切的不是内容,而是寻找内容的方式。
推荐系统和其他类似工具都能帮助你在长尾中找到合适的产品,我们称这些工具为过滤器。长尾市场中过滤器的主要作用在于一种转变:帮助人们从已知世界(大热门)走向未知世界(利基产品),从某种意义上说,好的过滤器有推动需求向尾部移动的作用,它们可以发现新的产品和服务,这些新事物比传统大规模传播渠道中的千篇一律的东西更有吸引力。
长尾中满是垃圾?
过滤器对长尾来说至关重要,如果没有过滤器长尾可能成为一个噪音源,长尾中确实是满是垃圾和噪音,但长尾中同样存在很多精品,过滤器的职责就是清除噪音。
长尾的动态质量范围相当宽广:最差的差到极点,最好的无与伦比。相比之下,普通商店的动态质量范围相对狭窄:大多数产品都介于中等和良好之间。简言之,需求曲线尾部的动态质量范围较宽,而头部的动态质量范围较窄。从头部一直到尾部,曲线的每一部分都有高质量产品,尾部的低质量产品更多,沿曲线向右看,平均质量水平呈下降趋势,但如果有好的过滤器,平均质量并不重要。
在这个低销量的长尾世界中,过滤器的作用在于区分好坏,在搜索引擎、推荐系统或其他过滤器的帮助下,人们在长尾中更有可能发现合意的产品,畅销产品往往对大众化品味有吸引力,而小市场产品针对的是独特的个人品味。过滤器不仅能把需求推向长尾,还能提高消费者的满意程度。
纷杂的长尾:
沿长尾向后看,信号-噪音比为什么越来越低?世界上的绝大多数事物都是长尾事物,热门产品只是罕见的例外。
黑天鹅问题:
通俗说法:一个人在观察到多少只白天鹅之后才能断言所有的天鹅都是白色的,黑天鹅并不存在?
学术定义:一个随机性事件满足以下三个条件:重大影响、无法计算的概率、意外效应。首先,它一旦发生,就会造成与其本身不成比例的重大影响;其次,它的发生概率很小,而且根据发生前的可用信息无法计算这个概率;第三,黑天鹅问题的恶性特征就是它的意外效应:在任意一次观察中,不会有任何说服力的要素可以证明这个时间的发生概率正在提高。
事前过滤与事后过滤:
传统匮乏市场:事前过滤,在有限的货架、银幕、频道资源下预测什么东西卖得最好。
长尾市场:事后过滤,推荐系统和搜索技术鉴别特定兴趣领域内已经存在的东西,突出那些精华,压制甚至忽略那些糟粕。
正如事前过滤器并不完美一样,时候过滤也有很多缺陷。由于事后过滤往往都是业余的,有时候独立的评论不足,随意的恶意诋毁有余;另外,用户反馈都是在信息发表之后才出现的,所以原本可能被编辑发现的错误有可能悄悄渗入。
第七章:长尾经济学
帕累托80/20法则:在财富和人口的分配结构上存在一种可预测的数学关系,他把这称为重要少数法则(Law of the Vital Few)
幂律分布:研究者发现,很多领域都符合幂律分布,也就是帕累托最先在财富曲线中观察到的1/X形态。
只要消费市场存在,幂律曲线就会在3个条件成立的情况下出现:
①多样性(有很多不同种类的事物)
②不平等性(某些事物的质量高于其他事物)
③存在某种网络效应,比如声誉或口头传播效应,这些效应容易将质量的差别成倍放大。
更长的尾意味着更短的头?
在长尾市场中,有三种力量可以推动需求从头部移向尾部,从大热门转向利基产品,第一种力量是产品的丰富性,第二种力量是较低的搜索成本,第三种是样本示范(免费试听、免费试读……)
提高需求还是转移需求?
长尾究竟是将蛋糕变大了,还是仅仅改变了蛋糕的分配方式?答案与行业有关:广泛兴起的小市场确实给某些行业带来了成长的黄金机遇,但是有的行业就没有这么幸运了。
人类的注意力比金钱更容易扩散,长尾的主要效果就是将我们的品味转向非主流产品,但只要新发现的东西让我们更加满足,我们就会更多地消费它们,只不过,我们不必为得到这样的特权而付出太多的金钱。
价格该涨还是该落?(必需品和愿望品)
答案并非绝对,视产品性质的不同而不同,在这方面,我们可以把市场分为愿望市场和需求市场,两个市场的价格规律是不同的。
需求市场中的消费者知道他们在寻找什么,只是这种产品难得一见,当你找到了它,对价格可能不会那么敏感。价格策略:不打折。
相比之下,娱乐产品一般属于愿望市场,只要价格合适,你就有常识新产品的愿望,愿意深入长尾探索,因为损失风险会越来越低。价格策略:灵活可变定价。
长尾中的微结构:
长尾是由许多小尾巴构成的,幂律曲线也是由诸多小幂律曲线叠加而成的。以音乐为例,音乐幂律曲线由数千个小领域微观市场组成,每一个小领域也都是一个幂律曲线。
过滤功能往往在一个流派内最有效,而不是通用于整个市场。幂律曲线之所以呈陡峭下滑状,是因为强大的口头效应反馈换放大了消费者的喜恶倾向,让有名的更有名。过滤器和其他推荐系统在非主流产品中最为有效,在流派和亚流派内部最为有效,但在不同流派之间,它们道德作用会大打折扣。
时间长尾:
影响事物流行程度的的两个因素:①特定事物的吸引力(吸引力的广度和深度)②事物的新旧程度。
时间长尾:热门和冷门产品的销量都会慢慢下滑,热门产品的起点也许更高一些,但早晚会落入长尾之中。但搜索引擎打破了这个法则,因为搜索引擎的结果取决于相关度而不是新旧程度。
被忽视的丰饶经济学:
传统的经济学定义:经济学研究的是稀缺资源下的选择。但是如今数字时代已经进入一个丰饶世界:我们有重组的货架空间、充足的流通渠道和充足的选择。
在数字产品的长尾市场中,传统经济学的两个重要的稀缺函数——边际生产成本和边际销售成本正在趋近于零,因为字节可以在几乎毫无成本的前提下复制和传输。
第八章:货架争夺战
本章将回到幂律曲线的最左端,也就是大热门的领地,谈论货架的优势和成本。
大热门可以创造大众文化热点,然后围绕着这些热点孕育定位更加明确的细分市场。成功的长尾集合器既需要冷门产品也需要热门产品,它必须收集从吸引面最宽的流行产品到吸引面最窄的另类产品。因为:如果只有头部中的产品,就不能满足顾客更多样化的需求,如果只有尾部中的产品,人们面对海量复杂的选择将会无所适从。同时供应头部和尾部中的产品的重要性正在于此:你的起点是消费者已经了解的一个世界——主题明确的地点和熟悉的产品。
货架的贡献:
货架有其历史功绩,货架可以最大效率地利用每一平方米的零售空间,促进了丰饶性和多样性的大发展和全球供应链的降价效应。
一寸货架一寸金:
实体商店里的货架有着高昂的成本,这意味着只有销售那些大热门商品才能承担这个成本;另外,在货架上销售产品的隐性成本可能比直接成本还要高,这些成本是机会成本,也就是产品短缺和潜在需求得不到满足的成本,这是由货架的物理性质决定的。
地理限制:
有形货架受制于地理位置,它们必须吸引当地的消费者,在物理空间的限制下,消费者过于分散等于没有消费者,因此本地需求必须足够集中,足以弥补有形分销的高昂成本。没有足够的本地需求就没有商店。
匮乏的天空:
广播的成本是固定不变的(发射机、许可证、节目制作),但是广告收入是可变的,为了获得最大的经济效益,广播吸引到的受众越多越好。传统的解决方法就是聚焦于大热门:大热门不仅能聚合和集中观众群、高效利用匮乏的传播资源,还能获益于营销上的网络效应,也就是人们的口头传播效应。
过去几百年年的娱乐经济学(包括广播和电影)都信奉这样一个基本原理:内容和传播渠道是匮乏的,消费者的注意力是充裕的,只有少数有能力的人控制了生产方式,这是一个卖方市场,消费者有浪费注意力的余地。
第九章:选择的天堂
选择过多:
施瓦茨:《选择的悖论》——果酱实验:研究者们提供的选择越多,顾客们买的越少。
结论:随着选择空间不断扩大,丰富选择的消极面开始显现,随着选择空间的继续扩大,消极面会渐渐加大,直到令人不堪重负,这时候选择不再是一种解放,而是一种折磨和压迫。
正确的解决办法:不是限制选择,而是有序地组织选择,避免给消费者一种压抑的感觉。所谓的选择悖论只是缺乏决策助手的结果,并不等于拒绝多样性。
多样性并非一切:
更多的选择的确是件好事,但是仅有多样性是不够的,我们需要井然有序地组织选择,真正地帮助消费者们做出选择。网络零 售商用流行度、价格比较、用户评论等信息组织和协调用户选择。
多样性经济学:
更多的选择是否能鼓励消费者购买更多的东西?答案是:如果选择时有意义的,那么选择越多越好,更多的选择会带来更多的销量。数字媒介对传统的销售模式有两种影响:①它托看了潜在顾客的视野(更多的选择)②它缩短了搜索的时间(有效地选择)
第十章:利基文化
长尾的意义就是无限的选择,而无限的选择等于市场的终极细分。人们从共同兴趣转向特殊兴趣,这个趋势并不代表传统力量结构的终结,并不代表着我们正在转向纯业余性的电脑文化,今天我们的文化更像是头部和尾部的混合,机构和个人、专业者和业余者的混合,大众文化并没有陨落,只是不再那么大众化,而小领域文化也不再那么默默无闻了。
转变原因:消费者们并没有改变,他们的兴趣一直是不尽相同的,改变的是媒体技术和消费者使用媒体的习惯。传统的大众媒体只能满足大多数人的共同兴趣,媒体技术的进步使得特殊兴趣开始得到满足。
广而杂的平行文化:
我们的大众文化正在向一种广而杂的平行文化转移。我们每一个人都同时属于多个不同的文化部落,因为我们每一个人都是某个方面的极端另类者,这些知识人口特征(身材、肤色、性倾向、天赋才智)内在多样性的一种必然反映。
小众文化崛起将重塑社会景象,人们重新分散到成千上万的文化部落中(麦克卢汉:部落化→去部落化→重新部落化),部落之间的主要纽带不再是相邻的地理位置,而是共同的兴趣爱好(近距离社会区隔;远距离社会聚合)。
博客对报纸的冲击:
新闻业是首先受到互联网影响的行业(互联网发展的第一阶段:人与内容的互联互通)市场分化不可避免。
博客对报纸的冲击:①专注于某个特殊主体,高度专业化、垂直化,读者定位极端精确②博客世界的纠错机制强于传统媒体,在信息审查和平衡性上均强于传统媒体,博客拥有快速收集和筛选庞杂信息的的能力③几乎为零的生产成本(自我出版)④写作水平毫不逊色,更新速度快
大众文化被分割是好还是坏?
大众文化分割化的风险:①芝加哥大学森斯坦:网络文化鼓励了组织分化,随着交流空间越来越个性化,社会面临着分裂的风险,共同社区面临着瓦解的风险。②罗森:技术导致“个人中心主义”的抬头,也就是对个人品味的一种极端自我、极端狭隘的执着追求。
大众文化被分割的好处:①小众文化世界实际上是一个极度丰饶的世界,但强大的过滤器和推荐系统会指引着人们进行更多的探索,而不是面对纷繁的选择望而却步②网络时代没有权威,这将结束正统机构高高在上,不容挑战的特权时代。网络将催生积极探索和质疑权威的精神。
网络时代,我们正沿着不同的维度重新组织。
第十一章:无限的荧屏
年轻的消费者对电视的兴趣已经盛极而衰,更具互动魅力的互联网正在赢得眼球争夺战,互联网正在对电视造成威胁。
电视的局限:(1)有线广播技术的特点决定了电视频道始终是有限的;(2)时间因素的限制:①电视节目的数量始终是有限的②电视节目是转瞬即逝的③电视节目的编排方式固定。
互联网的优势:①海量的长尾视频市场②可以随时观看③视频内容短小,追求方便性和娱乐性的观众会转向更短小的内容,追求充实感和满足感的消费者会转向更长的内容。
第十二章:娱乐业之外(略)
第十三章:长尾法则
长尾市场的秘诀:
①提供所有产品(不容易做到)
②帮我找到它(容易实现:长尾集合器→搜索引擎、推荐系统、协同过滤)
成功长尾集合器的九大法则:
降低成本法则:①让存货集中或分散(沃尔玛的集中化仓储、亚马逊的“虚拟存货模式”),数字存货是最低成本的存货;②让顾客参与协同生产(维基百科、大众点评、豆瓣)→认知盈余、众包(crowdsourcing)
考虑小市场:③一种传播途径并不适合所有人,要想接触到最大的潜在市场,多重传播渠道是唯一的方法。④一种产品并不适合所有人,细分化产品。⑤一种价格并不适合所有人。只要编辑生产和销售成本接近于零(数字产品),可变价格就是自然而然的模式,在空间无限的丰饶市场上,可变价格是一个强大的工具,有助于产品价值和市场规模的扩大。
摆脱控制:⑥分享信息(推荐信息),信息提供方式必须有助于顾客的选择。⑦考虑“和”不要考虑“或”,丰裕时代的市场不是零和游戏,网络时代可以供应所有的产品。⑧让市场替你做事。“事前过滤器”和“事后过滤器”的在于预测和评测,而后者总是比前者更加准确,要去评测,不要去预测。⑨理解免费的力量。数字市场的成本几乎为零,因此免费成了网络世界中最常用的商业策略和模式(先获取用户,再考虑盈利)。
-
《大数据时代》读书笔记
2016-01-06
一、引言:一场生活、工作与思维的大变革
1.大数据,变革公共卫生。谷歌通过对海量搜索数据的分析,准确预测H1N1疫情
2.大数据,变革商业。Farecast预测机票价格走势帮助乘客省钱
3.大数据,变革思维。数据已经成为了一种商业资本,一项重要的经济投入,可以创造新的经济利益,一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。最惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系,这就推翻了自古以来的惯例。
4.大数据,开启重大的时代转型
5预测,大数据的核心
6.大数据,大挑战
第一部分大数据时代的思维变革
第1章更多:不是随机样本,而是全体数据
1.让数据“发声”
大数据与三个重大的思维转变有关:
①首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本
②其次,我们乐于接受数据的纷繁复杂,而不再追求精确性。
③最后,我们不再探求事物的因果关系,转而关注事物的相关关系
2.小数据时代的随机采样,最少的数据获得最多的信息
过去由于记录、存储和分析数据工具的限制,我们只能收集少量数据进行分析。
采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大,所以样本的随机性比样本数量更重要。随机采样取得了巨大成功,成为现代社会、现代测量的主心骨,但这只是一条捷径实在不可能收集和分析全部数据的情况下的选择,它本身存在很多固有的缺陷。
缺陷:
①它的成功依赖于采样的绝对随机性,但是实现采样的随机性非常困难,一旦采样过程中存在任何偏见,分析结果就会相去甚远。
②另外,随机采样不适合考查子类别的情况,因为一旦继续细分,随机采样结果的错误率就会大大增加,因此,当人们想了解更深层次的细分领域的情况时,随机采样的方法就不可取了。
③随机采样需要严密的安排与执行,人们只能从采样数据中得出事先设计好的问题的结果,缺乏延展性。
④无法捕捉事物的细节
3.全数据模式,样本=总体
条件:数据收集能力、数据存储能力、数据分析能力
大数据并不是绝对意义数量上的大,大数据是指不用随即分析法这样的捷径,而采用所有数据的方法。
第2章更杂:不是精确性,而是混杂性
1.允许不精确
在采样分析时代,对“小数据”而言,最基本、最重要的要求就是减少错误,保证质量,因为收集的信息量比较少,所以我们必须确保记录下来的数据尽量精确。
大数据时代,我们必须容忍不精确的出现,与各种各样的混乱作斗争,混乱一方面是指随着数据的增加,错误率也会增加;另一方面是指格式的不一致性。大数据是用概率说话,而不是精确性。
2.大数据的简单算法比小数据的复杂算法更有效
3.纷繁的数据越多越好
大数据时代要求我们重新审视精确性的优劣,大数据让我们不再期待精确性,也让我们无法实现精确性,错误并不是大数据的固有特性,而是一个亟待解决的现实问题,并且有可能长期存在。
4.混杂性,不是竭力避免,而是标准途径
分类法和索引法只在传统的“小数据”时代适用,一旦数据规模达到一定程度便失效,大数据时代清楚地分类法被更混乱却更灵活的机制所取代。
标签是网络资源的分类标准,标签的使用没有标准,没有预先设定的排列和分类,标签使互联网上的资源更容易找到,特别是图片、视频和音乐等无法用关键词搜索的非文本类资源。
要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是极力避免的。
5.新的数据库设计的诞生
只有5%的数字数据是结构化的且能适用于传统数据库,如果不接受混乱,剩下的95%的非结构化数据都无法被利用,通过接受不精确性,我们打开了一个新的世界。
大数据时代出现了非关系型数据库,它不需要预先设定记录结构,与需处理超大量五花八门的数据,因为它包容了结构多样性,这些数据库就要求更多的处理和存储资源。
传统的数据库设计要求在不同的时间提供一致的结果,但是随着数据的大幅增加以及系统用户的增加,这种一致性将越来越难保持。
大的数据库并不是固定在某个地方的,它一般分散在多个硬盘和多台电脑上,为了确保其运行的稳定性和速度,一个巨鹿可能会分开存储在两三个地方。
第3章更好:不是因果关系,而是相关关系
亚马逊推荐系统:知道是什么就够了,没必要知道为什么。
1.关联物,预测的关键
相关关系的核心是量化两个数据值之间的数理关系,相关关系强是指当一个数据值增加时,另一个数据值很可能也会随之增加,相关关系弱意味着当一个数据值增加时,另一个数据值几乎不会发生变化。相关关系通过识别有用的关联物来帮助我们分析 一个现象,而不是通过揭示其内部的运作机制,通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。
建立在相关关系分析法基础上的预测是大数据的核心,大数据的相关关系分析法更准确、更快,而且不易受偏见的影响。
2.“是什么”,而不是“为什么”
哲学界的争论:因果关系否定人的自由意志
丹尼尔·卡尼曼《思考,快与慢》:人有两种思维模式:第一种是不费力的快速思维,通过这种思维几秒钟就能得出结论;另一种是慢性思维,就是需要考虑到位。快速思维模式使人们偏向用因果联系来看待事物,而大多数情况下这种因果关系并不存在。
表面上因果关系是浅显易懂的,事实却并非如此,因果关系是很难被证明的,而相关关系却可以通过数据分析被轻易证明。
因果关系还是有用的,但是它不再被看做是意义来源的基础,在大数据时代,即使很多情况下我们依然指望用因果关系来说明我们所发现的相互联系,但是我们知道因果关系只是一种特殊的相关关系,相反,大数据推动力相关关系分析、县官关系通常能取代因果关系起作用,即使不可取代的情况下,它也能指导因果关系起作用。
3.改变,从操作方式开始
我们需要改变我们的操作方式吗,使用我们能搜集到的所有数据,而不仅仅是使用样本。我们不能再把精确性当成重心,我们需要接受混乱和错误的存在,另外我们应该侧重于分析相关关系,而不再寻求每个预测背后的原因
4.大数据,改变人类探索世界的方法
在小数据时代,我们会假想世界是怎么运作的,然后通过收集和分析数据来验证这种假想,在不久的将来,我们会在大数据的指导下探索世界,不再受制于各种假想,我们的研究始于数据。
假想通常来自自然理论和社会科学,它们也是帮助我们解释和预测周遭世界的基础,随着由假想时代到数据时代的过渡,我们很可能也不再需要理论了。
第二部分大数据时代的商业变革
第4章数据化:一切皆可“量化”
1.数据,从最不可能的地方提取出来
2.数据化,不是数字化。数字化指的是把模拟数据准换成用0和1表示的二进制码,数据化是指一种把现象转变为可制表分析的量化形式的过程。
3.量化一切,数据化的核心 。计量和记录一起促成了数据的诞生,它们是数据化最早的根基。
4.当文字变成数据 。当文字变成数据,它就大显神通了——人可以用之阅读,及其也可以用之分析。(谷歌的数字图书馆)
5.当方位变成数据。地球本身构成了世界上最基础的信息,人和事物的地理定位自然是信息的组成部分。对地理位置的数据化需要地理范围、标准、工具或者说量化、标准化、收集。(UPS最佳行车路径)
6.当沟通成为数据 数据化的构思是许多社交网络公司的脊梁,社交网络平台将我们日常生活中的无形元素提取出来,再转化为可作新用途的数据。
7.一切事物的数据化
第5章价值:“取之不尽,用之不竭”的数据创新
尽管数据长期以来一直是有价值的,但通常只是被视为附属于企业经营核心业务的一部分,或者被归入知识产权或个人信息中相对狭窄的类别。但在大数据时代,所有数据都是有价值的。
我们所处的时代之所以与众不同,是因为数据的收集不再存在固有的局限性。技术已经发展到一定程度,大量信息可以被廉价地捕捉和记录。数据经常会得到被动地收集,人们无须投入太多精力甚至不需要认识这些数据。而且,由于存储成本的大幅下降,保存数据比丢弃数据更加容易。这使得以较低成本获得更多数据的可以比任何时候都大。
不同于物质性的东西,数据的价值不会随着它的使用而减少,而是可以不断地被处理。这就是经济学家所谓的“非竞争性”的好处:个人的使用不会妨碍其他人的使用,而且信息不会像其他物质产品一样随着使用而有所耗损。
数据的价值并不仅限于特定的用途,它可以为了同一目的而被多次使用,也可以用于其他目的。要了解大数据时代究竟有多少信息对我们有价值,后面这一点尤其重要。
数据的真实价值就像是漂浮在海洋上的冰山,第一眼只能看到冰山一角,绝大部分隐藏在表面之下,判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。
最终,数据的价值是其所有可能用途的总和。这些似乎无限的潜在用途就像是选择,这里不是指金融工具意义上的选择,而是实际意义上的选择。这些选择的总和就是数据的价值,即数据的“潜在价值”。数据的潜在价值有三种最为常见的释放方式:基本再利用、数据集整合和寻找“一份钱两份货”,而数据的折旧值、数据废弃和开放数据则是更为独特的方式。
数据创新1:数据的再利用
数据创新再利用的一个典型例子是搜索关键词
数据创新2:重组数据
有时,处于休眠状态的数据的价值只能通过与另一个截然不同的数据集结合才能释放出来。用新的方式混合这些数据,我们可以做出很有创意的东西来。一个成功的例子是2011年发表的关于手机是否增加致癌可能性的一项有趣的研究。
随着大数据的出现,数据的总和比部分更有价值。当我们将多个数据集的总和重组在一起时,重组总和本身的价值也比单个总和更大。
数据创新3:可扩展数据
促成数据再利用的方法之一是从一开始就设计好它的可扩展性,。收集多个数据流或每个数据流中更多数据点的额外成本往往较低,因此,收集尽可能多的数据并在一开始的时候就考虑到各种潜在的二次用途并使其具有扩展性是非常有意义的。这增加了数据的潜在价值。问题的关键是寻找“一份钱两份货”,即如果以某种方式收集的单一数据集有多种不同的用途,它就具有双重功能。
数据创新4:数据的折旧值
随着时间的推移,大多数数据都会失去一部分基本用途。在这种情况下,继续依赖于旧的数据不仅不能增加价值,实际上还会破坏新数据的价值。
并非所有的数据都会贬值,有些公司提倡尽可能长时间地保存数据,即使数据用于基本用途的价值会减少,但潜在价值却依然强大。
潜在价值的概念表明,组织机构应收集尽可能多的使用数据并保存尽可能长的时间。同时也应当与第三方分享数据,前提是要保留所谓的“延展性”权利(专利许可术语)。这样一来,由数据再利用而产生的任何商业价值,原始数据拥有者都能从中分到一杯羹。数据收集者和拥有者无法想象数据再利用的所有可能方式,这一点几乎是不言自明的
数据创新5:数据废气
数据再利用的方式可以很巧妙、很隐蔽。网络公司可以捕捉到用户在其网站上做的所有事情,然后将每个离散交互当作一个“信号”,作为网站个性化、提高服务或创建全新数字化产品的反馈。两个关于拼写检查的故事给我们提供了一个生动的解释。(微软和谷歌)
数据废气用来描述人们在网上留下的数字轨迹,它是用户在线交互的副产品,包括浏览了哪些页面、停留了多久、鼠标光标停留的位置、输入了什么信息等。许多公司因此对系统进行了设计,使自己能够得到数据废气并循环利用,以改善现有的服务或开发新服务
数据创新6:开放数据
政府才是大规模信息的原始采集者,并且还在与私营企业竞争他们所控制的大量数据。政府与私营企业数据持有人之间的主要区别就是,政府可以强迫人们为他们提供信息,而不必加以说服或支付报酬。因此,政府将继续收集和积累大量的数据。
提取政府数据价值最好的办法是允许私营部门和社会大众访问,政府只是他们所收集信息的托管人,私营部门和社会对数据的利用会比政府更具有创新性。
给数据估值
公司所持有和使用的数据也渐渐纳入了无形资产的范畴。
如何给数据估值呢?一个办法是从数据持有人在价值提取上所采取的不同策略入手,最常见的一种可能性就是将数据授权给第三方。由于被许可人可能无法提取数据全部的潜在价值,因此数据持有人可能还会同时向其他方授权使用其数据,两边下注以避免损失。因而,“数据滥交”可能会成为一种常态。
数据价值的关键是看似无限的再利用,即它的潜在价值。收集信息固然至关重要,但还远远不够,因为大部分的数据价值在于它的使用,而不是占有本身。
第6章角色定位:数据、技术与思维的三足鼎立
大数据价值链的3大构成
根据所提供价值的不同来源,分别出现了三种大数据公司。这三种来源是指:数据本身、技能与思维。第一种是基于数据本身的公司,这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能(Twitter);第二种是基于技能的公司,它们通常是咨询公司、技术供应商或者分析公司(天睿);第三种是基于思维的公司,对于某些公司来说,数据和技能并不是成功的关键。
数据才是最核心的部分,过分强调技术和技能而忽视数据本身的重要性也是不可取的。
大数据掌控公司
大数据最值钱的部分就在于它自身,所以最先考虑数据拥有者才是明智的,他们可能不是第一手收集数据的人,但是他们能接触到数据、有权使用数据湖综合将数据授权给渴望挖掘价值的人。
大数据技术公司
第二种类型的公司就是拥有技术和专业技能的公司。大数据拥有着依靠技术专家来挖掘数据的价值,他们在数据中发现了价值,最后却要把这些价值拱手让给大数据拥有者。
大数据思维公司和个人
第三种类型是有着大数据思维的公司和个人(谷歌三者兼有),他们的优势在于能先人一步发现机遇,尽管本身并不拥有数据也不具备专业技能,他们只考虑可能性,而不考虑可行性。
所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。
全新的数据中间商
现今,我们正处在大数据时代的早期,思维和技能是最有价值的,但是最终,大部分的价值还是必须从数据本身中挖掘。数据拥有者会慢慢意识到大数据的价值,因此会把它们抓得更紧。
然而,对数据拥有者来说,有一个问题值得关注:那就是在有些情况下会出现数据中间人,他们会从各种地方搜集数据进行整合,然后再提取有用的信息进行利用,数据拥有者可以让数据中间人充当这样的角色,因为有些数据的价值只能通过中间人来挖掘。
这些中间人在这个价值链中站在了一个收益丰厚的位置上,但是它们并没有威胁到为他们提供数据的数据拥有者的利润。随着数据价值转移到数据拥有者手上,传统的商业模式也被颠覆了
专家的消亡与数据科学家的崛起
人类从依靠自身判断做决定到依靠数据做决定的转变,也是大数据做出的最大贡献之一。行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。专家在各个领域的影响力正在减弱,当然行业专家不会消亡,只是他们的主导地位会发生改变。
大数据,决定企业的竞争力
大数据成为很多公司竞争力的来源,从而使整个行业结构都改变了,大公司和小公司可能成为赢家,而大部分中等公司则可能在行业调整中失去优势。
行业领头羊(谷歌、亚马逊)会一直保持领先地位,他们的核心竞争力体现在数据规模上。规模仍然很重要,但是重要的是数据的规模,也就是说要掌握大量的数据而且要有能力轻松获得更多的数据,随着数据越来越多,大数据拥有着会大放异彩,因为他们可以把数据转换为价值。
大数据也为小公司带来了机遇,小公司能享受到非固有资产规模带来的好处。它们可能没有很多的固有资产但是存在感非常强,也可以低成本地传播它们的创新成果。重要的是,因为最好的大数据服务都是以创新思维为基础的,所以它们不一定需要大量的原始资本投入。数据可以授权但是不能被占有,数据分析能在云处理平台上快速而且低成本地进行,而授权费用则应从数据带来的利益中抽取一小部分。
大数据对中等规模的公司帮助并不大,超大型的公司占据了规模优势,而小公司则具有灵活性,大数据让处于行业两端的公司受益良多,而中等规模的公司要么向两端转换,要么破产。
第三部分大数据时代的管理变革
第7章风险:让数据主宰一切的隐忧
无处不在的“第三只眼”
大数据时代将会使我们给我们的隐私带来更大的威胁。另外还将面对一个新的挑战,即运用大数据预测来判断和惩罚人类的潜在行为,这是对公平公正以及自由意志的一种亵渎,同时也轻视了决策过程中深思熟虑的重要性。
除了对隐私和倾向的不良影响,大数据还有一个弊端,那就是我们毛线把最烦的定罪权放在了数据受众,但这实际上是一种滥用。应用得当,大数据会是我们合理决策过程中的有力武器;倘若应用不当,它就可能成为权贵用来镇压民众的工具。
我们的隐私被二次利用了
大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用。大数据时代,很多数据在收集的时候并无意用作其他用途,而最终却产生了很多创新性的用途。这就颠覆了传统隐私保护法以个人为中心的思想:数据收集者必须告知个人,他们收集了哪些数据、作何用途,也必须在收集工作开始之前征集个人的同意,大数据时代,“告知与许可”完全没有意义了。
想在大数据时代中用技术方法来保护隐私也是天方夜谭。如果所有人的信息本来都已经在数据库里,那么有意识地避免某些信息就是此地无银三百两。
另一条技术途径在大部分情况下也不可行,那就是匿名化。匿名化指的是让所有能揭示个人情况的信息都不出现在数据集里,在小数据时代这样确实可行,但是随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化对大数据呈现出无效性。出现这种无效性则是由两个因素引起的,一是我们收集到的数据越来越多,二是我们会结合越来越多不同来源的数据。
在大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了,这是因为大数据时代的监控方式已经改变了。
预测与惩罚,不是因为所做,而是因为“将做”
人们不是因为所做而受到惩罚,而是因为将做,即使他们事实上并没有犯罪,不受限制的大数据分析可能会导致罪责的判定是基于对个人未来行为的预测。基于未来可能行为之上的惩罚是对公平正义的亵渎,因为公平正义的基础是人只有做了某事才需要对它负责
主要的问题是我们在人们真正犯罪之前对他进行惩罚否定了人的自由权利。我们永远不会知道这个受惩罚的人是否会真正犯罪,因为我们已经通过预测预先制止了这种行为,如此一来,我们就没有让他按照他的意愿去做,但是我们却依然坚持他应该为自己尚未实施的未来行为付出代价,而我们的预测也永远无法得到证实,这否定了法律系统或者说我们的公平意识的基石——无罪推定原则。
大数据的不利影响并不是大数据本身的缺陷,而是我们滥用大数据预测所导致的结果。
数据独裁
大数据大大地威胁到了我们的隐私和自由,这都是大数据带来的新威胁。但是与此同时,它也加剧了一个旧威胁:过于依赖数据,而数据远远没有我们所想的那么可靠。在由“小数据”时代向大数据时代转变的过程中,我们对信息的一些局限性必须给予高度的重视。数据的质量可能会很差;可能是不客观的;可能存在分析错误或者具有误导性;更糟糕的是,数据可能根本达不到量化它的目的。
挣脱大数据的困境
必须杜绝对数据的过分依赖
第8章掌控:责任与自由并举的信息管理
我们在生产和交流信息方式上的变革必然会引发自我管理所用规范的变革。但变革并不止于规范,管理规范上的转变也体现着更深层次价值观的转变。
大数据时代,对原有规范的修修补补已经满足不了需要,也不足以抑制大数据带来的风险——我们需要全新的制度桂发,而不是修改原有规范的适用范围。想要保护个人隐私就需要个人数据处理器对其政策和行为承担更多的责任;同时,我们必须重新定义公正的概念,以确保人类的行为自由。
管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任
一直以来,全球范围内的隐私规范都开始让人们自主决定是否、如何以及经由谁来处理他们的信息,把这种控制权放在人们自己的手中,这也是隐私规范的核心准则。在互联网时代,这个准则往往会演变成“告知与许可”的公式化系统。
而在大数据时代,这个模式应该更着重于数据使用者为其行为承担责任,而不是将重心放在收集数据之初取得个人同意上。
此外与目前隐私保护法所要求的不一样,数据使用者在达到最初的目的之后不再规定必须删除信息,相反允许较长时间保存数据,但社会必须平衡二次运用的优势与过度披露所带来的风险,为实现这一平衡,监管机制可以决定不同种类的个人数据必须删除的时间。再利用的时间框架则取决于数据内在风险和社会价值观的不同。更适用于大数据时代的平衡:公司可以利用数据的时间更长,但相应地必须为其行为承担责任以及负有特定时间之后删除个人数据的义务。
除了从个人许可到数据使用者承担相应责任的转变,我们也需要发明并推行新技术方式来促进隐私保护,一个途径就是“差别隐私”:故意将数据模糊处理,促使对大数据库的查询不能显示精确的结果,而只有相近的结果。这就使得挖出特定个人与特定数据点的联系变得难以实现并且耗费巨大。
管理变革2:个人动因VS预测分析
在大数据时代,关于公正的概念需要重新定义以维护个人动因的想法:人们选择自我行为的自由意志。简单地说,就是个人可以并应该为他们的行为而非倾向负责。
身处大数据时代,我们必须拓宽对公正的理解,必须把对个人动因的保护纳入进来,就像目前我们为程序公正所做的努力一样。如若不然,公正的信念就可能被完全破坏。
管理变革3:击碎黑盒子,大数据程序员的崛起
大数据的运作是在一个超出我们正常理解的范围之上的,因此大数据预测、运算法则和数据库有变为黑匣子的风险,这个黑匣子不透明、不可解释、不可追踪。为了防止这些情况的出现,大数据将需要被监测并保持透明度,将会有一个新的人群来扮演监测的角色。
算法师:他们有两种形式:在机构外部工作的独立实体和机构内部的工作人员。这些新的专业人员会是计算机科学、数学和统计学领域的专家,他们将担任大数据分析和预测的评估专家。他们必须保证公正和保密。他们可以评估数据源的挑选,分析和预测工具的选取,甚至包括运算法则和模型,以及计算结果的解读是否正确合理。一旦出现争议,他们有权考察与分析结果相关的运算法则、统计方法以及数据集。
管理变革4:反数据垄断大亨
为了促进大数据平台上的良性竞争,政府必须运用反垄断条例。我们提出了三项策略,包括隐私保护从个人许可到数据使用者承担责任的转变,在使用预测分析时考虑个人动因以及催生大数据审计员,也就是算法师。这都将是大数据时代对信息进行有效、公正管理的基础