时代背景下的一些常识科普_智能时代书评-查字典图书网

信息很明确。观点很清晰。个人觉得第三，第五章比较精彩，各种案例就不免同质了。

第一章人类文明过程：获取数据 - 分析数据 - 建立模型 - 预测未知

从数据中提取有价值的信息，对其进行处理后，就可以获得系统性的知识。数据和想获得的信息之间的联系往往是间接的，因此相关性是使用数据的钥匙。数据驱动（data-driven）：当数据量够多时，可用若干简单模型取代一个复杂模型。随机性和噪声影响可忽略不计（切比雪夫不等式）—> 可受益于技术进步

第二章机器智能定义机器智能：图灵测试（Turing Test） 1956年达特矛斯会议提出问题 - 飞鸟派 - 贾里尼克从通信角度看待语言识别问题 - 用数据驱动方法解决智能问题

大数据各个维度的数据从点和线逐渐连成网，关联性大大提高特征：Vast - Variety 完备性（多维度） - Velocity 未必及时

变智能问题为数据问题 -> 由大数据驱动的智能革命

第三章思维历程与新思维欧几里得托勒密牛顿：建立在逻辑推理基础上的科学方法论机械思维：世界变化是规律的、确定的、普适的（因果）。 —> 工业革命牛顿物理建立在绝对时空基础上；爱因斯坦相对论建立在光速恒定基础上。局限性：找到因果关系的运气成分很大；否认不确定性与不可知性。

爱因斯坦 vs 波尔量子力学：“上帝不掷色子” 不确定性：1. 影响因子过多 2. 量子力学测不准原理：位置测量误差和动量测量误差的乘积不可能无限小——测量活动本身影响被测量结果（股市）——通过概率模型描绘出电子云香农信息论：信息量的度量等于不确定性的多少。在封闭系统中，熵永远朝不断增加的方向发展，微观上越无序，宏观上趋于恒温。香农第一定律：对信源信息编码，编码长度一定超过信息熵；但存在最优编码使其无限接近信息熵（汉字的不确定性）—> 将最短的编码分配给最常见的汉字。香农第二定律：信息传播速率不可能超过信道容量。最大熵原理：寻找概率模型时应满足观察到的所有数据，但对未知情况不作任何假设。互信息：信息间相关性的度量交叉熵（Kullback-Leibler Divergence）两个信息源（概率模型）间的一致性——数据驱动方法中建模数据与观测数据间要有一致性——数据完备性：足够覆盖黑天鹅。

许多智能问题就是用信息消除不确定性的问题经济学Gilder’s Law：尽可能多地采用便宜的资源，节省贵的资源。用相关性代替因果关系：烟草危害健康 Google本质上是一家数据公司。

第四章商业案例与新商业模式现有产业+X=新产业

数据流（data flow）：局部 - 整体 -局部应用：宏观上优化销售网络，微观上直接对话服务消费者。

用大数据推测大麻种植；偷税漏税；塔吉超市货架。 Amazon优势：实时搜集全面数据并实时调整。数据量不够时尝试客户聚类的方式证明效果并不好。传统零售业并非不能利用大数据，只是个性化(item to item)和实效性等方面很难做得像电商一样有效。 Netflix业务腾飞来源于数据积累后的个性化推荐。 Google个性化的搜索关键词提示 - Google Now基于当下时间地点做推荐酒吧用RFID控制酒保倒酒量。综合分析影响酒销量的因素。 Prada用RFID分析影响时装销量因素。 To B: 金风的服务转型：预测性维护遍历所有情况：Google自动驾驶汽车信息时代NASDAQ（National Association of Securities Dealers Automated Quotation）取代传统报价孟山都种子统治农业 GE冰箱通过wifi帮助替换耗材。

安迪比尔定律其实有助于计算机产业链的革新。 IT与服务将是IT领域最好的行业。制造业vs互联网基因：联想市值是100亿美元时，小米是450亿。

PS. 有意思的是，IT就是曾经的电类似的观点大约一年前对小伙伴说过。这一章对我来说新意不多，毕竟是曾经在软件公司做创新时一整年的工作内容……

第五章：技术挑战技术拐点：数据量爆发式增长；相关技术走向成熟。数据产生：智能设备；传感器；现有信息数字化与UGC。信息存储：机械运动的硬盘读取速度受限制—>半导体的固态存储器（Solid State Drivers）信息传输：LTE与Wi-Fi 信息处理：并行计算；前提为交换机与网络的速度

数据搜集：全样本；间接曲线救国：收购智能家居公司；Google Voice用来训练语言识别数据存储：Google GFS可扩展的分布式文件系统；压缩时去除冗余；节省备份空间技术难题：由于富媒体数据也需要建立索引；标准化数据格式 —> Google Protocol Buffer数据格式并行计算工具：Google MapReduce（编程模型）；雅虎Hadoop 并行比例（Parallel Portion）一个任务中有多少可以并行计算从根本上改变系统设计和算法，才能实时处理大数据 Google Dremel基于内存而不是硬盘；以数据列为优先存储，方便多维度数据按某个特定维度进行挖掘。

数据挖掘：信噪比Signal Noise Ratio：使用数据前常需要进行降噪，损失一部分数据以提高信噪比。

机器学习：期望值最大化（Expectation Maximization）实践中，由大量数据、较少迭代训练出的粗糙模型要比少量数据、深度学习的精细模型效果更好。大型人工神经网络训练：将一个很大模型上千万参数同时训练的问题简化为能够分布到上万台服务器上的小问题。大型机器学习算法需要稳定，一旦实现就不能三天两头改进。大部分算法都是等效的，没有质的差别，而量的差别可以通过规模和数据量来弥补。

数据安全：在文件系统和操作系统设计上加以改进；大数据识别黑客。用户总倾向于放弃隐私而选择便利性。危害：保险公司拒保；价格歧视等等。

第六章产业智能智能浇灌；金州勇士；特斯拉重新定义汽车行业；医药研发；智能诊断；个性化药物；找到衰老基因；分析法律文献；自动生成新闻

第七章未来社会智能交通；精细化社会：RFID和区块链 Block Chain 等记录运输和交易全过程隐私保护：不能指望公司的善意，也很难通过立法解决。劳动力：工业革命的副产品是资本输出；全球殖民；自由贸易；发动战争；受工会拖累的美国汽车智能时代首先受益的是善于利用新技术的人。

时代背景下的一些常识科普

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读