人工智能是未来10年可期有大发展的领域,也是我们从事数据行业的职业愿景。看我这本书,更加坚定这是一个可期,有意思的方向。下面是我读这本书的过程中,产生的对于数据分析和应用的一些理解和总结。
基本思路
经典思路:目前在做数据分析时,采用的是传统的逻辑推理的分析的思路。先提出问题,再通过严谨的逻辑推理进行验证,解释商业问题。
新思路:尝试使用相关性进行数据挖掘分析;就是数据挖掘的一些技术,比如聚类、决策树、随机森林等高级统计模型。这种思路做出的东西,一般而言是技术门槛较高、解决经典思路无法解答的问题,也符合当前流行的大数据思维、人工智能思维。新思路的处理问题逻辑,先有相关性分析,找出导致问题的相关性因素,然后再解释背后的商业逻辑。
适用范围
经典思路:符合人脑的思维模式,由A —>B —> C的逻辑顺序。在解决小而美的独立case时,效率高。比如,“为什么今天某个页面的转化率突然升高啦”这类的问题,通过逻辑推理,一步一步下钻,可以很快定位原因。
新思路:这是AlphaGo下围棋是采用的思路,决策next move是因为next move对最终赢得棋局概率最高。这是一种结果导向的思维,将智能问题变成了数据问题。AlphaGo不需要知道如何布局,只关注每一次的落子都在提高最终胜利的概率。这种思路可以解决目标明确且影响因素众多的决策问题。
附上读书时做的思维导图,供各位参考。【有兴趣的可以留下邮箱获得清晰版本,豆瓣不知如何上传清晰版本】
-
王坚其人,其事,其思
2016-12-05
一个充满争议的心理学教授,曾经的阿里巴巴集团的CTO,如果不读这本书,仅仅凭借外界对王坚的评价,你很容易认为他是个纯靠忽悠的人。读读这在线,对他会有新的认识。王坚的确是个很会讲故事的人,某种意义上是个“忽悠”高手,视野、格局很高,眼界深远的“忽悠”。
通过提出在线的概念来论述互联网的本质和价值所在,以此建立一套理论,国内也没用几个人可以做到吧。由其主导的,也是争议最多的阿里云计算服务,为初创企业进一步轻资产化,将重心放在做产品,而不用花在购置服务器,做各种系统维护上,还能帮助社会在节约资源的情况下,提供计算能力的服务解决类似双十一这种一年一次的高峰集中访问。
在线这本书中,有大量的关于电的故事,用来帮助大家理解互联网作为基础设施的实质,以及在线对于未来的重要性,计算成为公共服务的必然。数据是生产资料,通俗的话就是数据是 一座金山,企业的决策越来越依赖数据,不再是拍胸脯,拍脑袋的主观经验和感觉。是否拥有数据,成为未来竞争力的一种体现。
王坚是个战略思维级别的人,你会因为读了这本书明确了一些大方向,引起了你的进一步的思考。这位博士生导师,他不会给你具体操作的方案,只会给你他理解的未来的影像。而方向往往是最难找的。
身处互联网数据行业的人都需要去读读这本书,这里面有数据的未来,云计算的未来,互联网的未来。这本书很口语化,容易读,但是你得多思考,博士的讲述会激发你的脑洞打开,才思泉涌。