对于数据挖掘入门非常有帮助
2016-02-14
很早买了这本书,今天花了一个多小时翻了一下。非数据挖掘从业者。一个感觉,文字太多了,应该多穿插一下图来辅助讲解。
数据化运营,以企业级海量数据的储存和分析挖掘应用为核心支持,企业全员参与,以精准细化和精细化为特点的企业运营制度和战略。
常见的错误观念,
轻视业务论,技术万能论,技术尖端论,建模与应用两段论,机器万能论。
常见的数据分析项目类型
目标客户的特征分析,目标客户的预测模型,用户路径分析,交叉销售,销售预测,用户分层,信用模型,商品推荐模型。
神经网络是一组互相连接的输入输出单元,其中每个连接都会与一个权重相关联,在学习阶段,通过调整这些连接的权重,就能够预测输入观察值的正确类标示。
相比数据挖掘中常用的其他算法例如决策树,神经网络,邻近记忆梳理等,逻辑回归技术最为成熟,应用最广泛。
统计技术中的假设检验,是应用最集中最普遍的,并且可以有效的满足分析需求。
路径分析的几种方法
社会网络分析,基于链接
基于序列的关联分析,仅仅分析先后顺序的关联关系
最朴素的遍历史的方法,例如把特定页面的所有来源以及相应的流量大小整理出来,同时把下一个去向的页面整理出来,再结合业务特点,做深入分析。