Head First Data Analysis_20161009
2016-10-15
第1章 分解数据
数据分析师
做出更好决策、解决问题
确定问题 -> 分解 -> 评估 -> 决策
第2章 实证数据
观察分析法
怀疑因果关系时,反方向思考
拆分数据块,管理混杂因素
比较法
控制组(control group)(对照组)
同期控制法
历史控制法
第3章 寻找最优值
Excel Solver
第4章 数据图形化
散点图
数据可视化 Edward Tufte
https://www.zhihu.com/question/19710815
因果模型
第5章 假设检验
证伪法
变量网络
诊断性 证据能够帮忙按强弱程度对假设进行排列
第6章 贝叶斯统计
基础概率
P(L|+)=P(L)P(+|L)/(P(L)P(+|L)+P(~L)P(+|~L))
第7章
数字化的主观概率
标准偏差 =STDEV(数据)
用贝叶斯规则修正主观概率,把新证据整合到主观概率里
第8章 启发法
快省树
第9章 直方图
R语言
第10章 回归
R语言
散点图:寻找变量之间的因果关系
线性回归
回归线 截距 斜率
线性模型 lm
第11章 误差
机会误差(残差)
外插法
内插法
均方根误差
优秀的回归分析兼具解释和分析功能
第12章 关系数据库
Excel
=COUNTIF
=SUMIF
关系数据库管理系统 RDBMS
第13章 数据整理
Excel
R语言
Excel
=FIND
=LEFT
=RIGHT
=TRIM
=LEN
=CONCATENATE
=VALUE
=SUBSTITUTE
R语言
正则表达式