Python数据分析与机器学习实战
2017-02-07
Python数据分析与机器学习实战
课程观看地址:http://www.xuetuwuyou.com/course/167
课程出自学途无忧网:http://www.xuetuwuyou.com
课程风格通俗易懂,真实案例实战。精心挑选真实的数据集为案例,通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习。旨在帮助同学们快速上手如何使用python库来完整机器学习案例。
课程目标
零基础快速掌握python数据分析与机器学习算法; 快速入门python最流行的数据分析库numpy,pandas,matplotlib; 从原理上进行推导较为繁琐的机器学习算法,以算法流程为主结合实际案例实现完整的算法代码; 使用scikit-learn机器学习库完成快速建立模型,评估以及预测; 结合Kaggle经典案例,从数据预处理开始一步步完成整个项目,对如何应用python库完成实际的项目形成完整的经验与概念。
适合人群:
数据分析,机器学习,数据挖掘领域研究者。Python语言使用者。
课程目录:
第1 章 : Python环境配置
课时1:使用Anaconda安装python环境
课时2:Eclipse配置python插件
课时3:课程简介
第2 章 : Python科学计算库-Numpy
课时4:Numpy库简介
课时5:Array数组
课时6:数组操作
课时7:矩阵基本操作
课时8:矩阵的创建与初始化
课时9:常用函数案例演示
课时10:排序与索引
课时11:习题实例
第3 章 : python数据分析处理库-Pandas
课时12:Pandas库简介
课时13:数据读取与显示
课时14:数据样本行列选取
课时15:数值计算与排序
课时16:数据预处理与透视表
课时17:自定义函数方法
课时18:核心数据结构Series详解
课时19:数据索引变换
第4 章 : Python数据可视化库-Matplotlib
课时20:Matplotlib简介
课时21:画出第一个简易折线图
课时22:打造一个完整的折线图
课时23:条形图实战
课时24:直方图与四分图
课时25:基于真实数据集的可视化分析
课时26:可视化图表细节
第5 章 : Python机器学习案例实战
课时27:初识机器学习
课时28:使用python库分析汽车油耗效率
课时29:使用scikit-learn库建立回归模型
课时30:使用逻辑回归改进模型效果
课时31:模型效果衡量标准
课时32:ROC指标与测试集的价值
课时33:交叉验证
课时34:多类别问题代码
课时35:梯度下降原理
课时36:实现简易梯度下降算法
课时37:SVD奇异值分解原理
课时38:SVD推荐系统应用实例
课时39:K近邻算法原理
课时40:K近邻算法代码实现
课时41:K近邻实例
第6 章 : 决策树与随机森林
课时42:决策树算法原理
课时43:基于ID3算法进行特征选择
课时44:构建决策树
课时45:使用scikit-learn库建立决策树
课时46:分类回归树CART
课时47:分类回归树代码实现
课时48:随机森林模型
课时49:随机森林特征重要性
第7 章 : 聚类模型
课时50:无监督聚类问题
课时51:聚类结果与离群点分析
课时52:K-means聚类案例对NBA球员进行评估
课时53:K-MEANS原理
课时54:K-MEANS聚类算法实现
第8 章 : 支持向量机
课时55:支持向量机算法原理
课时56:支持向量机对偶问题
课时57:核变换解决低维不可分问题
课时58:soft-margin支持向量机
课时59:SMO算法求解支持向量机
第9 章 : 神经网络模型
课时60:初识神经网络
课时61:神经网络强大的非线性
课时62:深入神经网络细节
课时63:代码实现简易神经网络
课时64:深度学习-递归神经网络
课时65:神经网络打造二进制加法器
第10 章 : 贝叶斯模型
课时66:贝叶斯原理
课时67:基于贝叶斯的垃圾邮件分类
课时68:使用贝叶斯算法打造拼写检查器
课时69:K近邻算法实现
第11 章 : Adaboost算法
课时70:Adaboost算法原理
课时71:Adaboost实例
课时72:Adaboost实现代码
课时73:Adaboost训练模型
第12 章 : 机器学习项目实战-泰坦尼克获救预测
免费 课时74:船员数据分析
免费 课时75:数据预处理
课时76:使用回归算法进行预测
课时77:使用随机森林改进模型
课时78:随机森林特征重要性分析
第13 章 : 机器学习项目实战-贷款申请最大化利润
课时79:数据清洗过滤无用特征
课时80:数据预处理
课时81:获得最大利润的条件与做法
课时82:预测结果并解决样本不均衡问题
第14 章 : 机器学习项目实战-用户流失预警
课时83:数据背景介绍
课时84:数据预处理
课时85:尝试多种分类器效果
课时86:结果衡量指标的意义
课时87:应用阈值得出结果
第15 章 : 机器学习项目实战-HTTP日志聚类分析
课时88:建立特征工程
课时89:特征数据预处理
课时90:应用聚类算法得出异常IP点