《Python数据分析》升级版第二期

课程简介:

本期课程在《Python数据分析》升级版的基础上,主要新增了探索性数据分析(Exploratory Data Analysis,EDA)、金融数据量化分析及深度学习基础等三大数据分析工具,覆盖了时下最前沿的数据分析技术。具体新增内容如下:

新增探索性数据分析,更好地结合数据可视化发掘数据的模式与特点
新增金融数据量化分析,更好地结合时间序列分析探索金融数据的发展趋势
新增深度学习基础,更好地结合机器学习探索人工智能的技术趋势
升级并调整全部随课项目,并提供更详细的分析步骤
系统性地将相关章节的项目整理成一个完整的项目,使学员能够更加充分地理解数据分析的流程和步骤

[code]官方课程链接:http://www.chinahadoop.cn/course/937[/code]

课程目录:

第一课 工作环境准备及数据分析建模理论基础 (2-3课时)
1. 课程介绍
2. 数据分析的基本概念
3. Python简介和环境部署
4. NumPy数据结构及向量化
5. 数据分析建模理论基础
a. 机器学习基础

b. 数据分析建模过程
c. 常用的数据分析建模工具
6. 实战案例1:使用Python实现蒙特卡洛模拟的期权估值

第二课 数据分析工具Pandas (2-3课时)
1. Pandas的数据结构
2. Pandas的数据操作
a. 数据的导入、导出
b. 数据的过滤筛选
c. 索引及多重索引
3. Pandas统计计算和描述
4. 数据的分组与聚合
5. 数据清洗、合并、转化和重构
6. 实战案例2-1:Lending Club借贷数据处理及初步分析

第三课 探索性数据分析(EDA)及数据可视化 (2-3课时)
1. 什么是EDA
2. 探索单变量、多变量的关系及其可视化
3. 3D绘图
4. 实战案例2-2:Lending Club借贷数据探索性分析及可视化

第四课 机器学习及scikit-learn(2-3课时)
1. 机器学习基本概念与流程
2. Python机器学习库scikit-learn
3. 常用评价指标
4. 分类预测模型– Logistic回归与Softmax回归
5. 实战案例2-3:Lending Club借贷违约预测

第五课 金融数据分析(1)–金融时间序列(2-3课时)
1. Pandas的时间处理及操作
2. 金融数据
3. 金融学图表
4. 高频数据分析
5. 实战案例3-1:股票收益率回归分析

第六课 金融数据分析(2)–量化分析 (2-3课时)量化分析基础
1. 量化策略建模流程及回测
2. 常用量化分析指标及框架
3. TA-Lib金融软件工具
4. 实战案例3-2:多因子策略模型

第七课 图像数据处理及分析 (2-3课时)
1. 基本的图像操作和处理
2. 常用的图像特征描述
3. 聚类模型:K-Means
4. 实战案例4:电影海报主色调聚类分析

第八课 深度学习及TensorFlow (2-3课时)
1. 人工神经网络及深度学习
2. TensorFlow框架学习及使用
3. TensorFlow实现卷积神经网络
4. 实战案例5:基于TensorFlow的101类图像识别(Caltech101)

第九课 文本数据分析 (2-3课时)
1. Python文本分析工具NLTK
2. 情感分析与文本分类
3. TensorFlow实现文本深度表示模型Word2Vec
4. 分类与预测模型– 朴素贝叶斯
5. 实战案例6:搜狐新闻数据分类

第十课 项目实战(2-3课时)
1. 交叉验证及参数调整
2. 特征降维与特征选择
3. 实战案例7:根据日常新闻预测股市动向
4. 课程总结

课程截图:

小象学院:机器学习升级版 第七期 机器学习算法视频教程

课程简介:

课程目标:
本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现(Python)、如何做算法的参数调试、以实际应用案例分析各种算法的选择等。

内容特色:
1.每个算法模块按照“原理讲解→分析数据→自己动手实现→特征与调参”的顺序,“原理加实践,顶天立地”。
2.拒绝简单的“调包”——增加3次“机器学习的角度看数学”和3次“Python数据清洗和特征提取”,提升学习深度、降低学习坡度。
3.增加网络爬虫的原理和编写,从获取数据开始,重视将实践问题转换成实际模型的能力,分享工作中的实际案例或Kaggle案例:广告销量分析、环境数据异常检测和分析、数字图像手写体识别、Titanic乘客存活率预测、用户-电影推荐、真实新闻组数据主题分析、中文分词、股票数据特征分析等。
4.强化矩阵运算、概率论、数理统计的知识运用,掌握机器学习根本。
5.阐述机器学习原理,提供配套源码和数据;确保“懂推导,会实现”。
6.删去过于晦涩的公式推导,代之以直观解释,增强感性理解。
7.对比不同的特征选择带来的预测效果差异。
8.重视项目实践(如工业实践、Kaggle等),重视落地。思考不同算法之间的区别和联系,提高在实际工作中选择算法的能力。
9.涉及和讲解的部分Python库有:Numpy、Scipy、matplotlib、Pandas、scikit-learn、XGBoost、libSVM、LDA、Gensim、NLTK、HMMLearn,涉及的其他“小”库在课程的实践环节会逐一讲解。

官方课程链接:http://www.chinahadoop.cn/course/1068

课程目录:

第一课:机器学习与数学分析
第二课:概率论与贝叶斯先验
第三课:矩阵和线性代数
第四课:Python基础
第五课:Python基础2 – 机器学习库
第六课:Python基础3 – 数据清洗和特征选择
第七课:回归
第八课:Logistic回归
第九课:回归实践
第十课:决策树和随机森林
第十一课:决策树和随机森林实践
第十二课:提升
第十三课:提升实践
第十四课:SVM
第十五课:SVM实践
第十六课:聚类(上)
第十七课:聚类(下)
第十八课:聚类实践
第十九课:EM算法
第二十课:EM算法实践
第二十一课:主题模型LDA
第二十二课:LDA实践
第二十三课:隐马尔科夫模型HMM
第二十四课:HMM实践

课程截图: