-
第一章数据分析概述
介绍数据分析基本思想、方法、应用场景
-
●1.1数据分析概述
介绍数据分析基本思想、方法、应用场景
-
第二章Python入门
介绍Python发展历程,基本语法、常见数据读写、基本编程思想、常用数据分析包(Numpy,Pandas,Matplotlib等)
-
●2.1Python简介
了解Python基本发展历程和功能;掌握Python基本操作。
-
●2.2Python基本语法
介绍Python基本语法知识,三种常见内置数据结构(列表、元组和字典)及其基本操作。
-
●2.3Python基本编程
介绍常用Python编程基本语法结构,含If-else选择结构、for循环结构、while循环结构,并通过典型综合案例展示这些语法结构的应用。
-
●2.4Python三剑客
介绍Python数据分析最常用的三个包,即Numpy,Pandas,Matplotlib,通过案例形式展示这些基础包的使用方法。
-
第三章Python基本数据分析实战
常见数据预处理方法、描述统计及可视化方法、常用统计推断方法,以及上述方法的Python实现
-
●3.1数据预处理
介绍常见的数据预处理方法,如缺失值的发现与处理、异常值的发现u处理,以及离散变量如何转为分类变量(重编码),并通过综合案例展示数据预处理的基本流程。
-
●3.2描述统计方法及实战
介绍描述统计常见的四类统计量(集中程度、离散程度、偏差程度、相关程度)的基本概念和使用场景,以及常用数据可视化技术和使用场景。
-
●3.3推断统计方法及实战
介绍推断统计中最为精彩的假设检验技术,通过案例模式讲解参数类假设检验(独立样本T检验、配对样本T检验、单因素方差分析),以及典型非参数检验(卡方检验、列联表分析、游程检验)的基本思想、算法、使用场景。
-
第四章Python高级数据分析实战
介绍机器学习基本原理和工作流程,有监督学习常见方法(回归方法和常见经典分类方法),无监督学习常见方法(聚类分析、主成分分析降维技术);通过案例式讲授每种算法的全部工作流程,注重通过Python编程让算法落地,帮助学习者掌握常见机器学习技术。
-
●4.1机器学习方法概述
介绍机器学习基本概念、基本思想和基本方法,概述本章知识结构体系、涉及的基本算法、基本案例。
-
●4.2有监督学习之回归问题: 线性回归方法及实战
介绍机器学习中的有监督学习,重点阐述回归问题(因变量为连续型变量)的基本思想、算法流程和应用场景,通过两个案例从简单的一元线性回归到复杂的多元线性回归进行深刻讲授,帮助学习者掌握回归类问题的Python实现。
-
●4.3有监督学习之分类问题: 判别分析
介绍机器学习有监督学习中的分类问题,讲授Fisher线性判别算法基于投影分类的思想,通过手工推导算例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。
-
●4.4有监督学习之分类问题: K最近邻算法
介绍机器学习有监督学习中的分类问题,讲授K最近邻(KNN)分类算法的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。
-
●4.5有监督学习之分类问题: 朴素贝叶斯算法
介绍机器学习有监督学习中的分类问题,讲授朴素贝叶斯分类算法的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。
-
●4.6有监督学习之分类问题:Logistic回归
介绍机器学习有监督学习中的分类问题,讲授Logistic算法分类的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。
-
●4.7有监督学习之分类问题:决策树
介绍机器学习有监督学习中的分类问题,讲授决策树算法分类的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。
-
●4.8有监督学习之分类问题:随机森林
介绍机器学习有监督学习中的分类问题,讲授随机森林集成学习算法分类的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。
-
●4.9无监督学习之聚类:聚类分析
介绍机器学习中的无监督学习问题,讲授K-means聚类算法的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现聚类分析的全部流程。
-
●4.10无监督学习之降维:主成分分析
介绍机器学习中的无监督学习降维问题,讲授主成分分析(PCA)降维算法的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现降维全部流程。
-
●4.11机器学习高级话题
介绍机器学习高级话题,涉及模型调参、交叉验证、模型评价等问题,以KNN算法为例讲授如何通过上述环节提升模型预测的准确率,从而构建更加精准的模型。