Python数据分析实战
Python数据分析实战
1万+ 人选课
更新日期:2025/05/23
开课平台智慧树
开课高校鲁东大学
开课教师刘广臣
学科专业经济学经济学类
开课时间2025/01/21 - 2025/07/20
课程周期26 周
开课状态开课中
每周学时-
课程简介
大数据时代,想学点数据统计分析方法?还想学点机器学习?什么?还想学Python? 那就来《Python数据分析实战》吧!本课程特色:(1)精析数据分析算法,培养数据分析意识;(2)嵌入Python软件,培养算法落地能力;(3)剖析20+精彩案例,培养综合实战技能。您心动了吗?那就马上行动吧!
课程大纲

在线教程

章节简介教学计划
数据分析概述
登录后可预览视频
数据分析概述
刘广臣
Python入门
Python简介
Python简介
刘广臣
基本操作
刘广臣
Python基本语法
基础知识
刘广臣
基本数据结构:列表
刘广臣
基本数据结构:元组和字典
刘广臣
Python基本编程
If-else选择结构
刘广臣
for 循环结构
刘广臣
while循环结构
刘广臣
编程综合案例
刘广臣
Python三剑客
Numpy包(上)
刘广臣
Numpy包(下)
刘广臣
Pandas包(上)
刘广臣
Pandas包(下)
刘广臣
Matplotlib包
刘广臣
Python基本数据分析实战
数据预处理
缺失值的发现与处理(理论)
刘广臣
缺失值的发现与处理(实操)
刘广臣
异常值的发现和处理(理论)
刘广臣
异常值的发现和处理(实操)
刘广臣
离散变量重编码
刘广臣
数据预处理综合案例
刘广臣
描述统计方法及实战
描述统计方法:集中程度(理论)
刘广臣
描述统计方法:集中程度(实操)
刘广臣
描述统计方法:离散程度(理论)
刘广臣
描述统计方法:离散程度(实操)
刘广臣
描述统计方法:偏差程度(理论)
刘广臣
描述统计方法:偏差程度(实操)
刘广臣
描述统计方法-相关程度
刘广臣
数据可视化(理论)
刘广臣
数据可视化(实操 上)
刘广臣
数据可视化(实操 下)
刘广臣
推断统计方法及实战
假设检验概述
刘广臣
独立样本T检验:城市和农村孩子心理素质差别显著吗?(理论)
刘广臣
独立样本T检验:城市和农村孩子心理素质差别显著吗?(实操)
刘广臣
配对样本T检验:减肥茶到底有没有效果?(理论)
刘广臣
配对样本T检验:减肥茶到底有没有效果?(实操)
刘广臣
单因素方差分析:不同图案的儿童水杯销量之间有没有差异?(理论)
刘广臣
单因素方差分析:不同图案的儿童水杯销量之间有没有差异?(实操)
刘广臣
卡方检验:赛马比赛的赛道会影响成绩吗?
刘广臣
列联表分析:感冒与是否喝牛奶有关吗?
刘广臣
游程检验:足球裁判执法公平吗?
刘广臣
Python高级数据分析实战
机器学习方法概述
刘广臣
有监督学习之回归问题: 线性回归方法及实战
一元线性回归:航班正点率和顾客投诉次数(理论)
刘广臣
一元线性回归:航班正点率和顾客投诉次数(实操)
刘广臣
多元线性回归:如何分析销售量与三种不同广告投入之间的关系(理论上)
刘广臣
多元线性回归:如何分析销售量与三种不同广告投入之间的关系(理论下)
刘广臣
多元线性回归:如何分析销售量与三种不同广告投入之间的关系(实操 上)
刘广臣
多元线性回归:如何分析销售量与三种不同广告投入之间的关系(实操 下)
刘广臣
有监督学习之分类问题: 判别分析
Fisher判别分析:如何判断黄瓜叶片是否感染病毒(理论 )
刘广臣
Fisher判别分析:如何判断黄瓜叶片是否感染病毒(实操上)
刘广臣
Fisher判别分析:如何判断黄瓜叶片是否感染病毒(实操下)
刘广臣
有监督学习之分类问题: K最近邻算法
K最近邻:泰坦尼克号乘客生还预测(理论)
刘广臣
K最近邻:泰坦尼克号乘客生还预测(实操)
刘广臣
有监督学习之分类问题: 朴素贝叶斯算法
朴素贝叶斯:右心室肥厚的辅助识别(理论 上)
刘广臣
朴素贝叶斯:右心室肥厚的辅助识别(理论 下)
刘广臣
朴素贝叶斯:右心室肥厚的辅助识别(实操)
刘广臣
有监督学习之分类问题:Logistic回归
Logistic回归:从疝气病症预测病马的死亡率(理论 上)
刘广臣
Logistic回归:从疝气病症预测病马的死亡率(理论 下)
刘广臣
Logistic回归:从疝气病症预测病马的死亡率(实操)
刘广臣
有监督学习之分类问题:决策树
决策树:如何选择隐形眼镜(理论上)
刘广臣
决策树:如何选择隐形眼镜(理论下)
刘广臣
决策树:如何选择隐形眼镜(实操)
刘广臣
有监督学习之分类问题:随机森林
随机森林:人类基因组中病毒判断识别(理论)
刘广臣
随机森林:人类基因组中病毒判断识别(实操)
刘广臣
无监督学习之聚类:聚类分析
聚类分析:电信客户细分策略(理论)
刘广臣
聚类分析:电信客户细分策略(实操)
刘广臣
无监督学习之降维:主成分分析
主成分分析:半导体高维数据如何降维?(理论)
刘广臣
主成分分析:半导体高维数据如何降维?(实操)
刘广臣
机器学习高级话题
刘广臣,刘广臣
  • 第一章数据分析概述

    介绍数据分析基本思想、方法、应用场景

  • 1.1数据分析概述

    介绍数据分析基本思想、方法、应用场景

  • 第二章Python入门

    介绍Python发展历程,基本语法、常见数据读写、基本编程思想、常用数据分析包(Numpy,Pandas,Matplotlib等)

  • 2.1Python简介

    了解Python基本发展历程和功能;掌握Python基本操作。

  • 2.2Python基本语法

    介绍Python基本语法知识,三种常见内置数据结构(列表、元组和字典)及其基本操作。

  • 2.3Python基本编程

    介绍常用Python编程基本语法结构,含If-else选择结构、for循环结构、while循环结构,并通过典型综合案例展示这些语法结构的应用。

  • 2.4Python三剑客

    介绍Python数据分析最常用的三个包,即Numpy,Pandas,Matplotlib,通过案例形式展示这些基础包的使用方法。

  • 第三章Python基本数据分析实战

    常见数据预处理方法、描述统计及可视化方法、常用统计推断方法,以及上述方法的Python实现

  • 3.1数据预处理

    介绍常见的数据预处理方法,如缺失值的发现与处理、异常值的发现u处理,以及离散变量如何转为分类变量(重编码),并通过综合案例展示数据预处理的基本流程。

  • 3.2描述统计方法及实战

    介绍描述统计常见的四类统计量(集中程度、离散程度、偏差程度、相关程度)的基本概念和使用场景,以及常用数据可视化技术和使用场景。

  • 3.3推断统计方法及实战

    介绍推断统计中最为精彩的假设检验技术,通过案例模式讲解参数类假设检验(独立样本T检验、配对样本T检验、单因素方差分析),以及典型非参数检验(卡方检验、列联表分析、游程检验)的基本思想、算法、使用场景。

  • 第四章Python高级数据分析实战

    介绍机器学习基本原理和工作流程,有监督学习常见方法(回归方法和常见经典分类方法),无监督学习常见方法(聚类分析、主成分分析降维技术);通过案例式讲授每种算法的全部工作流程,注重通过Python编程让算法落地,帮助学习者掌握常见机器学习技术。

  • 4.1机器学习方法概述

    介绍机器学习基本概念、基本思想和基本方法,概述本章知识结构体系、涉及的基本算法、基本案例。

  • 4.2有监督学习之回归问题: 线性回归方法及实战

    介绍机器学习中的有监督学习,重点阐述回归问题(因变量为连续型变量)的基本思想、算法流程和应用场景,通过两个案例从简单的一元线性回归到复杂的多元线性回归进行深刻讲授,帮助学习者掌握回归类问题的Python实现。

  • 4.3有监督学习之分类问题: 判别分析

    介绍机器学习有监督学习中的分类问题,讲授Fisher线性判别算法基于投影分类的思想,通过手工推导算例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。

  • 4.4有监督学习之分类问题: K最近邻算法

    介绍机器学习有监督学习中的分类问题,讲授K最近邻(KNN)分类算法的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。

  • 4.5有监督学习之分类问题: 朴素贝叶斯算法

    介绍机器学习有监督学习中的分类问题,讲授朴素贝叶斯分类算法的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。

  • 4.6有监督学习之分类问题:Logistic回归

    介绍机器学习有监督学习中的分类问题,讲授Logistic算法分类的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。

  • 4.7有监督学习之分类问题:决策树

    介绍机器学习有监督学习中的分类问题,讲授决策树算法分类的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。

  • 4.8有监督学习之分类问题:随机森林

    介绍机器学习有监督学习中的分类问题,讲授随机森林集成学习算法分类的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现分类全部流程。

  • 4.9无监督学习之聚类:聚类分析

    介绍机器学习中的无监督学习问题,讲授K-means聚类算法的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现聚类分析的全部流程。

  • 4.10无监督学习之降维:主成分分析

    介绍机器学习中的无监督学习降维问题,讲授主成分分析(PCA)降维算法的思想,通过实际案例帮助学习者掌握基本的算法原理,对于大规模高维数据讲授调用Python第三方包实现降维全部流程。

  • 4.11机器学习高级话题

    介绍机器学习高级话题,涉及模型调参、交叉验证、模型评价等问题,以KNN算法为例讲授如何通过上述环节提升模型预测的准确率,从而构建更加精准的模型。

  • 开始学习
  • 第一章  作业测试
    第一章 数据分析概述

    1.1 数据分析概述

    视频数1
  • 第二章  作业测试
    第二章 Python入门

    2.1 Python简介

    2.2 Python基本语法

    2.3 Python基本编程

    2.4 Python三剑客

    视频数14
  • 第三章  作业测试
    第三章 Python基本数据分析实战

    3.1 数据预处理

    3.2 描述统计方法及实战

    3.3 推断统计方法及实战

    视频数26
  • 第四章  作业测试
    第四章 Python高级数据分析实战

    4.1 机器学习方法概述

    4.2 有监督学习之回归问题: 线性回归方法及实战

    4.3 有监督学习之分类问题: 判别分析

    4.4 有监督学习之分类问题: K最近邻算法

    4.5 有监督学习之分类问题: 朴素贝叶斯算法

    4.6 有监督学习之分类问题:Logistic回归

    4.7 有监督学习之分类问题:决策树

    4.8 有监督学习之分类问题:随机森林

    4.9 无监督学习之聚类:聚类分析

    4.10 无监督学习之降维:主成分分析

    4.11 机器学习高级话题

    视频数28
  • 期末考试