大数据分析与处理【兴趣班无学分】
大数据分析与处理【兴趣班无学分】
少于1000 人选课
更新日期:2025/04/25
开课平台高校邦
开课高校重庆邮电大学
开课教师王国胤刘群秦红星张旭李智星
学科专业工学计算机类
开课时间2024/08/01 - 2024/12/31
课程周期22 周
开课状态已结课
每周学时-
课程简介

本课程从大数据分析的基本概念入手,深入浅出地介绍了大数据分析的基本方法,包括大数据分析平台的使用方法、大数据分析处理流程、大数据的可视化方法、数据的统计汇总方法、大数据的挖掘和预测算法、流式大数据的处理原理以及常用的EXCEL工具的统计分析和数据挖掘功能的使用方法,同时在每一个环节都配有与理论相结合的案例介绍,尤其是在最后还给出了两个实际的大数据分析应用案例的完整介绍。本课程的学习不仅可以面向本科生,还可以面向社会广大的IT从业人员,通过学习,有助于大家了解大数据分析与处理中运用的基本方法和技术手段。

课程组的所有成员来自于重庆邮电大学计算智能重庆市重点实验室,团队成员王国胤教授更是计算机科学与技术领域的长江学者特聘教授,其他成员也都具有多年从事数据挖掘、机器学习与人工智能的科研和实践经验,因此本课程的章节和内容安排汇集了群体智慧,也体现了本领域的近期发展和前沿成果。


课程大纲
第一章 云计算时代的大数据智能处理
1.1 云计算是人机交互的互联计算
1.2 大数据催生三元空间
1.3“互联网”的未来智能互联
1.4大数据智能处理的探索与实践
第二章 大数据分析处理概述
2.1 大数据分析处理计算框架
2.2 大数据分析处理基本流程
2.3 大数据分析处理评测方法
第三章 大数据分析平台基础
3.1 Hadoop平台及HDFS基础
3.2 Mapreduce并行算法基础
3.3 HBase/Hive基础及其使用
第四章 数据统计分析方法
4.1 认识数据
4.2 数据统计汇总方法
4.3数据预处理方法
4.4 python下的数据预处理
第五章 IBM SPSS Statistics
5.1 SPSS Statistics 简介和分析基本步骤
5.2 SPSS Statistics 变量属性定义、T检验和单向方差分析变量属性定义、T检验和单向方差分析
5.3 SPSS Statistics 二阶聚类分析
第六章 大数据可视化方法
6.1 可视化简介
6.2 高维数据可视化
6.3 网络数据可视化方法
第七章 流式大数据预处理基础
7.1 流式大数据处理框架-apache storm
7.2 流式大数据处理框架-apache spark streaming
7.3 流式大数据处理案例
第八章 数据关联分析算法
第一节 基本概念和方法
第二节 经典的Apriori关联规则算法
第三节 关联规则算法案例
第四节 python下的apriori算法实现
第九章 线性模型分析方法
第一节 线性模型基础知识
第二节 线性模型方法
第三节 weka平台上线性模型应用
第十章 有标签的数据分析算法
第一节 问题的引入
第二节 决策树算法
第三节 决策树算法讨论
第四节 python下的决策树ID3算法实现
第十一章 无标签的数据分析算法
第一节 聚类分析概述 于洪
第二节 k-means聚类算法 于洪
第三节 聚类算法讨论 于洪
第四节 python下的kmeans算法实现
第五节 密度聚类DBSCAN简介与应用
第六节 密度聚类DBSCAN原理与步骤
第七节 密度聚类DBSCAN实现与总结
第十二章 人工神经网络学习算法
12.1 人工神经网络基础知识
12.2 误差反向传播神经网络算法
12.3 weka平台上BP神经网络应用
第十三章 深度学习简介
13.1 深度学习基础知识
13.2 深度学习简要框架讲解
13.3 基于深度卷积自编码器的图像去噪案例解析
第十四章 SPSS Modeler
第一节 SPSS Modeler的数据整理
第二节 SPSS Modeler的聚类模型、关联规则模型、时间序列模型
第三节 SPSS Modeler模型评估、模型部署与体系架构
第十五章 典型数据挖掘算法并行化案例
第一节 MR-Kmeans算法
第二节 Spark Mllib 聚类算法
第三节 Spark平台下的DBSCAN算法
第十六章 大数据分析应用案例
第一节 新闻组数据分析
第二节 搜索引擎日志数据分析
第三节 出租车轨迹数据分析
第十七章 大数据分析与处理展望
第一节 大数据时代发展过程的回顾与探讨
第二节 从小数据到大数据的数据智能分析处理
第三节 大数据的未来发展趋势
堂下考试封面下载
下载
神威太湖之光
1