大数据实时计算框架Spark快速入门
大数据实时计算框架Spark快速入门
1万+ 人选课
更新日期:2026/04/05
开课平台阿里云课堂
开课高校-
开课教师-
学科专业
开课时间-
课程周期-
开课状态-
每周学时-
课程简介

Sparkapache.org这种域名是顶级项目,logo五角星代表着像星火一样一闪而过就能完成计算。在Spark官方的图有几个特性,Spark是一个开源的集群的计算系统,那既然是集群的就是用分布式来计算。是由快速的,统一的一个引擎对于大规模的处理。统一的引擎很多的编程写法上和底层的一些个处理上都保持一致。

课程大纲
    Spark简介
  • Spark初识_1
  • Spark初识_2
  • Spark初识_3
  • Spark RDD
  • Spark RDD五大特性_1
  • Spark RDD五大特性_2
  • Spark RDD五大特性_3
  • Spark RDD五大特性_4
  • 运行时_程序调度_1
  • 运行时_程序调度_2
  • 持久化策略_缓存优化_1
  • 持久化策略_缓存优化_2
  • 持久化策略_缓存优化_3
  • Standalone+ZooKeeper高可用部署_1
  • Standalone+ZooKeeper高可用部署_2
  • Standalone+ZooKeeper高可用部署_3
  • Standalone+ZooKeeper高可用部署_4
  • Yarn集群模式_1
  • Yarn集群模式_2
  • Yarn集群模式_3
  • Spark操作算子本质、RDD容错_1
  • Spark操作算子本质、RDD容错_2
  • Spark操作算子本质、RDD容错_3
  • Spark宽窄依赖、DAG的切割_1
  • Spark宽窄依赖、DAG的切割_2
  • Spark宽窄依赖、DAG的切割_3
  • Spark源码剖析
  • Spark源码初步剖析_1
  • Spark源码初步剖析_2
  • Spark调度流程源码剖析_1
  • Spark调度流程源码剖析_2
  • Spark调度流程源码剖析_3
  • Spark DAG源码剖析_1
  • Spark DAG源码剖析_2
  • Spark DAG源码剖析_3
  • SparkPi代码剖析_1
  • SparkPi代码剖析_2
  • SparkPi代码剖析_3
  • SparkPi代码剖析_4
  • Spark算子操作
  • Spark算子详解及优化_1
  • Spark算子详解及优化_2
  • Spark算子详解及优化_3
  • Spark算子详解及优化_4
  • Spark资源和数据并行度优化分析_1
  • Spark资源和数据并行度优化分析_2
  • Spark资源和数据并行度优化分析_3
  • Spark算子操作剖析_1
  • Spark算子操作剖析_2
  • Spark算子操作剖析_3
  • Spark算子操作剖析_4
  • Spark算子操作及总结_1
  • Spark算子操作及总结_2
  • Spark算子操作及总结_3
  • Spark textFile和排序_1
  • Spark textFile和排序_2
  • Spark textFile和排序_3
  • Spark textFile和排序_4
  • Spark SQL
  • SparkSQL初识_1
  • SparkSQL初识_2
  • SparkSQL初识_3
  • SparkSQL初识_4
  • 自定义函数、自定义聚合函数、Spark源码PageRank的问题_1
  • 自定义函数、自定义聚合函数、Spark源码PageRank的问题_2
  • 自定义函数、自定义聚合函数、Spark源码PageRank的问题_3
  • 隐式转换和隐式参数、DataFrame_1
  • 隐式转换和隐式参数、DataFrame_2
  • 隐式转换和隐式参数、DataFrame_3
  • 隐式转换和隐式参数、DataFrame_4
  • RDD动态转为DataFrame
  • JSON数据源 、JDBC数据源、Standalone集群测试_1
  • JSON数据源 、JDBC数据源、Standalone集群测试_2
  • JSON数据源 、JDBC数据源、Standalone集群测试_3
  • JSON数据源 、JDBC数据源、Standalone集群测试_4
  • Hive数据源、Yarn集群测试、SQL分组取TopN_1
  • Hive数据源、Yarn集群测试、SQL分组取TopN_2
  • Hive数据源、Yarn集群测试、SQL分组取TopN_3
  • Hive数据源、Yarn集群测试、SQL分组取TopN_4
  • Hive数据源、Yarn集群测试、SQL分组取TopN_5
  • Spark Streaming
  • Spark Streaming初识_1
  • Spark Streaming初识_2
  • Spark Streaming初识_3
  • HDFS数据源、DStream的持久化存储_1
  • HDFS数据源、DStream的持久化存储_2
  • UpdateStateByKey算子、Tranform算子_1
  • UpdateStateByKey算子、Tranform算子_2
  • UpdateStateByKey算子、Tranform算子_3
  • Kafka的安装及测试_1
  • Kafka的安装及测试_2
  • Kafka数据源、Receiver和Direct方式接收数据_1
  • Kafka数据源、Receiver和Direct方式接收数据_2
  • Kafka数据源、Receiver和Direct方式接收数据_3
  • Spark和MR在Yarn运行的区别_1
  • Spark和MR在Yarn运行的区别_2
  • 静态模式和统一模式_1
  • 静态模式和统一模式_2
App 下载
关注我们