课程简介
课程大纲
- MapReduce概述
- MapReduce官方案例 - WordCount
- 序列化
- InputFormat数据输入
- 工作流程
- 分区
- 排序
- 组合器(Combiner)
- 分组排序
- MapTask和ReduceTask
- OutputFormat数据输出
- JOIN操作及案例
- 部分案例
- 压缩
课程大纲
MapReduce概述- MapReduce概述
- MapReduce优缺点
- MapReduce核心思想
- MapReduce进程
MapReduce官方案例 - WordCount- MapReduce官方案例源码解析和数据类型
- MapReduce编程规范
- WordCount案例分析
- WordCount案例Mapper
- WordCount案例Reducer
- WordCount案例Driver
- WordCount案例测试
- WordCount案例Debug调试
- WordCount案例在集群上运行
- 学习总结
序列化- 序列化概述
- 序列化自定义步骤
- 序列化案例分析
- 序列化案例FlowBean
- 序列化案例Mapper
- 序列化案例Reducer
- 序列化案例Driver
- 序列化案例Debug调试
InputFormat数据输入- 切片和MapTask并行度决定机制
- Job提交流程源码解析
- Job切片机制源码解析
- FileInputFormat切片机制和配置参数
- FileInputFormat实现类
- TextInputFormat实现类
- 学习总结
- KeyValueTextInputFormat案例分析
- KeyValueTextInputFormat案例实现
- NLineInputFormat案例分析
- NLineInputFormat案例实现
- 自定义InputFormat步骤
- 自定义InputFormat案例
- 自定义InputFormat案例Debug
- InputFormat实现类总结
工作流程- MapReduce工作流程(面试重点)
- Shuffle机制(面试重点)
分区- HashPartition默认分区
- Partition分区案例
- Partition分区案例总结
- 学习总结_1
- 学习总结_2
排序- 排序概述
- 排序分类
- 全排序案例分析
- 全排序案例FlowBean
- 全排序案例Mapper
- 全排序案例实现及测试
- 分区排序案例实现及测试
- Debug调试思想
组合器(Combiner)- Combiner理论
- Combiner案例实现
分组排序- 分组排序案例分析
- 分组排序案例OrderBean
- 分组排序案例Mapper
- 分组排序案例Driver
- 分组排序案例排序类
- 分组排序案例调试
- 分组排序案例扩展
MapTask和ReduceTask- MapTask工作机制(面试重点)
- ReduceTask工作机制(面试重点)
- ReduceTask个数设置
- Shuffle机制回顾
- 工作流程源码分析
OutputFormat数据输出- OutPutFormat接口实现类
- 自定义OutputFormat案例分析
- 自定义OutputFormat案例实现
JOIN操作及案例- ReduceJoin理论
- ReduceJoin案例分析
- ReduceJoin案例TableBean
- ReduceJoin案例Mapper
- ReduceJoin案例Reduce
- ReduceJoin案例Driver
- MapJoin案例分析
- MapJoin案例缓存文件处理
- MapJoin案例测试
部分案例- 计数器应用
- 数据清洗案例
- MapReduce开发总结
压缩- 压缩概述
- MR支持的压缩编码
- 压缩方式选择
- 压缩位置选择
- 压缩参数设置
- 压缩案例
- 解压缩案例
- Map和Reduce启用压缩案例