本课程首页介绍了hadoop架构体系,包括NameNode和DataNode的作用;然后介绍了MapReduce作业的中间过程和原理,包括缓存的使用,相关参数的性能调优;之后介绍了如何运用MapReduce实现矩阵相乘,并且实现简单的推荐算法
1、在学习本课程之前,需要学习hadoop课程基础篇,即掌握MapReduce作业的基本步骤。
2、需要掌握线性代数、向量等的基本数学知识
1、hadoop新旧版本的基本架构
2、mapreduce作业的内部原理
3、mapreduce作业重要参数的调优
4、利用hadoop缓存实现矩阵相乘
5、简单的推荐算法