HDFS 文件系统是用来存储数据的,mapreduce 是计算框架,这两者是怎么结合的呢?
这个好理解,HDFS是分布式文件存储系统,他的作用是实时的并发的读取数据,而mapreduce是一个算法,采用分而治之,然后并行的运算,各自的运算从HDFS中实时快速的读取出来的结果在进行一个结果的合并,在大数据的时候一个好的算法和好的存储的一个很好的结合。