组成11111111

分布式存储和计算1111

hdfs:
高成本
低成本
成熟生态圈
hive
Hadoop核心:
HDFS:分布式文件系统,存储海量的数据
MapReduce:并行处理框架,实现任务分解和调度
Hadoop
包括两个核心组成 :
HDFS : 分布式文件系统 , 存储海量的数据
MapReduce : 并行处理框架 , 实现任务分解和调度
Hadoop
hadoop组成
hadoop可以做什么?
hadoop的组成
hadoop的应用情况
hadoop的功能和优势:
Hadoop是什么:是一个开源的、分布式存储和分布式计算平台;
两个核心组件:
1.HDFS,分布式文件系统,存储海量数据
2.MapReduce,并行处理框架,实现任务分解和调度
Hadoopk可以做什么?
搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务。
hadoop的优势:
1.高扩展,理论上无限扩展
2.低成本
3.成熟的生态圈
Hadoop是开源的分布式存储、分布式计算平台
两个核心组成:HDFS分布式文件系统,存储海量的数据
MapReduce并行处理框架,实现任务分解和调度
作用:可以搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务
优势:
1、高扩展
2、低成本
3、成熟的生态圈
Google大数据技术的革命性的变化
1、成本低,能用PC机,就不用大型机和高端存储
2、软件容错硬件故障视为常态,通过软件保证可靠性。
3、简化并行分布式计算,无须控制节点同步和数据交换
Hadoop 分布式存储 + 分布式技术平台
Hadoop是开源的分布式存储、分布式计算平台
两个核心组成:HDFS分布式文件系统,存储海量的数据
MapReduce并行处理框架,实现任务分解和调度
作用:可以搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务
优势:
1、高扩展
2、低成本
3、成熟的生态圈
Hadoop的应用情况:
hadoop Ecosystem Map
优势3:有成熟的生态圈:
2、低成本
hadoop的优势:
1、高扩展
Hadoop的用途:
Hadoop的组成
1、包括两个核心组成:
1)HDFS:分布式文件系统,存储海量的数据
2)MapReduce:并行处理框架,实现任务分解和调度。
hadoop是什么?
Hadoop可以用来搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务
优势:
高扩展(基于框架增加硬件实现)
低成本(不依赖于高端机,只需要PC机,利用软件容错确保可靠性)
Hadoop是一个开源的分布式存储+分布式计算平台
包括两个核心组成:
HDFS:分布式文件系统,存储海量的数据
MapReduce:并行处理框架,实现任务分解和调度