Hadoop - HDFS概述@慕课网原创_慕课网

Hadoop - HDFS概述

Hadoop文件系统是使用分布式文件系统设计开发的。它运行在商品硬件上。与其他分布式系统不同，HDFS具有高度的容错能力，并采用低成本硬件设计。

HDFS拥有非常大量的数据，并提供更容易的访问。要存储这么大的数据，这些文件存储在多台机器上。这些文件以冗余的方式存储，以在发生故障的情况下挽救系统免受可能的数据丢失。HDFS还使应用程序可以并行处理。

以下是Hadoop文件系统的体系结构。

HDFS架构

HDFS遵循主 - 从架构，它具有以下元素。

Namenode
namenode是包含GNU / Linux操作系统和namenode软件的商品硬件。它是可以在商品硬件上运行的软件。具有namenode的系统充当主服务器，它执行以下任务：

Datanode
数据库是具有GNU / Linux操作系统和数据库软件的商品硬件。对于集群中的每个节点（商品硬件/系统），将有一个数据库。这些节点管理其系统的数据存储。

Block
通常，用户数据存储在HDFS的文件中。文件系统中的文件将被分成一个或多个片段和/或存储在各个数据节点中。这些文件段被称为块。换句话说，HDFS可以读取或写入的最小数据量称为块。默认块大小为64MB，但可根据需要在HDFS配置中更改。

作者：全能程序猿
链接：https://www.jianshu.com/p/d1a07556cd10