Hdfs文件读取流程:
Hdfs文件写入流程:
写入文件流程
读取文件流程
HDFS读写操作
hdfs读取数据流程:
读取:
1、客户端想namenode请求
2、namenode返回元数据(数据包含哪些块,以及这些块的位置等等)
3、读数据数据块并组装
hdfs写入:
1、客户端拆分文件
2、客户端请求namenode,namenode返回可以用的datanode
3、写入数据块到datanode
4、复制数据库
5、更新元数据到namenode
HDFS写入文件的流程
HDFS读取文件的流程
HDFS中文件的写操作
HDFS中文件的读操作
hdfs写入:
1、客户端拆分文件
2、客户端请求namenode,namenode返回可以用的datanode
3、写入数据块到datanode
4、复制数据库
5、更新元数据到namenode
hdfs读取数据流程:
读取:
1、客户端想namenode请求
2、namenode返回元数据(数据包含哪些块,以及这些块的位置等等)
3、读数据数据块并组装
HDFS中写入文件的流程
HDFS读取文件的流程
HDFS读取文件的流程
HDFS写入文件的流程
HDFS读取文件的流程:
(1)客户端向namenode发起独立请求,把文件名,路径告诉namenode;
(2)namenode查询元数据,并把数据库返回客户端;
(3)此时客户端就明白文件包含哪些块,这些块在哪些datanode中可以找到;
===========================================
HDFS写文件流程:
(1)客户端把文件拆分成固定大小64M的块,并通知namenode;(2)namenode找到可用的datanode返回给客户端;
(3)客户端根据返回的datanode,对块进行写入
(4)通过流水线管道流水线复制
(5)更新元数据。告诉namenode已经完成了创建心的数据块。保证了namenode中的元数据都是最新的状态。
HDFS文件的读写操作
读操作:
客户端向NameNode发送文件读取请求
NameNode查询数据,将元数据返回给客户端
客户端根据元数据找到指定的Blocks
写数据:
首先客户端将文件差分为块,通知NameNode
NameNode会查询可用的DataNode信息返回给客户端
客户端对块进行写入
进行流水线复制,将写入的块复制到不同的的DataNode上面和不同的机架上
更新元数据,告诉NameNode文件的具体地址
HDFS写入文件的流程
HDFS读取文件的流程
HDFS写入文件流程
1、文件拆分成块
2、通知NameNode,NameNode会找到一些可用的DataNode,并返回
3、根据返回的DataNode,进行块的写入
4、写入一个块之后,进行流水线复制,将这个块写入到其他的地方
5、更新元数据
6、重复上述步骤,写入其他块
HDFS读取文件流程
1、客户端发起文件读取请求
2、NameNode查询元数据
3、元数据包含那些块以及元数据分布在那些DataNode中
4、客户端直接找到DataNode读取block
5、下载完成之后进行组装
Hadoop 数据写入流程
Hadoop 数据读取流程
HDFS写文件的流程
HDFS读取文件的流程
客户端发送文件读请求——>namenode返回元数据(从哪些datanode找到)——>客户端读取block,下载下来之后组装;
客户端文件拆分成block——>通知namenode返回可用的 有足够磁盘空间的datanode——>客户端对block进行写入——>流水线复制——>更新元数据 ;