快速入门Hadoop3.0大数据处理_技术笔记_课程笔记

qq_羽悦_03291187 2025-03-17

NameNode总结

0赞 · 0采集
qq_羽悦_03291187 2025-03-17

DataNode介绍

0赞 · 0采集
qq_羽悦_03291187 2025-03-17

SecondaryNameNode介绍

0赞 · 0采集
qq_羽悦_03291187 2025-03-17

NameNode介绍

0赞 · 0采集
qq_羽悦_03291187 2025-03-17

HDFS体系结构详解

0赞 · 0采集
射水鱼 2024-04-25

NameNode总结：

0赞 · 0采集
射水鱼 2024-04-25

DataNode介绍：

0赞 · 0采集
射水鱼 2024-04-25

SecondaryNameNode介绍：

0赞 · 0采集
射水鱼 2024-04-25

NameNode介绍：

0赞 · 0采集
射水鱼 2024-04-25

HDFS包含：

0赞 · 0采集
weixin_慕粉1188581 2022-04-10

11

0赞 · 0采集
zrey 2022-03-22

NameNode:
整个文件系统的管理节点，它主要维护着整个文件系统的文件目录树，文件/目录的元信息，每个文件对应的数据块列表，并且还负责接收用户的操作请求。
包含以下文件：fsimage 元数据镜像文件（某一时刻快照）,
eidts 用户操作记录,
seed_txid 事务id存储edits索引 (重启时检查是否一致),
VERSION hdfs版本信息
位置: core-xml设定目录dfs/name/current内
默认保存路径hdfs-default.xml中 dfs.namenode.name.dir属性控制

SNN (Secondary NameNode)
定期把edits文件中内容合并到fsimage, 即checkpoint
HA架构没有SNN, 由Standby NameNode实现

DataNode
真实文件存储服务

0赞 · 0采集
qq_妙恋_0 2021-07-01

文件创建时间，什么啥时候进行的修改等操作。

fsimage: 文件系统镜像，源数据镜像文件，某一时刻Namenode内存中的源数据信息，也可理解为快照,是由edit内容信息合并完成，合并卫checkpoint
seondaryNamenode 触发1个小时 100万次操作
edits: 存储用户的操作记录，包括修改，不包括查询
seed_txid: 默认为0，存储edits 后面的序号，倒序查找，方便恢复

0赞 · 0采集
失眠的小绵羊 2021-01-24

如果一个文件是一个G 三个节点怎么保存

0赞 · 0采集
时间的痕迹 2020-11-18

namenode存储的元数据：
1、文件与block的关系
2、block与datanode的关系

截图
0赞 · 0采集
时间的痕迹 2020-11-18

如果一个文件默认大小不足一个block，仍然会占用一个block，但是实际占用的存储空间是文件本身的大小，而不是block的大小

截图
0赞 · 0采集
时间的痕迹 2020-11-18

secondarynamenode:定期把edits文件内容同步到fsimage（某一时刻的文件系统快照）中，默认情况下是一小时同步一次或者修改次数达到100万次时同步一次

截图
0赞 · 0采集
mooc3592572 2020-10-29

NameNode维护了两份关系

截图
0赞 · 0采集
mooc3592572 2020-10-29

DataNode介绍

截图
0赞 · 0采集
mooc3592572 2020-10-29

SecondaryNameNode介绍

截图
0赞 · 0采集
mooc3592572 2020-10-29

nameNode介绍

截图
0赞 · 0采集
慕娘5305581 2020-06-29
fsimage: 文件系统镜像，源数据镜像文件，某一时刻Namenode内存中的源数据信息，也可理解为快照
edits: 存储用户的操作记录，包括修改，不包括查询
seed_txid: 默认为0，存储edits 后面的序号，倒序查找，方便恢复

seondaryNamenode 触发
1. 1个小时
2. 100万次操作
2赞 · 0采集
慕后端4477088 2020-06-24

namenode的总结
维护的两份关系

截图
0赞 · 0采集
慕后端4477088 2020-06-24

不足128mb的就是文件的实际大小，可以在dfs-default.xml中可以调整大小
数据的副本数量默认为3，可以在hdfs-site.xml文件中的dfs.replication修改

截图
0赞 · 0采集
慕后端4477088 2020-06-24

两个条件，距上次checkpoint一个小时，或者hdfs操作了一百万次，两个条件哪个先触发就先执行
HA（高可用）架构是没有secondarynamenode的，有两个namenode时，activited namenode负责和用户交互，standby namenode负责文件的合并操作

截图
0赞 · 0采集
慕后端4477088 2020-06-24

hdfs-defaulg.xml：保存namenode本地存储文件的路径

截图
0赞 · 0采集
慕后端4477088 2020-06-24

namenode在本地磁盘保存的文件

截图
0赞 · 0采集
慕后端4477088 2020-06-24

namenode的信息都在内存存放，本地磁盘也会保存一份信息，否则namenode格式化会丢
本地磁盘包含以下文件：见图（seen_txid）
这些文件保存在tmp.dir/dfs/name/current/
fsimage：相当于快照、镜像，保存的是某一时刻的元数据信息，与内存中的信息不同步，定时生成。
edits：记录用户的操作，不保存查询
seen_txid：存储的是edits文件后面的数字，当namenode重启时，按照存储的数字顺序执行edits文件，这样就得到了原信息。namenode格式化时，为0。如果对应的数字没有文件，namenode就不会启动了，日志文件会有记录，为了保持数据的一致性，所以不会启动，强制启动就可能造成数据的丢失
version：版本信息，可以查看命名空间id，集群id

截图
0赞 · 0采集
慕后端4477088 2020-06-24

namenode，secondarynamenode，datanode分别在集群上启动，
namenode，secondarynamenode在主节点上启动，datanode在从节点上启动

截图
0赞 · 0采集
weixin_慕前端9103049 2020-03-29

namenode

截图
0赞 · 0采集

数据加载中...