HDFS 原理与应用 | 青训营笔记这是我参与「第四届青训营」笔记创作活动的的第11天，今天终于到HDFS系统的介绍了

这是我参与「第四届青训营」笔记创作活动的的第11天

HDFS架构原理

HDFS架构主要由3个组件组成:

一个要注意的点是，Client首先要向NameNode获取可以存储数据的DataNode（dn08，dn01，dn06），写入3个副本。
另一个要注意的是写数据块这一步，在写的过程中是通过Pipeline方式写入。

Client端并不知道哪些DataNode存储了目标文件，要向NameNode获取，NameNode返回了3个DataNode，一般直接从返回的第一个DataNode读取数据。

NameNode作为整个架构的核心，其包含的任务繁多且复杂，我们这里先列举比较重要的几个作用

DataNode在主要负责文件的存储，需要负责的任务比较简单:

运行时存放在内存，修改时只会修改内存中的目录树，同时定期将内存中的目录树快照（snapshot）并保存在硬盘上，fsimage作为日常目录树的保存维护，在这个节点遇到故障挂掉之后，目录的修改不会保存在硬盘上，就引入了Editlog这一概念。

Editlog
- 相当于增删改操作的日志，对目录树的更改都会有一条记录，在fsimage故障恢复之后，就通过Editlog同步目录树的更改。在HDFS高可用中也起着重要的作用。

需要知道的是，NameNode并不会持久化DataNode上数据块的信息，而是根据DataNode传来的心跳包动态维护位置信息。
NameNode放置数据通常要将文件存储到不同的机器上，避免一个机器挂掉了备份的副本也全没了这种情况。

Client在写文件到DataNode的过程中，NameNode会给这些DataNode加锁（租约），防止被其他操作所调用，但如果Client在这时挂掉了，这个锁就可能无法释放，同时文件副本也可能存在不一致的状态，为了解决这些问题，就使用了Lease Recovery（租约恢复）

副本不一致
- Lease Recovery会比对三个DataNode中副本的大小，如果不一致则以较小的副本为准。
租约无法释放
- NameNode会和Client定时续租，如果Client长时间不续租，NameNode就会抛弃掉这个租约，允许其他客户端调用DataNode。

Pipeline Recovery适用于另一种异常场景。

对应的解决方法:

相比写异常处理，读异常处理就比较简单，如果读异常时如果节点出现故障，由于同一个文件存放了多个副本，我们就切换到其他副本的DataNode读取。