HDFS高可用与高扩展机制|青训营笔记这是我参与「第四届青训营」笔记创作活动的第5天，笔记的内容是有关青训营课程中的一个

这是我参与「第四届青训营」笔记创作活动的第5天，笔记的内容是有关青训营课程中的一个分享.

前言

本次的HDFS高可用与高扩展机制的笔记是基于已经了解了HDFS的架构和读写流程，“高可用”和“高扩展机制”就是区分一个可以使用的系统和好用的系统的点。

我的笔记是基于元数据高可用以及元数据高扩展性来进行分享的。

高可用的需求在于HDFS系统会发生故障，例如：

如果HDFS系统不可用的话，会发生以下一些问题：

以下是高可用的公式 HDFS的设计中，采用了中心化的元数据管理节点NameNode。

NameNode的组件有：

NameNode状态持久化：

ZKFailoverController是外部组件，驱动HDFS NameNode的主备切换专门是针对以下几个问题：

核心机制：StandbyException

Client自动处理

BookKeeper存储日志

Write Quorum：写入副本数 Ack Quorum：响应副本数

KV模型的系统可以使用partition

解决DN同时服务多组NN的问题

文件服务分层：

用blockpool来区分DN的服务

Federation架构：将多个不同集群组合起来，对外表现像一个集群一样。

下图：viewfs通过在client-side的配置，指定不同的目录访问不同的NameNode

局限性：运维复杂

这一次的内容也是有关我在青训营大项目中所做的，例如kafka，对我的帮助是非常大的，了解到了很多的解决方案。