HDFS 原理与应用 | 青训营笔记这是我参与「第四届青训营」笔记创作活动的第9天课堂笔记一、本堂课重点内容： H

这是我参与「第四届青训营」笔记创作活动的第9天

课堂笔记

我们平时用的个人PC机windows自带的文件系统是单机版的，只控制用户个人电脑的文件，而在企业里有大量的文件数据，一台电脑存储不下，就得考虑用多台机器存储，而想要对多台机器上的文件系统统一管理就产生了分布式文件系统。其具有有大容量、高可靠、低成本的特点。

HDFS的开源框架Hadoop的一个组件，负责分布式文件的存储管理，全称是Hadoop Distributed File System. 其具有如下特点：

HDFS主要分为client、NameNode、DataNode三种组件构成

NameNode:用于存储元数据(描述数据的数据)，对外提供元数据和数据服务；细分功能为：维护目录树、维护文件和数据块的关系、维护文件快存储节点信息、分配新文件存放节点
DataNode:用于实际存储数据。细分功能为：数据块存取，心跳汇报，副本复制
client:主要用于接收用户请求，并与NameNode,DataNode交互完成用户请求

元数据是存储在内存中的,一旦关机，内存中的数据就会丢失，所以需要一定机制对内存中数据作落盘备份。

使用HDFS的公司

YHX`HQRH0TMBYL)~1KQ2MA8.png

四、课后个人总结：

通过本节课对HDFS分布式文件系统有了初步了解，并了解了其异常解决方案和实际应用场景