FastDFS讲解 - 知乎专栏·「Java技术分享驿站」

310 阅读4分钟
原文链接: zhuanlan.zhihu.com

1 什么是FastDFS

FastDFS是用c语言编写的一款开源的分布式文件系统。FastDFS为互联网量身定制,充分考虑了冗余备份,负载均衡,线性扩容等机制,并注重高可用,高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传和下载的服务。

2 FastDFS架构

FastDFS架构包括Tracker server和Storageserver。客户端请求Tracker server进行文件上传,下载,通过Trackerserver调度最终由storage server完成文件的上传和下载

由此可见:

Tracker server的作用:负载均衡和调度:通过Tracker server在文件上传时可以根据一些策略找到Storage server提供文件上传服务。可以将tracker称为追踪服务或调度服务

Storage server的作用:存储:客户端上传的文件最终存储在Storage服务器上,Storage server没有实现自己的文件系统而是利用操作系统的文件系统来管理文件。可以将storage称为存储服务器。

2.1 Tracker 集群

FastDFS集群中的trackerserver可以有很多台,tracker server之间相互平等同时提供服务,不存在单点故障,客户端请求tracker server采用轮询的方式,如果一台不能提供服务就换成另一台

2.2 storage 集群

采用分组存储方式:storage集群由一个或者多个组构成。一个组可以有一台或者多台存储服务器组成,组内的storage server之间相互平等,不同组的storageserver之间不会相互通信,同组内的storage server 之间会相互连接进行文件同步,从而保证同组内每个storage上的文件完全一致的。

集群的大小:为集群中所有组的存储容量之和,

组的大小:该组内存储服务器容量最小的那个(因此保证组内的存储服务器配置最好一致)

分组的好处:灵活,可控性较强。(

比如上传文件时,可以由客户端直接指定上传到的组也可以由tracker进行调度选择。一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向扩容)。当系统容量不足时,可以增加组来扩充存储容量(横向扩容)。

3 storage状态收集

Storage server 会连接集群中的所用的tracker server,定时向它们报告自己的状态,包括磁盘剩余空间,文件同步状态,文件上传下载次数等统计信息

4 文件上传流程图

客户端上传文件后存储服务器将文件ID返回给客户端,此文件ID用于以后访问该文件的索引信息。文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名。

  • 组名:文件上传后所在的storage组名称,在文件上传成功后有storage服务器返回,需要客户端自行保存。
  • 虚拟磁盘路径:storage配置的虚拟路径,与磁盘选项store_path*对应。如果配置了store_path0则是M00,如果配置了store_path1则是M01,以此类推。
  • 数据两级目录:storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
  • 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。
  1. 文件下载流程

tracker根据请求的文件路径即文件ID来快速定义文件。

比如请求下边的文件:

1.通过组名tracker能够很快的定位到客户端需要访问的存储服务器组是group1,并选择合适的存储服务器提供客户端访问。

2.存储服务器根据“文件存储虚拟磁盘路径”和“数据文件两级目录”可以很快定位到文件所在目录,并根据文件名找到客户端需要访问的文件