Linux:带你理解文件系统

88 阅读8分钟

文件系统


引入

我们使用ls -l的时候看到的除了看到文件名,还看到了文件元数据。
在这里插入图片描述
每行包含7列:

  • 模式
  • 硬链接数
  • 文件所有者
  • 大小
  • 最后修改时间
  • 文件名

stat命令能够看到更多信息

[root@localhost linux]# stat test.c 
File: "test.c"
Size: 654 		Blocks: 8		IO Block: 4096 普通文件
Device: 802h/2050d 		Inode: 263715 	 Links: 1
Access: (0644/-rw-r--r--) Uid: (0/ root)   Gid: ( 0/ root)
Access: 2017-09-13 14:56:57.059012947 +0800 
Modify: 2017-09-13 14:56:40.067012944 +0800 
Change: 2017-09-13 14:56:40.069012948 +0800
  • Access 最后访问时间
  • Modify 文件内容最后修改时间
  • Change 属性最后修改时间

inode

先简单了解一下文件系统

在这里插入图片描述

Linux ext2文件系统,上图为磁盘文件系统图(内核内存映像肯定有所不同),磁盘是典型的块设备,硬盘分区被划分为一个个的block。一个block的大小是由格式化的时候确定的,并且不可以更改。例如mke2fs的-b选项可以设定block大小为1024、2048或4096字节。而上图中启动块(Boot Block)的大小是确定的

  • Block Group:ext2文件系统会根据分区的大小划分为数个Block Group。而每个Block Group都有着相同的结构组成。
  • 超级块(Super Block):存放文件系统本身的结构信息。记录的信息主要有:bolck 和 inode的总量, 未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个文件系统结构就被破坏了
  • GDT,Group Descriptor Table:块组描述符,描述块组属性信息
  • 块位图(Block Bitmap):Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用
  • inode位图(inode Bitmap):每个bit表示一个inode是否空闲可用。
  • i节点表:存放文件属性 如:文件大小,所有者,最近修改时间等
  • 数据区:存放文件内容
    在这里插入图片描述

将属性和数据分开存放的想法看起来很简单,但实际上是如何工作的呢?我们通过touch一个新文件来看看如何工作。

[root@localhost linux]# touch abc 
[root@localhost linux]# ls -i abc 
263466 abc

为了说明问题,我们将上图简化:

在这里插入图片描述

创建一个新文件主要有以下4个操作:

  1. 存储属性

内核先找到一个空闲的i节点(这里是263466)。内核把文件信息记录到其中。

  1. 存储数据

该文件需要存储在三个磁盘块,内核找到了三个空闲块:300,500,800。将内核缓冲区的第一块数据复制到300,下一块复制到500,以此类推。

  1. 记录分配情况

文件内容按顺序300,500,800存放。内核在inode上的磁盘分布区记录了上述块列表。

  1. 添加文件名到目录

新的文件名abc。linux如何在当前的目录中记录这个文件?内核将入口(263466,abc)添加到目录文件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来。

在这里插入图片描述

软链接和硬链接

给一个源文件创建一个软链接文件/硬链接文件,就可以通过被创建出来的软链接文件/硬链接文件来操作源文件

为源文件创建一个硬链接文件: ln test.txt test.hard
为源文件创建一个软链接文件:ln -s test.txt test.soft

不管是软链接文件还是硬链接文件,目的都是为了通过这些文件访问到源文件

硬链接

我们看到,真正找到磁盘上文件的并不是文件名,而是inode。 其实在linux中可以让多个文件名对应于同一个 inode。

[root@localhost linux]# touch abc 
[root@localhost linux]# ln abc def 
[root@localhost linux]# ls -1i abc def 
263466 abc 263466 def
  • abc和def的链接状态完全相同,他们被称为指向文件的硬链接。内核记录了这个链接数,inode 263466 的硬链接数为2。
  • 我们在删除文件时干了两件事情:
    1.在目录中将对应的记录删除
    2.将硬链接数-1,如果为0,则将对应的磁盘释放。
    (删除一个文件,文件并不会立即被删除,而是直接删除了目录项信息,inode中的链接数-1,之后链接数为0时,才会真正删除文件)

软链接

硬链接是通过inode引用另外一个文件,软链接是通过名字引用另外一个文件,在shell中的做法

263563 -rw-r--r--. 2 root root 0 915 17:45 abc
261678 lrwxrwxrwx. 1 root root 3 915 17:53 abc.s -> abc 
263563 -rw-r--r--. 2 root root 0 915 17:45 def

软链接文件和硬链接文件的区别:

  • 软链接文件是一个独立的文件有自己的inode节点,通过保存的源文件路径进而访问源文件
  • 硬链接文件跟源文件拥有相同的inode节点,类似于源文件的一个别名(其实跟源文件已经没有什么区别了,都只是文件的一个名称),通过自己的inode节点访问源文件
  1. 软链接可以针对目录创建,硬链接不可以
    软链接文件可以跨分区建立,硬链接不可以

注意:

  1. 每个磁盘分区都有自己的文件系统(有自己的文件系统意味着就有自己的一套inode节点)

跨分区:如果建立硬链接,与源文件inode节点号相同,这个inode节点号到底指向的是哪个分区的inode节点

  1. Linux 下目录结构是唯一的,分区可以有多个,可以挂在不同的目录上(目录本身就是跨分区的)

知识点习题

  1. Linux中包括两种链接:硬链接(Hard Link)和软连接(Soft Link),下列说法正确的是()

A. 软连接可以跨文件系统进行连接,硬链接不可以
B. 当删除原文件的时候软连接文件仍然存在,且指向的内容不变
C. 硬链接被删除,磁盘上的数据文件会同时被删除
D. 硬链接会重新建立一个inode,软链接不会

正确答案: A

答案解析

( 1 )软连接可以跨文件系统,硬连接不可以
( 2 )硬连接不管有多少个,都指向的是同一个 I 节点,会把结点连接数增加,只要结点的连接数不是 0 ,文件就一直存在不管你删除的是源文件还是连接的文件。只要有一个存在文件就存在。 当你修改源文件或者连接文件任何一个的时候,其他的文件都会做同步的修改。软链接不直接使用 i 节点号作为文件指针 , 而是使用文件路径名作为指针。所以删除连接文件对源文件无影响,但是删除源文件,连接文件就会找不到要指向的文件。软链接有自己的 i 节点 , 并在磁盘上有一小片空间存放路径名。
( 3 )软连接可以对一个不存在的文件名进行连接 。
( 4 )软连接可以对目录进行连接。

  1. 使用In命令将生成了一个指向文件old的符号链接new,如果你将文件old删除,是否还能够访问文件中的数据?

A. 不可能再访问
B. 仍然可以访问
C. 能否访问取决于文件的所有者
D. 能否访问取决于文件的权限

正确答案:A

答案解析:

符号链接就是软链接

软硬链接:

  • ln -s 源文件 链接文件(软链接)
  • ln 源文件 链接文件(硬链接)

软链接相当于是windows中的快捷方式,如果源文件失效或者是删除,那么对应的软链接也将无效
硬链接在源文件失效或者删除的情况下依然能够使用,硬链接相当于是给文件起了一个别名,还是能够指向文件


如有不同见解,欢迎留言讨论~~