【字节前端训练营02】Linux 基础(3) | 青训营笔记

273 阅读13分钟

04 Linux 系统结构

Linux四个主要部分

  • 内核

    Linux操作系统的核心部分,它管理计算机硬件的资源,包括CPU、内存、磁盘、网络等。它是操作系统与硬件之间的接口,提供了一个操作系统所需的各种基本服务和底层功能,如进程管理、文件系统、内存管理、网络协议栈等。

  • shell

    Shell是用户与Linux内核之间的接口,是一个命令解释器,提供了一种命令行界面供用户进行交互。在Shell中,用户可以输入命令和参数,执行脚本和程序,管理文件和目录等

  • 文件系统

    文件系统是Linux操作系统中用于管理文件和目录的机制,是用户与操作系统之间进行文件交互的接口。Linux支持多种文件系统,如ext4、NTFS、FAT32等。它们管理着磁盘上的文件和目录,并提供文件读写、权限控制等基本功能

  • 应用程序

    应用程序是运行在Linux操作系统上的各种软件,如文本编辑器、浏览器、视频播放器、编译器等。Linux操作系统拥有众多的应用程序,涵盖了各种领域,可以满足不同用户的需求

Linux体系结构

Linux 的体系结构是一个多层次的体系结构,包括硬件层、内核层、应用程序层和用户层。

Linux 的体系结构含义
硬件层包括计算机硬件设备,如 CPU、内存、磁盘、网络等
内核层是 Linux 的核心,负责管理硬件和提供系统服务。它包括系统调用、设备驱动程序、网络协议栈、虚拟文件系统等
应用程序层是构建在内核之上的各种应用程序,如图形用户界面、Web 服务器、数据库、邮件服务器等
用户层是用户与系统交互的界面,包括 shell、图形用户界面、命令行工具等。用户可以通过这些界面来与系统交互、操作文件和程序

用户空间和内核空间

  • 用户空间是指应用程序运行的空间,包括用户应用程序、库、各种进程、服务等。用户空间的特点是受限制的权限,应用程序只能访问自己所拥有的资源,如自己的进程空间、自己的内存、自己的磁盘空间等。同时,用户空间还包括了各种 shell,用户可以通过 shell 进行命令行操作,从而控制整个系统
  • 内核空间是指操作系统内核运行的空间,包括各种驱动程序、系统调用等。内核空间的特点是拥有系统级的权限,可以访问所有资源,包括 CPU、内存、磁盘、网络等。内核空间的代码通常运行在特权级别最高的模式下,可以直接操作硬件,因此内核空间的代码很少出错,一旦出错会导致整个系统崩溃
  • 用户空间和内核空间之间通过系统调用进行通信。应用程序可以通过系统调用请求内核提供服务,如读写文件、网络通信、进程管理等。内核收到系统调用后会根据请求提供相应的服务,并返回结果给应用程序

内核

  • 内核是硬件与软件之间的中间层
  • 内核是一个资源管理程序
  • 内核提供一组面向系统的命令

进程管理

在Linux中,进程是指正在执行的程序实例。每个进程都拥有自己独立的虚拟地址空间、寄存器集合和打开文件的描述符等资源。进程是Linux中最为重要的概念之一。

进程的特点

  • 进程是正在执行的一个程序或命令

    进程是操作系统中正在执行的一个程序或命令的实例。每个进程都有一个唯一的进程标识符(PID)和一组相关的系统资源,例如内存、打开的文件和输入/输出设备

  • 进程有自己的地址空间,占用一定的系统资源

    独立性:每个进程都是独立的实体,拥有自己的虚拟地址空间,因此一个进程无法访问另一个进程的内存空间,从而保证了进程的独立性和安全性

  • 一个CPU核同一时间只能运行一个进程

    在单核 CPU 上,同时只能运行一个进程。因为 CPU 在同一时间只能执行一条指令,而每个进程都有自己的一组指令需要被执行,因此同一时间只能有一个进程在执行。当有多个进程需要执行时,操作系统会使用时间片轮转算法,轮流为每个进程分配 CPU 时间,以达到看起来多个进程同时运行的效果。但实际上,每个进程都只在短暂的时间内运行了一小段代码。在多核 CPU 上,可以同时运行多个进程,每个进程都可以被分配到一个 CPU 核心上运行。

  • 进程由它的进程ID(PID)和它父进程的进程D(PPID)唯一识别

    程的唯一识别是通过进程ID(PID)来实现的,PID是一个唯一的数字标识符,用于区分正在运行的不同进程。在Linux中,每个进程都有一个唯一的PID,而且PID不会重复,因此可以通过PID来确定进程的身份

    与进程ID相关的另一个重要的属性是父进程ID(PPID),它是创建该进程的父进程的进程ID。在Linux中,每个进程都是由另一个进程创建的,所以每个进程都有一个PPID。通过PPID,我们可以建立进程之间的父子关系,形成进程树的结构

    除了PID和PPID之外,每个进程还有许多其他属性,例如进程的状态、优先级、打开的文件和共享内存等信息。这些属性可以通过/proc文件系统中的相应文件来查看

查看进程信息

# 查看启动的Nginx进程
# 使用 ps 命令查看正在运行的进程,配合 grep 命令可以过滤出含有关键字的进程
ps -ef | grep nginx
# 查看某个进程
# 查看指定进程的系统资源使用情况
top -p <pid>
# 关闭指定的进程
# 使用 kill 命令关闭指定进程。下面命令会向进程 ID 为 的进程发送终止信号,使其退出。
kill <pid>
# 全部进程动态实时视图
# 使用 top 命令查看所有进程的动态实时信息。会打印出一个实时更新的进程列表,包含 CPU 占用率、内存占用率等信息。可以使用快捷键 q 退出 top 命令
top

进程调度

问题思考:系统中运行的程序远远大于 CPU 的核数,那 Linux 系统是如何实现同时运行这么多程序的?

进程调度是指操作系统按某种策略或规则选择进程占用CPU进行运行的过程。

  • 创建阶段:进程在创建时,会分配资源并初始化进程控制块(Process Control Block,PCB),包括进程标识、程序计数器、CPU寄存器、内存分配情况等。
  • 就绪阶段:进程在获得了运行所需的资源后,会被放置在就绪队列中等待CPU的分配。此时进程已经准备好运行了,只是还没有得到CPU的资源。
  • 运行阶段:当进程被调度到CPU上运行时,进程的代码被加载到CPU中执行,这时进程进入运行状态。
  • 阻塞阶段:在运行过程中,如果进程需要等待某些事件(如等待I/O操作完成),就会进入阻塞状态,此时进程会释放CPU资源,直到等待的事件完成。
  • 结束阶段:当进程完成了它的任务或发生错误时,就会进入终止(僵死)状态。此时系统会回收该进程所占用的资源,并从进程表中删除该进程,也说明了这个进程结束了

进程的状态

其中,R、S、D、T是常见的进程状态。进程的状态会随着进程运行和系统调度而不断变化。进程状态可以通过命令ps -ef或top查看

  • R(TASK_RUNNING),可执行状态
  • S(TASK_INTERRUPTIBLE),可中断的睡眠状态
  • D(TASK_UNINTERRUPTIBLE),不可中断的睡眠状态
  • T(TASK_STOPPED or TASK_TRACED),暂停状态或跟踪状态
  • Z(TASK_DEAD-EXIT_ZOMBIE),退出状态,进程成为僵尸进程
  • X(TASK_DEAD-EXIT_DEAD),退出状态,进程即将被销毁

进程调度原则

  • 一个CPU核同一时间只能运行一个进程

    在多道程序设计中,CPU资源是必须被多个进程共享的。因为CPU核心数量是有限的,所以操作系统必须在多个进程之间进行调度,以便将CPU时间均匀地分配给它们。

  • 每个进程有近乎相等的执行时间

    当进程开始执行时,操作系统会根据进程的优先级和时间片大小进行调度。在进程执行的过程中,操作系统会监测进程的执行时间,并在进程的时间片用尽之前将其挂起,以便为其他进程腾出CPU时间

  • 对于逻辑CPU而言进程调度使用轮询的方式执行,当轮询完成则回到第一个进程反复

    操作系统通过轮询算法来进行进程调度。在轮询算法中,每个进程都被分配一个时间片,在时间片用尽之前,进程将一直运行。如果时间片用尽,则操作系统会将该进程挂起,并将CPU时间分配给下一个进程

  • 进程执行消耗时间和进程量成正比

    进程的执行时间与进程数量成正比。当系统中有更多的进程需要执行时,操作系统需要更多的时间来进行进程调度。这就导致了更多的上下文切换和调度时间,进而降低了系统的性能

进程的系统调用

  • 内核空间(Kernal Space):系统内核运行的空间
  • 用户空间(User Space):应用程序运行的空间

进程的系统调用是用户程序(用户态)与内核之间的一个接口,可以让用户程序获得内核提供的服务和功能。下面是进程的系统调用的基本流程:

  1. 用户程序发起系统调用,例如调用打开文件的系统调用 open()
  2. 程序经过用户态内核态切换后,进入内核态执行系统调用。
  3. 内核执行系统调用,并返回结果给用户程序,例如返回一个文件句柄。
  4. 程序再次经过内核态用户态切换后,回到用户态执行后续代码。

文件系统

  • 文件系统是操作系统中负责管理持久数据的子系统,负责把用户的文件存到磁盘硬件中,持久化的保存文件。Linux 中一切皆文件,不同的文件有不同的类型。
  • Liux文件系统是采用树状的目录结构,最上层是 /(根)目录。

问题思考:Linux有这么多不同的文件系统,如何实现对用户提供统一调用接口的?

虚拟文件系统(FVS)

  • 对应用层提供了一个标准的文件操作接口
  • 对文件系统提供了一个标准的文件接入接口

2023-95 (2)

Linux 为不同的文件系统提供了统一的调用接口,这就是虚拟文件系统(Virtual File System,简称 VFS)的概念。VFS 是 Linux 内核的核心模块之一,它提供了一套通用的文件系统接口,为应用程序提供了一种统一的、与底层文件系统无关的文件操作机制。

在 VFS 中,对所有的文件系统都采用统一的操作方式,这些操作会被映射到各个具体文件系统所对应的操作函数上。通过这种方式,VFS 能够屏蔽不同文件系统的差异性,为上层应用程序提供了一个统一的视图,使得应用程序不必关心文件的具体存储细节,而只需要关注文件操作本身。

因此,无论是 ext4、NTFS、FAT32 还是其他文件系统,应用程序都可以使用同样的方式来访问它们。这也是 Linux 系统在文件系统方面具有很强可扩展性和兼容性的一个重要原因。

查看文件系统类型

# df 命令报告文件系统磁盘空间利用率
df -T
# mount 命令是挂载文件系统用的
# 不带任何参数运行时,会打印包含文件系统类型在内的磁盘分区信息
mount

文件基本操作

ls # 查看文件夹下的内容mkdir demo # 创建文件夹mv demo /home # 移动 demo 文件夹到 /homerm -r demo # 删除 demo 文件夹touch file.txt # 创建空文件cp file.txt file_bak.txt # 复制文件(copy)

文件读取流程

2023-95 (3)

  • 用户空间:用户空间包括用户进程和用户缓冲区,用户进程通过系统调用发起文件读取请求,读取的数据存储在用户缓冲区中。
  • 内核空间:内核空间包括内核缓存区和Socket缓冲区,当用户进程发起文件读取请求后,操作系统内核会将文件内容从磁盘中读取到内核缓存区中,并将数据从内核缓存区复制到Socket缓冲区。
  • 硬件空间:硬件空间包括磁盘和网卡,当内核缓存区中的数据被复制到Socket缓冲区后,网卡会将数据发送到网络中,同时硬盘控制器从磁盘读取数据并传输到内核缓存区。

用户权限

  • 用户账号

    普通用户账户:在系统中进行普通作业

    超级用户账户:在系统中对普通用户和整个系统进行管理

  • 组账户

    标准组:可以容纳多个用户

    私有组:只有用户自己

查看用户信息

# 查看当前登录用户信息
w
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
xxxx     pts/0    192.168.xxx.x    18:16    3.00s  0.05s  0.00s w
# 查看当前用户所属的组
groups
# 查看用户的 uid 信息(这里以root为例)
id root
uid=0(root) gid=0(root) 组=0(root)

文件权限

2023-95 (4)

文件权限关于用户有三个概念:

  • 所有者:文件的所有者
  • 所在组:文件的所有者所在的组
  • 其他人:除文件所有者及所在组外的其他人

每个用户对于文件都有不同权限,包括读(R)、写(W)、执行(X)

用户权限操作

# 在根目录创建一个文件夹,查看当前用户拥有的文件夹的权限
cd / && mkdir demo && ls -ld demo
drwxr-xr-x 2 root root 6 5月  11 19:34 demo
sudo useradd ceshi # 创建一个用户,并赋予可写操作
sudo passwd ceshi # 设置账户密码
su ceshi # 切换 ceshi 用户登录
cd demo # 进入 demo 文件夹
touch index.js # 创建 index.js 文件,提示无权限,需要给 ceshi 用户 demo 文件夹的权限
sudo chown -R ceshi:ceshi ./demo # demo 文件夹权限给 ceshi 用户
su ceshi # 切换 ceshi 用户登录
cd demo # 进入 demo 文件夹
touch index.js # 创建 index.js 文件