截止到上一篇12 | CPU 性能优化思路CPU篇章结束,继续看内存相关的内容。
1. 概述
内存结构复杂,涉及众多概念。以下是对其中一些基本概念的简要介绍:
- 物理内存:物理内存由内核统一管理,用户进程不能直接访问,只能通过系统调用间接操作。
- 虚拟地址空间:每个进程拥有独立的虚拟地址空间,这是一种逻辑上的连续地址范围,与物理地址通过页表映射关联。
- 用户空间和内核空间:虚拟地址空间分为用户空间(供进程使用)和内核空间(供系统使用),两者在权限和功能上严格隔离。
- 内存映射:通过页表将虚拟内存映射到物理内存,或者将文件、设备与虚拟地址空间关联,实现灵活的资源管理。
物理地址的映射关系
- 而当进程访问的虚拟地址在页表中查不到时,系统会产生一个缺页异常,进入内核空间分配物理内存、更新进程页表,最后再返回用户空间,恢复进程的运行。页表实际上存储在 CPU 的内存管理单元 MMU 中,这样,正常情况下,处理器就可以直接通过硬件,找出要访问的内存。
- TLB 是页表的高速缓存,通过TLB可以加速页表的查询。
- MMU 并不以字节为单位来管理内存,而是规定了一个内存映射的最小单位,也就是页,通常是 4 KB 大小。这样,每一次内存映射,都需要关联 4 KB 或者 4KB 整数倍的内存空间。所以管理一个4GB的物理内存空间,需要100万个页表项,就是我们俗称的页表非常大。通常对于此类问题会通过多级页表以及大页内存来解决。
- 多级页表就是把内存分成区块来管理,将原来的映射关系改成区块索引和区块内的偏移。由于虚拟内存空间通常只用了很少一部分,那么,多级页表就只保存这些使用中的区块,这样就可以大大地减少页表的项数。Linux 用的正是四级页表来管理内存页,如下图所示,虚拟地址被分为 5 个部分,前 4 个表项用于选择页,而最后一个索引表示页内偏移。
- 大页就好理解了,将MMU分配单元扩大,比如1MB,页表项就会相应减少。
通过这些机制,在页表的映射下,进程就可以通过虚拟地址来访问物理内存了。
从一个Linux进程的角度了解如何使用内存。下图是虚拟内存空间分布,以32位系统为例:
除了内核空间外,剩下部分即是用户空间。用户空间内存,从低到高分别是五种不同的内存段。
- 只读段,包括代码和常量等。
- 数据段,包括全局变量等。
- 堆,包括动态分配的内存,从低地址开始向上增长。
- 文件映射段,包括动态库、共享内存等,从高地址开始向下增长。
- 栈,包括局部变量和函数调用的上下文等。栈的大小是固定的,一般是 8 MB。
在这五个内存段中,堆和文件映射段的内存是动态分配的。比如说,使用 C 标准库的 malloc() 或者 mmap() ,就可以分别在堆和文件映射段动态分配内存。
内存是如何分配与回收
- brk (Break)
- 定义:
brk系统调用调整进程数据段(Data Segment)顶端的边界,来增加或减少堆的大小。 - 内存区域:
通过调整堆的大小来分配或释放内存。 - 特点:
-
- 操作的是堆(Heap)。
- 分配的内存是连续的。
- 堆的扩展会受到其他内存区域(如栈、文件映射区)的限制。
- mmap
- 定义:
mmap系统调用通过映射内存区域(Memory-Mapped Files)来分配内存。 - 内存区域:
通常分配在文件映射区(堆和栈之间的虚拟内存区域)。 - 特点:
-
- 分配的内存可以是非连续的。
- 可用于内存映射文件或匿名内存分配(
MAP_ANONYMOUS)。 - 更灵活,可以分配大块内存,不受堆大小的限制。
工作原理如下:
- brk 工作原理
- 默认情况下,堆的初始大小在进程启动时确定。
- 通过
brk或sbrk调用,调整数据段的末尾(break地址)。 - 分配方式是线性的,堆从低地址向高地址增长。
- mmap 工作原理
- 为内存分配创建一个新的虚拟内存区域。
- 通过内存映射(
mmap)接口,可以直接映射到文件或分配匿名内存。 - 内核会在虚拟地址空间中找到合适的空闲区域,不受其他段的限制。
需要知道一点,当这两种调用发生后,其实并没有真正分配内存。这些内存,都只在首次访问时才分配,也就是通过缺页异常进入内核中,再由内核来分配内存。对于内存释放,调用 free() 或 unmap() ,来释放这些不用的内存。
那么MMU最小分配单元是4KB,对于小于4KB的小内存如何管理?
在用户空间,malloc 通过 brk() 分配的内存,在释放时并不立即归还系统,而是缓存起来重复利用。
在内核空间,Linux 则通过 slab 分配器来管理小内存。你可以把 slab 看成构建在伙伴系统上的一个缓存,主要作用就是分配并释放内核中的小对象。
当系统发现内存不足时,会出发回收机制:
- 回收缓存,比如使用 LRU(Least Recently Used)算法,回收最近使用最少的内存页面;
- 回收不常访问的内存,把不常用的内存通过交换分区直接写到磁盘中;
- 杀死进程,内存紧张时系统还会通过 OOM(Out of Memory),直接杀掉占用大量内存的进程。
其中第二种方式就是换入,换出,就是我们常说的使用Swap区域。换出换入可以从内存视角理解,从内存出去就是换出,进入到内存就是换入。vmstat命令中si、so就是换入换出的。所以当出现严重的si、so时会伴随着I/O性能问题。
OOM(Out of memory)就比较熟悉了,他的判定规则是使用oom_score给每个进程打分:
- 一个进程消耗的内存越大,oom_score 就越大;
- 一个进程运行占用的 CPU 越多,oom_score 就越小。
oom_score越大,越容易被OOM。
大致了解内存的分配机制,访问机制,下面看如何查看内存使用情况。首先想到的命令应该是free。
# 注意不同版本的free输出可能会有所不同
$ free
total used free shared buff/cache available
Mem: 8169348 263524 6875352 668 1030472 7611064
Swap: 0 0 0
字段解释
| 列名 | 含义 |
|---|---|
| total | 总内存大小 |
| used | 已使用内存大小(包括共享内存) |
| free | 未使用内存大小 |
| shared | 共享内存大小 |
| buff/cache | 缓存和缓冲区的大小 |
| available | 新进程可用内存大小 |
最后一列的可用内存 available 。available 不仅包含未使用内存,还包括了可回收的缓存,所以一般会比未使用内存更大。不过,并不是所有缓存都可以回收,因为有些缓存可能正在使用中。
如果想知道某个进程使用的内存,就需要用到top或者ps命令。
# 按下M切换到内存排序
$ top
...
KiB Mem : 8169348 total, 6871440 free, 267096 used, 1030812 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 7607492 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
430 root 19 -1 122360 35588 23748 S 0.0 0.4 0:32.17 systemd-journal
1075 root 20 0 771860 22744 11368 S 0.0 0.3 0:38.89 snapd
1048 root 20 0 170904 17292 9488 S 0.0 0.2 0:00.24 networkd-dispat
1 root 20 0 78020 9156 6644 S 0.0 0.1 0:22.92 systemd
12376 azure 20 0 76632 7456 6420 S 0.0 0.1 0:00.01 systemd
12374 root 20 0 107984 7312 6304 S 0.0 0.1 0:00.00 sshd
...
内存关键指标
| 列名 | 含义 |
|---|---|
| VIRT | 进程虚拟内存的大小,包括未实际分配的物理内存 |
| RES | 常驻内存大小,即进程实际使用的物理内存大小(不包括 Swap 和共享内存) |
| SHR | 共享内存大小,包括共享内存、动态链接库及程序的代码段等 |
| %MEM | 进程使用的物理内存占系统总内存的百分比 |
注意:
- 虚拟内存通常不会完全分配物理内存,进程的虚拟内存大于常驻内存。
- 共享内存(SHR)不一定完全是共享的,除了进程间共享的内存外,程序的代码段和非共享的动态链接库也算在内。
参考文献:
blog.holbertonschool.com/hack-the-vi…
《Linux 性能优化实战》