13 | Linux内存截止到上一篇12 | CPU 性能优化思路CPU篇章结束，继续看内存相关的内容。 1. 概述内

截止到上一篇12 | CPU 性能优化思路CPU篇章结束，继续看内存相关的内容。

1. 概述

内存结构复杂，涉及众多概念。以下是对其中一些基本概念的简要介绍：

物理内存：物理内存由内核统一管理，用户进程不能直接访问，只能通过系统调用间接操作。
虚拟地址空间：每个进程拥有独立的虚拟地址空间，这是一种逻辑上的连续地址范围，与物理地址通过页表映射关联。
用户空间和内核空间：虚拟地址空间分为用户空间（供进程使用）和内核空间（供系统使用），两者在权限和功能上严格隔离。
内存映射：通过页表将虚拟内存映射到物理内存，或者将文件、设备与虚拟地址空间关联，实现灵活的资源管理。

物理地址的映射关系

而当进程访问的虚拟地址在页表中查不到时，系统会产生一个缺页异常，进入内核空间分配物理内存、更新进程页表，最后再返回用户空间，恢复进程的运行。页表实际上存储在 CPU 的内存管理单元 MMU 中，这样，正常情况下，处理器就可以直接通过硬件，找出要访问的内存。

TLB 是页表的高速缓存，通过TLB可以加速页表的查询。
MMU 并不以字节为单位来管理内存，而是规定了一个内存映射的最小单位，也就是页，通常是 4 KB 大小。这样，每一次内存映射，都需要关联 4 KB 或者 4KB 整数倍的内存空间。所以管理一个4GB的物理内存空间，需要100万个页表项，就是我们俗称的页表非常大。通常对于此类问题会通过多级页表以及大页内存来解决。
多级页表就是把内存分成区块来管理，将原来的映射关系改成区块索引和区块内的偏移。由于虚拟内存空间通常只用了很少一部分，那么，多级页表就只保存这些使用中的区块，这样就可以大大地减少页表的项数。Linux 用的正是四级页表来管理内存页，如下图所示，虚拟地址被分为 5 个部分，前 4 个表项用于选择页，而最后一个索引表示页内偏移。

大页就好理解了，将MMU分配单元扩大，比如1MB，页表项就会相应减少。

通过这些机制，在页表的映射下，进程就可以通过虚拟地址来访问物理内存了。

从一个Linux进程的角度了解如何使用内存。下图是虚拟内存空间分布，以32位系统为例：

除了内核空间外，剩下部分即是用户空间。用户空间内存，从低到高分别是五种不同的内存段。

只读段，包括代码和常量等。
数据段，包括全局变量等。
堆，包括动态分配的内存，从低地址开始向上增长。
文件映射段，包括动态库、共享内存等，从高地址开始向下增长。
栈，包括局部变量和函数调用的上下文等。栈的大小是固定的，一般是 8 MB。

在这五个内存段中，堆和文件映射段的内存是动态分配的。比如说，使用 C 标准库的 malloc() 或者 mmap() ，就可以分别在堆和文件映射段动态分配内存。

内存是如何分配与回收

brk (Break)

定义:
brk 系统调用调整进程数据段（Data Segment）顶端的边界，来增加或减少堆的大小。
内存区域:
通过调整堆的大小来分配或释放内存。
特点:

- 操作的是堆（Heap）。
- 分配的内存是连续的。
- 堆的扩展会受到其他内存区域（如栈、文件映射区）的限制。

mmap

定义:
mmap 系统调用通过映射内存区域（Memory-Mapped Files）来分配内存。
内存区域:
通常分配在文件映射区（堆和栈之间的虚拟内存区域）。
特点:

- 分配的内存可以是非连续的。
- 可用于内存映射文件或匿名内存分配（MAP_ANONYMOUS）。
- 更灵活，可以分配大块内存，不受堆大小的限制。

工作原理如下：

brk 工作原理

默认情况下，堆的初始大小在进程启动时确定。
通过 brk 或 sbrk 调用，调整数据段的末尾（break 地址）。
分配方式是线性的，堆从低地址向高地址增长。

mmap 工作原理

为内存分配创建一个新的虚拟内存区域。
通过内存映射（mmap）接口，可以直接映射到文件或分配匿名内存。
内核会在虚拟地址空间中找到合适的空闲区域，不受其他段的限制。

需要知道一点，当这两种调用发生后，其实并没有真正分配内存。这些内存，都只在首次访问时才分配，也就是通过缺页异常进入内核中，再由内核来分配内存。对于内存释放，调用 free() 或 unmap() ，来释放这些不用的内存。

那么MMU最小分配单元是4KB，对于小于4KB的小内存如何管理？

在用户空间，malloc 通过 brk() 分配的内存，在释放时并不立即归还系统，而是缓存起来重复利用。

在内核空间，Linux 则通过 slab 分配器来管理小内存。你可以把 slab 看成构建在伙伴系统上的一个缓存，主要作用就是分配并释放内核中的小对象。

当系统发现内存不足时，会出发回收机制：

回收缓存，比如使用 LRU（Least Recently Used）算法，回收最近使用最少的内存页面；
回收不常访问的内存，把不常用的内存通过交换分区直接写到磁盘中；
杀死进程，内存紧张时系统还会通过 OOM（Out of Memory），直接杀掉占用大量内存的进程。

其中第二种方式就是换入，换出，就是我们常说的使用Swap区域。换出换入可以从内存视角理解，从内存出去就是换出，进入到内存就是换入。vmstat命令中si、so就是换入换出的。所以当出现严重的si、so时会伴随着I/O性能问题。

OOM（Out of memory）就比较熟悉了，他的判定规则是使用oom_score给每个进程打分：

一个进程消耗的内存越大，oom_score 就越大；
一个进程运行占用的 CPU 越多，oom_score 就越小。

oom_score越大，越容易被OOM。

大致了解内存的分配机制，访问机制，下面看如何查看内存使用情况。首先想到的命令应该是free。

# 注意不同版本的free输出可能会有所不同
$ free
              total        used        free      shared  buff/cache   available
Mem:        8169348      263524     6875352         668     1030472     7611064
Swap:             0           0           0

字段解释

列名	含义
total	总内存大小
used	已使用内存大小（包括共享内存）
free	未使用内存大小
shared	共享内存大小
buff/cache	缓存和缓冲区的大小
available	新进程可用内存大小

最后一列的可用内存 available 。available 不仅包含未使用内存，还包括了可回收的缓存，所以一般会比未使用内存更大。不过，并不是所有缓存都可以回收，因为有些缓存可能正在使用中。

如果想知道某个进程使用的内存，就需要用到top或者ps命令。

# 按下M切换到内存排序
$ top
...
KiB Mem :  8169348 total,  6871440 free,   267096 used,  1030812 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  7607492 avail Mem


  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
  430 root      19  -1  122360  35588  23748 S   0.0  0.4   0:32.17 systemd-journal
 1075 root      20   0  771860  22744  11368 S   0.0  0.3   0:38.89 snapd
 1048 root      20   0  170904  17292   9488 S   0.0  0.2   0:00.24 networkd-dispat
    1 root      20   0   78020   9156   6644 S   0.0  0.1   0:22.92 systemd
12376 azure     20   0   76632   7456   6420 S   0.0  0.1   0:00.01 systemd
12374 root      20   0  107984   7312   6304 S   0.0  0.1   0:00.00 sshd
...

内存关键指标

列名	含义
VIRT	进程虚拟内存的大小，包括未实际分配的物理内存
RES	常驻内存大小，即进程实际使用的物理内存大小（不包括 Swap 和共享内存）
SHR	共享内存大小，包括共享内存、动态链接库及程序的代码段等
%MEM	进程使用的物理内存占系统总内存的百分比

注意：

虚拟内存通常不会完全分配物理内存，进程的虚拟内存大于常驻内存。
共享内存（SHR）不一定完全是共享的，除了进程间共享的内存外，程序的代码段和非共享的动态链接库也算在内。

参考文献：

blog.holbertonschool.com/hack-the-vi…

《Linux 性能优化实战》