这是我参与「第五届青训营」伴学笔记创作活动的第12天

内存分配：

分块

提前将内存分块
- 调用系统调用 mmap() 向 OS 申请一大块内存，例如 4 MB
- 先将内存划分成大块，例如 8 KB，称作 mspan
- 再将大块继续划分成特定大小的小块，用于对象分配
- - noscan mspan: 分配不包含指针的对象 —— GC 不需要扫描
  - scan mspan: 分配包含指针的对象 —— GC 需要扫描
对象分配：根据对象的大小，选择最合适的块返回

Go 内存管理构成了多级缓存机制，从 OS 分配得的内存被内存管理回收后，也不会立刻归还给 OS，而是在 Go runtime 内部先缓存起来，从而避免频繁向 OS 申请内存。mspan, mcache 和 mcentral 构成了内存管理的多级缓存机制，内存分配的路线图如下：

mspan, mcache 和 mcentral 构成了内存管理的多级缓存机制。

线上 profiling 发现，Go 的内存分配占用很多 CPU
- 可以看到，用于分配对象的函数 mallocgc() 占用 CPU 较高
- 分配路径长：g -> m -> p -> mcache -> mspan -> memory block -> return pointer
小对象分配占大多数
- 横轴是对象大小，纵轴是数目，可以看到绝大多数对象都小于 80 B。因此优化小对象分配是关键

Balanced GC
每个 G 会附加一个较大的 allocation buffer (例如 1 KB) 用来分配小于 128 B 的 noscan 小对象
核心：将 noscan 对象在 per-g allocation buffer (GAB) 上分配，并使用移动对象 GC 管理这部分内存，提高对象分配和回收效率
- GAB对于GO内存管理来说是一个对象
分配对象时，根据对象大小移动 top 指针并返回，快速完成一次对象分配
同原先调用 mallocgc() 进行对象分配的方式相比，balanced GC** 缩短了对象分配的路径**，减少了对象分配执行的指令数目，降低 CPU 使用
本质：将多个小对象的分配合并成一次大对象的分配
问题：当 GAB 中哪怕只有一个小对象存活时，Go runtime 也会认为整个大对象（即 GAB）存活，GAP的对象分配会导致内存被延迟释放
方案：移动GAB中存活的对象
- 当GAB总大小超过一定阈值时，将GAB中存活的对象复制到另外分配的GAB中
- 原先的GAB可以释放，避免内存泄漏
- 本质：使用 copying GC的算法管理小对象（根据对象生命周期，使用不同的清理策略）

编译器的结构