这是我参与「第五届青训营」伴学笔记创作活动的第 5 天

进行昨天课程内容的笔记补充，今天的课程笔记还需要整理整理>.<

内存管理优化与编译器优化

内存管理优化

分块

为对象在heap上分配内存，go提前将内存分块

调用系统调用mmap()向OS申请一大块内存，例如4MB
先将内存分成大块，例如8KB，成为，mspan
再将大块继续分为规定大小的小块，用于对象分配
moscan mspan：分配不包含指针的对象——GC不需要扫描
scan mspan：包含指针——GC需要扫描根据对象大小，选择最合适的块返回

缓存

分配路径 g -> m -> p -> mcache -> mspan -> memory block -> return pointer

每一个p包含一个mcache用于快速分配。

mcache管理一组mspan。当有内存申请时，从mcache中找到最合适大小内存块，从中找到空闲内存进行分配

若其中没有空闲内存，则从对应的mcentral申请带有未分配块的mspan

另外，当mspan中没有分配的对象，mspan会缓存在mcentral中，而不是立即释放

优化前提

对象分配是非常高频的操作，每秒GB级小对象的占比较高 GOlang内存分配占比很高

优化方案——Balanced GC（指针碰撞＋copying GC）

每个g都绑定一大块内存(1KB)——GAB

GAB用于小对象分配 < 128B

使用三个指针维护GAB: base, end, top。

进行Bump pointer（指针碰撞）风格对象分配

原理如右图，若GAB中的内存足够进行分配，则直接进行分配，然后向右移动top指针。

无需与其他分配请求互斥
简单高效

GAB对于GO内存管理来说是一个大对象

本质是多个小对象的分配合并成一个大对象的分配

问题： GAB的内存会被延迟释放（小对象存活）
解决：当GAB的总大小超过一定阈值时，使用copying GC的方法分配到另外的GAB中

编译器优化

编译器编译流程

前端：

词法分析
语法分析
语义分析
中间代码生成

后端：

代码优化
代码生成

主要讲的是编译器后端优化

静态分析

即不执行程序代码，推导程序的行为和性质。

常见分析

控制流（Control flow）:程序执行的流程，一般用控制流程图表示（contol-flow graph）
数据流（Data flow）：数据在控制流上的传递——代入数据进行流程

根据这些性质进行优化

过程内分析

仅在函数内部进行分析

过程间分析

考虑函数调用时的参数调用及返回数据
需要同时分析数据流及控制流，比较复杂

Go编译器优化优点

用户无感知
通用

现状

采用的优化少
编译时间较短，没有进行比较复杂的代码分析和优化

优化思路

用编译时间换取更高效的机器码

Beast mode：

函数内联
逃逸分析
等等

函数内联（inlining）

内联：将被调用函数的函数体副本替换到调用位置上，重写部分代码

优点：消除函数调用开销，过程间分析转化为过程内分析，也增加了其他优化的机会，如逃逸分析，效果很大
缺点：函数体变大，对instruction cache不友好；编译生成的Go镜像变大；GO的一些语言特性，例如interface、defer等，限制了内联

大多数情况下是正向优化，可以使用一些内联策略，如函数规模评判等

逃逸分析

分析代码中指针的作用域，若与外界有关则“逃逸”

未被逃逸的对象可以在栈上进行分配

分配速度块
降低了GC的负担

函数内联使更多对象不逃逸

课程笔记五 优化篇(二)内存与编译器 | 青训营笔记

内存管理优化与编译器优化