这是我参与「第五届青训营」伴学笔记创作活动的第 10 天。

高性能GO语言发行版优化与落地实践（下）

这章讲述编译器优化，并讲述字节跳动遇到的性能问题及优化方案。

编译器和静态分析

编译器的结构

编译器是重要的系统软件，可以用来识别符合语法和非法的程序，也能生成正确且高效的代码。

分析部分（前端 front end）：

词法分析，生成词素（lexeme）
词法分析，生成语法树
语义分析，收集类型信息，进行语义检查
中间代码生成，生成intermediate representation

综合部分（后端back end）：

代码优化，机器无关优化，生成优化后的IR
代码生成，生成目标代码

静态分析

静态分析：不执行程序代码，推导程序的行为，分析程序的性质。
控制流（Control flow）：程序执行的流程
数据流（Data flow）：数据在控制流上的传递

通过分析控制流和数据流，我们可以知道更多关于程序的性质（properties），根据这些性质来优化代码。

过程内分析和过程间分析

过程内分析（Intra-procedural analysis）：

仅在过程内部进行分析

过程间分析（Inter-procedural analysis）：

考虑过程调用时参数传递和返回值的数据流和控制流

但是过程间分析需要通过数据流分析得知i的具体类型，才能知道o.foo（）调用的是哪个foo（）。过程间分析需要同时分析控制流和数据流-联合求解，比较复杂。

GO编译器优化

做编译器优化的原因是用户无感知，重新编译即可获得性能收益，同时也是通用性优化。目前采用的优化少，编译时间较短，没有进行较复杂的代码分析和优化。

编译优化的思路：

面向后端长期执行任务
用编译时间换取更高效的机器码。

Best mode：

函数内联
逃逸分析
默认栈大小调整
边界检查消除
循环展开
.......

函数内联（Inling）

定义：将被调用函数的函数体（callee）的副本替换到调用位置（caller）上，同时重写代码以反映参数的绑定。

优点：

消除函数调用开销，例如传递参数，保存寄存器等。
将过程间分析转化为过程内分析，帮助其他优化，比如逃逸分析。

可以使用micro-benchmark验证函数内联有多大程度影响性能。

使用micro-benchmark快速验证和对比性能优化结果

缺点：

函数体变大，Instruction cache（icache）不友好
编译生成的Go镜像变大

函数内联在大多情况下是正向优化。

Best Mode

Go函数内联受到的限制较多：
- 语言特性（defer，interface等）限制了函数内联
- 内联策略非常保守
Beast mode：调整函数内联的策略，使更多函数被内联：
- 降低函数调用的开销
- 增加了其他优化的机会：逃逸分析
开销
- Go镜像增加~10%
- 编译时间增加

逃逸分析

指分析代码中指针的动态作用域：指针在何处可以被访问。

大致思路：

从对象分配处出发，沿着控制流，观察对象的数据流。
若发现指针p在当前作用域s：
- 作为参数传递给其他函数
- 传递给全局变量
- 传递给其他的goroutine
- 传递给已逃逸的指针指向对象
则指针p指向的对象逃逸出s，反之则没有逃逸出s。

Beast Mode：函数内联拓展了函数边界，更多对象不逃逸。

优化：未逃逸的对象可以在栈上分配：

对象在栈上分配和回收很快：移动sp
减少在heap上的分配，降低GC负担

总结

这章介绍了高性能Go语言发行版优化与落地实践，性能优化部分包括了自动内存管理，Go内存管理，编译器与静态分析，编译器优化。还实践了用Balance GC优化对象分配，用Beast mode提升代码性能。

高性能GO语言发行版本优化与实践落地(下) ｜ 青训营笔记