Go内存管理 | 青训营笔记这是我参与「第五届青训营」伴学笔记创作活动的第 6 天。一、本堂课重点内容： Go内存管理

这是我参与「第五届青训营」伴学笔记创作活动的第 6 天。

一、本堂课重点内容：

1. Go内存管理及优化
1. 编译器和静态分析
1. Go编译器优化

二、详细知识点介绍：

1. Go内存管理及优化
- Go内存分配
  - 分块：
    - 目标：为对象在heap上分配内存
    - 提前将内存分块
      - 调用系统调用 mmap() 向 OS 申请一大块内存，例如 4 MB
      - 先将内存划分成大块，例如 8 KB，称作 mspan
      - 再将大块继续划分成特定大小的小块，用于对象分配
      - noscan mspan: 分配不包含指针的对象 —— GC 不需要扫描
      - scan mspan: 分配包含指针的对象 —— GC 需要扫描
    - 对象分配：根据对象的大小，选择最合适的块返回
  - 缓存
    - TCMalloc：thread caching
    - 每个p包含一个mcache用于快速分配，用于为绑定于p上的g分配对象
    - mcache管理一组mspan
    - 当mcache中的mspan分配完毕，向mcentral申请带有未分配块的mspan
    - 当mspan中没有分配的对象，mspan会被缓存在mcentral中，而不是立刻释放并归还给OS
- Go内存管理优化
  - 对象分配是非常高频的操作：每秒分配 GB 级别的内存
  - 小对象分配占大多数
  - Go内存分配比较耗时
    - 分配路径长：g -> m -> p -> mcache -> mspan -> memory block -> return pointer
    - pprof:对象分配的函数是最频繁调用的函数之一
- 字节优化方案(Balanced GC)
  - 每个g都绑定一大块内存(1KB)，称作goroutine allocation buffere(GAB)
  - GAB用于noscan类型的小对象分配： <128 B
  - 使用三个指针维护GAB：base，end，top
  - Bump pointer(指针碰撞) 风格对象分配
    - 无需和其他分配请求互斥
    - 分配动作简单高效
  - GAB对于Go内存管理是一个大对象
  - 本质：将多个小对象的分配合并成一次达对象的分配
  - 问题：GAB的对象分配方式会导致内存被延迟释放
  - 方案：移动GAB中的存活对象
    - 当GAB总大小超过一定阈值时，将GAB中存活的对象复制到另外分配的GAB中
    - 原本的GAB可以释放，避免内存泄漏
    - 本质:用copying GC的算法管理小对象。（根据对象的生命周期，使用不同的标记和清理策略）
- 性能收益
  - 高峰期cpu usage降低4.6%，核心接口时延下降4.5%~7.7% 。
1. 编译器和静态分析
- 基本介绍
  - 编译器结构
    - 重要的系统软件
      - 识别符合语法和非法的程序
      - 生成正确且高效的代码
    - 分析部分（前端）
      - 词法分析，生成词素
      - 语法分析，生成语法树
      - 语义分析，收集类型信息，进行语义检查
      - 中间代码生成，生成 intermediate representation(IR)
    - 综合部分（后端）
      - 代码优化，机器无关优化，生成优化后的IR
      - 代码生成，生成目标代码
  - 静态分析
    - 静态分析：不执行程序代码，推导程序的行为，分析程序的性质
- 数据流和控制流
  - 控制流：程序执行的流程
  - 数据流：数据在控制流上的传递
  - 通过分析控制流和数据流，可以知道更多关于程序的性质
  - 根据这些性质优化代码
- 过程内和过程间分析
  - 过程内分析
    - 仅在过程内部进行分析
  - 过程间分析
    - 考虑过程调用时参数传递和返回值的数据流和控制流
  - 为什么过程间分析是个问题
    - 过程间分析需要同时分析数据流和控制流，联合求解，比较复杂。
1. Go编译器优化
- 目的
  - 用户无感知，重新编译即可获得性能收益
  - 通用的优化手段
- 现状
  - 采用的优化较少
  - 追求编译时间短，因此没有进行复杂的代码分析和优化
- 思路
  - 面向后端长期执行的任务
  - 用适当增加编译时间换取更高性能的代码
- 函数内联
  - 将被调用函数的函数体的副本替换到调用位置上，同时重写代码以反映参数的绑定
  - 优点
    - 消除调用开销
    - 将过程间分析的问题转换为过程内分析，帮助其他分析
  - 缺点
    - 函数体变大
    - 编译生成的 Go 镜像文件变大
  - 函数内联在大多数情况下是正向优化，即多内联，会提升性能
  - 采取一定的策略决定是否内联
    - 调用和被调用函数的规模
- 逃逸分析
  - 分析代码中指针的动态作用域，即指针在何处可以被访问
  - 大致思路
    - 从对象分配处出发，沿着控制流，观察数据流。
    - 若发现指针 p 在当前作用域 s:
      - 作为参数传递给其他函数；
      - 传递给全局变量；
      - 传递给其他的 goroutine;
      - 传递给已逃逸的指针指向的对象；
    - 则指针 p 逃逸出 s，反之则没有逃逸出 s.
  - 优化：未逃逸出当前函数的指针指向的对象可以在栈上分配
    - 对象在栈上分配和回收很快：移动 sp 即可完成内存的分配和回收；
    - 减少在堆上分配对象，降低 GC 负担。
- 性能收益

三、课后个人总结：

好好学习天天向上