内存优化及编译器｜青训营笔记

用户9531013441456

2023-01-29 209 阅读4分钟

业务层优化
- 针对特定场景，具体问题
- 容易获得较大的性能收益
运行时优化
- 解决更通用的性能问题
- 考虑更多场景
- Tradeoffs
数据驱动
- 自动化性能分析工具 pprof
- 依靠数据
- 首先优化最大瓶颈

自动内存管理

动态内存
- 程序在运行时根据需求分配的内存：malloc()
自动内存管理（垃圾回收）：由程序语言的运行时系统管理动态内存
- 避免手动内存管理
- 保证内存使用的正确性和安全性
三个任务
- 为新内存分配空间
- 找到存活对象
- 回收死亡对象内存空间

追踪垃圾回收

对象被回收的条件：指针指向关系不可达的对象
标记根对象
- 静态变量，全局变量，常量，线程栈等（因为这些对象存储的变量还会用到，它们必然存活）
标记：找到可达对象
- 求指针指向关系等传递闭包：从根对象出发，找到所有可达对象
清理：所有不可达对象
- 将存活对象复制到另外的内存空间（Copying GC）
- 将死亡对象的内存标记为“可分配”（Mark-sweep GC）
- 移动并整理存活对象（Mark-compact GC）

分代GC

分代假说：most objects die young
Intuition：很多对象在分配出来后很快就不再使用
每个对象都有年龄：经历过GC的次数
目的：针对年轻和年老的对象，使用不同的GC策略，降低整体内存管理开销
不同年龄的对象处于heap不同区域
年轻代（Young generation）
- 常规的对象分配
- 由于存活对象少，可以采用Copying collection
- GC吞吐率很高
老年代（Old generation）
- 对象趋于一致活着，反复复制开销大
- 可以采用Mark-sweep collection

引用计数

每个对象都有一个与之关联的引用数目
对象存活条件：当且仅当引用数大于0
优点
- 内存管理操作被平摊刀程序执行中
- 内存管理不需要了解runtime的实现细节：C++智能指针
缺点：
- 维护开销大，需要使用原子操作
- 无法回收环形数据结构
- 内存开销：引入数目的额外存储空间
- 回收内存时依然可能引发暂停

Go内存管理及优化

内存分配

为对象在heap上分配内存
提前将内存分块
- 调用系统调用mmap()向OS申请一块内存，如4M
- 先将内存划分为大块，例如8KB，称作mspan
- 再将大块内存继续划分为特定大小的小块，用作对象分配
- noscan mspan: 分配不包含指针的对象 -----------GC不需要扫描
- scan msapn：分配包含指针的对象 ---------------- GC需要扫描
对象分配：根据对象的大小，选择最合适的块返回

编译器和静态分析

重要的系统软件
- 识别符合语法和非法的程序
- 生成正确且高效的代码
分析部分（前端front end）
- 词法分析，生成词素（lexeme）
- 语法分析，生成语法树
- 语义分析，收集类型信息，进行语义检查
- 中间代码生成，生成intermediate representation (IR)
综合部分（后端 back end）
- 代码优化，机器无关优化，生成优化后的IR
- 代码生成，生成目标代码

静态分析

不执行程序代码，推导程序行为，分析程序的性质
控制流：程序执行的流程
数据流：数据在控制流上的传递

Go编译器优化

函数内联

将被调用函数的函数体的副本直接替换到调用位置上，同时重写代码以反映参数的绑定

优点：

消除了调用开销，将过程间分析转化为过程内分析

缺点：

函数题变大，编译生成的Go镜像变大

Beast Mode

逃逸分析

分析代码中指针的动态作用域：指针在何处可以被访问