-
业务层优化
- 针对特定场景,具体问题
- 容易获得较大的性能收益
-
运行时优化
- 解决更通用的性能问题
- 考虑更多场景
- Tradeoffs
-
数据驱动
- 自动化性能分析工具 pprof
- 依靠数据
- 首先优化最大瓶颈
自动内存管理
-
动态内存
- 程序在运行时根据需求分配的内存:malloc()
-
自动内存管理(垃圾回收):由程序语言的运行时系统管理动态内存
- 避免手动内存管理
- 保证内存使用的正确性和安全性
-
三个任务
- 为新内存分配空间
- 找到存活对象
- 回收死亡对象内存空间
追踪垃圾回收
-
对象被回收的条件:指针指向关系不可达的对象
-
标记根对象
- 静态变量,全局变量,常量,线程栈等(因为这些对象存储的变量还会用到,它们必然存活)
-
标记:找到可达对象
- 求指针指向关系等传递闭包:从根对象出发,找到所有可达对象
-
清理:所有不可达对象
- 将存活对象复制到另外的内存空间(Copying GC)
- 将死亡对象的内存标记为“可分配”(Mark-sweep GC)
- 移动并整理存活对象(Mark-compact GC)
分代GC
-
分代假说:most objects die young
-
Intuition:很多对象在分配出来后很快就不再使用
-
每个对象都有年龄:经历过GC的次数
-
目的:针对年轻和年老的对象,使用不同的GC策略,降低整体内存管理开销
-
不同年龄的对象处于
heap不同区域 -
年轻代(Young generation)
- 常规的对象分配
- 由于存活对象少,可以采用Copying collection
- GC吞吐率很高
-
老年代(Old generation)
- 对象趋于一致活着,反复复制开销大
- 可以采用Mark-sweep collection
引用计数
-
每个对象都有一个与之关联的引用数目
-
对象存活条件:当且仅当引用数大于0
-
优点
- 内存管理操作被平摊刀程序执行中
- 内存管理不需要了解runtime的实现细节:C++智能指针
-
缺点:
- 维护开销大,需要使用原子操作
- 无法回收环形数据结构
- 内存开销:引入数目的额外存储空间
- 回收内存时依然可能引发暂停
Go内存管理及优化
内存分配
-
为对象在heap上分配内存
-
提前将内存分块
- 调用系统调用
mmap()向OS申请一块内存,如4M - 先将内存划分为大块,例如8KB,称作mspan
- 再将大块内存继续划分为特定大小的小块,用作对象分配
- noscan mspan: 分配不包含指针的对象 -----------GC不需要扫描
- scan msapn:分配包含指针的对象 ---------------- GC需要扫描
- 调用系统调用
-
对象分配:根据对象的大小,选择最合适的块返回
编译器和静态分析
-
重要的系统软件
- 识别符合语法和非法的程序
- 生成正确且高效的代码
-
分析部分(前端front end)
- 词法分析,生成词素(lexeme)
- 语法分析,生成语法树
- 语义分析,收集类型信息,进行语义检查
- 中间代码生成,生成intermediate representation (IR)
-
综合部分(后端 back end)
- 代码优化,机器无关优化,生成优化后的IR
- 代码生成,生成目标代码
静态分析
- 不执行程序代码,推导程序行为,分析程序的性质
- 控制流:程序执行的流程
- 数据流:数据在控制流上的传递
Go编译器优化
函数内联
将被调用函数的函数体的副本直接替换到调用位置上,同时重写代码以反映参数的绑定
优点:
消除了调用开销,将过程间分析转化为过程内分析
缺点:
函数题变大,编译生成的Go镜像变大
Beast Mode
逃逸分析
分析代码中指针的动态作用域:指针在何处可以被访问