这是我参与「第三届青训营 -后端场」笔记创作活动的第3篇笔记。 前言:
性能优化与软件质量 在保证软件接口稳定的前提下改进具体实现 测试用例:尽量覆盖 文档 隔离:通过选项控制是否开启优化 可观测:必要的日志输出
性能优化的基本问题
性能优化两个方面 业务层,语言优化
性能优化的可维护性
01. 自动化内存管理
1.1概念
-
动态内存 程序在运行时根据需求动态分配的malloc
-
自动内存管理(垃圾回收):程序语言动态内存管理 避免手动,专注业务 保证内存使用正确性和安全性
-
三个任务 为对象分配新空间;找回存活对象;回收死亡对象
1.1 自动内存管理——相关概念
- Mutator:业务线程,分配新对象,修改对象指向
- Collector:GC线程,找到存活对象,回收死亡对象
- Serial GC:只有一个collector
- Parallel GC:多个collector
- Concurrent GC:mutator和collector同时执行
- 必须感知对象指向关系的改变
1.1 自动内存管理-概念
- 评价GC算法
-
- 安全性:不能回收存活的对象 基本要求
-
- 吞吐率: 花在GC上的时间
-
- 暂停时间:stw 业务是否感知
-
- 内存开销: GC元数据开销
1.2 追踪垃圾回收
对象被回收的条件:指针指向关系不可达的对象
- 标记根对象
-
- 静态变量,全局变量,常量,线程栈
- 标记:找到可达对象
-
- 求指针指向关系的传递闭包
- 清理:所有不可达对象
-
- Copying GC
-
- Mark Sweep
-
- Mark compact GC
- 根据对象的生命周期,使用不同的标记和清理策略
1.3 分代GC
- 分代假说:使用过就不再使用了
- 目的:对年轻和年老的对象指定不同的GC
- 不同年龄的对象放置在heap不同区域
1.4 引用计数
- 每个对象都有一个与之关联的引用数目
- 对象存活的条件:当且仅当引用数大于0
- 优点
-
- 内存管理操作平摊到程序执行过程
-
- 不需要了解runtime的实现细节,如C++智能指针(smart pointer)
- 缺点
-
- 需要通过原子操作,开销大
-
- 无法回收环形结构-week reference
-
- 内存开销,每个对象计数,开销大
-
- 回收可能引发暂停
02. Go内存管理及优化
2.1 内存分配——分块
- 目标:为对象在heap上分配内存
- 提前将内存分块
- 对象分配:根据对象的大小,选择最合适的块返回
2.1 内存分配——缓存
- TCMallloc:thread cashing
- 每个p包含一个mcache用于快速分配
2.2 Go内存管理优化
- 对象分配时非常高频的操作:每秒分配GB级别内存
- 小对象占比高
- Go 内存分配比较耗时
2.3 字节的优化方案:Blanced GC
- GAB对于Go内存管理来说是一个大对象
- 本质:将多个小对象的分配合并成一个大对象
- 问题:GAB的对象分配方式会导致内存被延迟释放
- 语言类顶会: PLDI POPL OOPSLA ECOOP
03. 编译器和静态分析
3.1 编译器结构
主要学习后端优化
3.2 静态分析
- 静态分析:不执行程序代码,推导程序行为,分析
- 控制流:程序执行的流程
- 数据流:数据在控制流上的传递
过程内分析和过程间分析
- 过程内分析:函数内部
- 过程间分析:参数传递,返回值,数据流控制流
04. Go编译器优化
4.1 函数内联(Inlining)
- 内联:将被调用函数的函数体(callee)的副本替换到调用位置(caller)上,同时重写代码以反映参数的绑定
- 优点:消除开销,将过程间分析转化为过程内分析,帮助其他优化,如逃逸分析
- 缺点:函数体变大,编译生成的Go镜像变大
- 函数内联在大多数是正向优化
4.2 Beast Mode
- Go函数内联收到的限制较多
- Beast Mode:调整函数内联策略,使更多函数被内联
- 开销:镜像增加,编译时间增加
4.2 逃逸分析
- 逃逸分析:分析代码中的指针的动态作用域,指针在何处可以被访问。