这是我参与「第五届青训营 」伴学笔记创作活动的第 5 天
Go性能优化与内存管理
性能优化
性能优化是什么&为什么?
-
性能优化是什么
提升软件系统的处理能力,减少不必要的消耗,发掘计算机的算力。
-
为什么要做性能优化
- 用户体验:提升用户体验,减少用户使用过程中的卡顿延时
- 资源利用:降低成本,提高资源利用效率
性能优化的层面
软件由上到下可以分为如下几个层次:
- 业务代码
- SDK
- 基础库
- 语言运行时
- 操作系统
一般的优化可以分为两类:
- 业务层优化:
- 针对特定场景,具体问题具体分析
- 容易获得较大的性能收益
- 语言运行时优化:
- 考虑更加通用的性能问题
- 考虑更多场景
- tradeoff
优化的进行一定要以数据驱动,而不要凭借想象进行:
- 使用性能分析工具例如pprof
- 首先优化最大瓶颈
性能优化与软件质量
-
软件质量至关重要
-
在保证接口稳定的前提下改进具体实现
- 因为可能有用户依赖与接口的行为,因此不要贸然改变接口的行为
-
测试用例
- 需要尽可能覆盖更多的场景,方便回归。测试代码的行数可能比实际代码的行数还要多。
-
文档
- 详细描述做了什么、没有做什么、可以达到怎样的效果
-
隔离
- 性能优化可以通过一个选项来控制是否开启
-
可观测
- 通过日志输出一些统计数据等等
内存管理
自动内存管理
自动内存管理的基本概念
-
动态内存:堆内存即使用malloc()分配的内存
-
自动内存管理(垃圾回收):由程序的运行时系统来管理动态内存
- 避免手动内存管理,专注于业务逻辑实现
- 保证内存使用的正确性:避免double-free、use-after-free等问题
-
自动内存管理的三个任务:
- 为新对象分配内存空间
- 找到存活对象
- 回收死亡对象的内存空间
-
相关概念:
Go的GC中有如下的注释
The GC runs concurrently with mutator threads
- Mutator :指的是业务线程,会分配对象,修改对象引用关系
- Collector :GC线程,会找到存活对象,并回收死亡对象的内存空间
- Serial GC :指的是只有一个Collector的情况
- Parallel GC :支持多个Collector并行回收的GC算法
- Concurrent GC :指的是业务线程Mutator和GC线程Collector可以同时执行
- Concurrent GC必须能感知对象指向关系的改变
-
GC算法的评判标准
- 安全性:不能回收仍存活的对象 基本要求
- 吞吐率: (程序执行时间 - GC时间) / (程序执行时间)
- 暂停时间: STW时间
- 内存开销:用于GC的元数据开销
[参考书: The Garbage Collection Handbook]
追踪垃圾回收
即Tracing garbage collection
一般可以分为三个步骤:
-
标记root对象:
静态变量、全局变量、线程栈上的对象等
-
标记:找到所有可达的对象
求指针指向关系的传递闭包
-
清理:清理所有不可达的对象
不同清理策略:
- Copying GC:将存活对象复制到另一块内存空间
- Mark-Sweep GC:将死亡对象的内存标记为可分配的
- Mark-Compact GC:移动并整理存活对象,与Copying GC类似,但是原地整理而不是额外开辟空间
分代GC算法:
基于分代假说(很多对象在分配出来后很快就不再使用了)
将对象分为年轻代(存活率低)和老年代(存活率高),对前者采用Copying Collection,后者采用mark-sweep
引用计数
Reference Counting
每个对象都有一个与之关联的引用计数,只有当引用计数大于0时,该对象才是存活的。
优势:
- 内存管理的操作被平摊到了程序执行过程中
- 内存管理不需要了解runtime的实现细节
缺点:
-
引用计数开销比较大(一般来说计数器是原子操作)
-
对于循环引用,必须引入weak reference来解决
-
每个对象都存在额外的内存开销
-
进行回收时仍然可能引发暂停
例如一个对象指向了很多其他的对象,那么在回收该对象时会消耗大量时间,可能引发执行的暂停