[ 性能优化与GC | 青训营笔记]

47 阅读4分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 5 天

Go性能优化与内存管理

性能优化

性能优化是什么&为什么?

  • 性能优化是什么

    提升软件系统的处理能力,减少不必要的消耗,发掘计算机的算力。

  • 为什么要做性能优化

    • 用户体验:提升用户体验,减少用户使用过程中的卡顿延时
    • 资源利用:降低成本,提高资源利用效率

性能优化的层面

软件由上到下可以分为如下几个层次

  • 业务代码
  • SDK
  • 基础库
  • 语言运行时
  • 操作系统

一般的优化可以分为两类

  • 业务层优化:
    • 针对特定场景,具体问题具体分析
    • 容易获得较大的性能收益
  • 语言运行时优化:
    • 考虑更加通用的性能问题
    • 考虑更多场景
    • tradeoff

优化的进行一定要以数据驱动,而不要凭借想象进行:

  • 使用性能分析工具例如pprof
  • 首先优化最大瓶颈

性能优化与软件质量

  • 软件质量至关重要

  • 在保证接口稳定的前提下改进具体实现

    • 因为可能有用户依赖与接口的行为,因此不要贸然改变接口的行为
  • 测试用例

    • 需要尽可能覆盖更多的场景,方便回归。测试代码的行数可能比实际代码的行数还要多。
  • 文档

    • 详细描述做了什么、没有做什么、可以达到怎样的效果
  • 隔离

    • 性能优化可以通过一个选项来控制是否开启
  • 可观测

    • 通过日志输出一些统计数据等等

内存管理

自动内存管理

自动内存管理的基本概念

  • 动态内存:堆内存即使用malloc()分配的内存

  • 自动内存管理(垃圾回收):由程序的运行时系统来管理动态内存

    • 避免手动内存管理,专注于业务逻辑实现
    • 保证内存使用的正确性:避免double-free、use-after-free等问题
  • 自动内存管理的三个任务

    • 为新对象分配内存空间
    • 找到存活对象
    • 回收死亡对象的内存空间
  • 相关概念:

    Go的GC中有如下的注释

    The GC runs concurrently with mutator threads

    • Mutator :指的是业务线程,会分配对象,修改对象引用关系
    • Collector :GC线程,会找到存活对象,并回收死亡对象的内存空间
    • Serial GC :指的是只有一个Collector的情况
    • Parallel GC :支持多个Collector并行回收的GC算法
    • Concurrent GC :指的是业务线程Mutator和GC线程Collector可以同时执行
      • Concurrent GC必须能感知对象指向关系的改变
  • GC算法的评判标准

    • 安全性:不能回收仍存活的对象 基本要求
    • 吞吐率: (程序执行时间 - GC时间) / (程序执行时间)
    • 暂停时间: STW时间
    • 内存开销:用于GC的元数据开销

[参考书: The Garbage Collection Handbook]

追踪垃圾回收

即Tracing garbage collection

一般可以分为三个步骤:

  1. 标记root对象:

    静态变量、全局变量、线程栈上的对象等

  2. 标记:找到所有可达的对象

    求指针指向关系的传递闭包

  3. 清理:清理所有不可达的对象

    不同清理策略:

    1. Copying GC:将存活对象复制到另一块内存空间
    2. Mark-Sweep GC:将死亡对象的内存标记为可分配的
    3. Mark-Compact GC:移动并整理存活对象,与Copying GC类似,但是原地整理而不是额外开辟空间

分代GC算法:

​ 基于分代假说(很多对象在分配出来后很快就不再使用了)

​ 将对象分为年轻代(存活率低)和老年代(存活率高),对前者采用Copying Collection,后者采用mark-sweep

引用计数

Reference Counting

每个对象都有一个与之关联的引用计数,只有当引用计数大于0时,该对象才是存活的。

优势:

  • 内存管理的操作被平摊到了程序执行过程中
  • 内存管理不需要了解runtime的实现细节

缺点:

  • 引用计数开销比较大(一般来说计数器是原子操作)

  • 对于循环引用,必须引入weak reference来解决

  • 每个对象都存在额外的内存开销

  • 进行回收时仍然可能引发暂停

    例如一个对象指向了很多其他的对象,那么在回收该对象时会消耗大量时间,可能引发执行的暂停