性能优化及自动内存管理 | 青训营笔记

92 阅读4分钟

性能优化及自动内存管理

  • 分析工具——pprof:采样原理、如何定位性能问题等等
  • 业务优化
  • 基础库优化
  • Go语言优化

性能

性能优化是什么?

  • 提升软件系统处理能力,减少不必要的消耗,充分发掘计算机算力

为什么要做性能优化?

  • 用户体验:带来用户体验的提升——让刷抖音更丝滑,让双十一购物不再卡顿
  • 资源高效利用:降低成本,提高效率——很小的优化乘以海量机器会是显著的性能提升和成本节约

性能优化的层面

业务层优化

  • 针对特定场景,具体问题,具体分析。容易获得较大性能收益

语言运行时优化

  • 解决更通用的性能问题。考虑更多场景
  • Tradeoffs

数据驱动

  • 自动化性能分析工具——pprof
  • 依靠数据而非猜测
  • 首先优化最大瓶颈

性能优化与软件质量

  • 软件质量至关重要
  • 在保证接口稳定的前提下改进具体实现
  • 测试用例:覆盖尽可能多的场景,方便回归
  • 文档:做了什么,没做什么,能达到怎样的效果
  • 隔离:通过选项控制是否开启优化
  • 可观测:必要的日志输出

01概念

1.1自动内存管理

  • 动态内存

    • 程序在运行时根据需求动态分配的内存:malloc()
  • 自动内存管理(垃圾回收):由程序语言的运行时系统管理动态内存

    • 避免手动内存管理,专注于实现业务逻辑
    • 保证内存使用的正确性安全性: double-free problem, use-after-free problem

相关概念

  • Mutator:业务线程,分配新对象,修改对象指向关系

  • Collector: GC线程,找到存活对象,回收死亡对象的内存空间.

  • Serial GC:只有一个collector

  • Parallel GC:支持多个collectors同时回收的GC算法

  • Concurrent GC: mutator(s)和collector(s)可以同时执行

    • Collectors必须感知对象指向关系的改变!
  • 评价GC算法

    • 安全性(Safety):不能回收存活的对象基本要求
    • 吞吐率(Throughput):
    • 暂停时间(Pause time): stop the world (STW)业务是否感知
    • 内存开销(Space overhead) GC元数据开销
  • 追踪垃圾回收(Tracing garbage collection)

  • 引用计数(Reference counting)

1.3 分代 GC

  • 分代假说(Generational hypothesis: most objects die young
  • Intuition:很多对象在分配出来后很快就不再使用了
  • 每个对象都有年龄:经历过GC的次数
  • 目的:对年轻和老年的对象,制定不同的GC 策略,降低整体内存管理的开销
  • 不同年龄的对象处于heap的不同区域

总结

  • 自动内存管理的背景和意义概念和评价方法
  • 追踪垃圾回收
  • 引用计数
  • 分代 GC
  • 学术界和工业界在一直在致力于解决自动内存管理技术的不足之处. PLDI'22 Low-Latency, High-Throughput Garbage Collection

02 Go内存管理

  • 目标:为对象在heap上分配内存

  • 提前将内存分块

    • 调用系统调用mmap向OS申请一大块内存,例如4 MB。、
    • 先将内存划分成大块,例如8 KB,称作mspan
    • 再将大块继续划分成特定大小的小块,用于对象分配
    • noscan mspan:分配不包含指针的对象——GC不需要扫描
    • scan mspan:分配包含指针的对象——GC需要扫描
  • 对象分配:根据对象的大小,选择最合适的块返回

03 编译器与静态分析

  • 重要的系统软件

    • 识别符合语法和非法的程序。
    • 生成正确且高效的代码
  • 分析部分(前端front end)

    • 词法分析,生成词素(lexeme)
    • 语法分析,生成语法树
    • 语义分析,收集类型信息,进行语义检查
    • 中间代码生成,生成intermediate representation (IR)
  • 综合部分(后端back end)

    • 代码优化,机器无关优化,生成优化后的IR
    • 代码生成,生成目标代码

4.2逃逸分析

  • 逃逸分析:分析代码中指针的动态作用域:指针在何处可以被访问。

  • 大致思路

    • 从对象分配处出发,沿着控制流,观察对象的数据流·若发现指针p在当前作用域s:

      • 作为参数传递给其他函数。
      • 传递给全局变量
      • 传递给其他的goroutine
      • 传递给已逃逸的指针指向的对象
    • 则指针p指向的对象逃逸出s,反之则没有逃逸出s

  • Beast mode:函数内联拓展了函数边界,更多对象不逃逸

  • 优化:未逃逸的对象可以在栈上分配

    • 对象在栈上分配和回收很快:移动sp。
    • 减少在heap 上的分配,降低GC负担