内存优化及编译器 | 青训营笔记

209 阅读4分钟
  • 业务层优化

    • 针对特定场景,具体问题
    • 容易获得较大的性能收益
  • 运行时优化

    • 解决更通用的性能问题
    • 考虑更多场景
    • Tradeoffs
  • 数据驱动

    • 自动化性能分析工具 pprof
    • 依靠数据
    • 首先优化最大瓶颈

自动内存管理

  • 动态内存

    • 程序在运行时根据需求分配的内存:malloc()
  • 自动内存管理(垃圾回收):由程序语言的运行时系统管理动态内存

    • 避免手动内存管理
    • 保证内存使用的正确性和安全性
  • 三个任务

    • 为新内存分配空间
    • 找到存活对象
    • 回收死亡对象内存空间

追踪垃圾回收

  • 对象被回收的条件:指针指向关系不可达的对象

  • 标记根对象

    • 静态变量,全局变量,常量,线程栈等(因为这些对象存储的变量还会用到,它们必然存活)
  • 标记:找到可达对象

    • 求指针指向关系等传递闭包:从根对象出发,找到所有可达对象
  • 清理:所有不可达对象

    • 将存活对象复制到另外的内存空间(Copying GC)
    • 将死亡对象的内存标记为“可分配”(Mark-sweep GC)
    • 移动并整理存活对象(Mark-compact GC)

分代GC

  • 分代假说:most objects die young

  • Intuition:很多对象在分配出来后很快就不再使用

  • 每个对象都有年龄:经历过GC的次数

  • 目的:针对年轻和年老的对象,使用不同的GC策略,降低整体内存管理开销

  • 不同年龄的对象处于heap不同区域

  • 年轻代(Young generation)

    • 常规的对象分配
    • 由于存活对象少,可以采用Copying collection
    • GC吞吐率很高
  • 老年代(Old generation)

    • 对象趋于一致活着,反复复制开销大
    • 可以采用Mark-sweep collection

引用计数

  • 每个对象都有一个与之关联的引用数目

  • 对象存活条件:当且仅当引用数大于0

  • 优点

    • 内存管理操作被平摊刀程序执行中
    • 内存管理不需要了解runtime的实现细节:C++智能指针
  • 缺点:

    • 维护开销大,需要使用原子操作
    • 无法回收环形数据结构
    • 内存开销:引入数目的额外存储空间
    • 回收内存时依然可能引发暂停

Go内存管理及优化

内存分配

  • 为对象在heap上分配内存

  • 提前将内存分块

    • 调用系统调用mmap()向OS申请一块内存,如4M
    • 先将内存划分为大块,例如8KB,称作mspan
    • 再将大块内存继续划分为特定大小的小块,用作对象分配
    • noscan mspan: 分配不包含指针的对象 -----------GC不需要扫描
    • scan msapn:分配包含指针的对象 ---------------- GC需要扫描
  • 对象分配:根据对象的大小,选择最合适的块返回

编译器和静态分析

  • 重要的系统软件

    • 识别符合语法和非法的程序
    • 生成正确且高效的代码
  • 分析部分(前端front end)

    • 词法分析,生成词素(lexeme)
    • 语法分析,生成语法树
    • 语义分析,收集类型信息,进行语义检查
    • 中间代码生成,生成intermediate representation (IR)
  • 综合部分(后端 back end)

    • 代码优化,机器无关优化,生成优化后的IR
    • 代码生成,生成目标代码

image-20230129101951928

静态分析

  • 不执行程序代码,推导程序行为,分析程序的性质
  • 控制流:程序执行的流程
  • 数据流:数据在控制流上的传递

Go编译器优化

函数内联

将被调用函数的函数体的副本直接替换到调用位置上,同时重写代码以反映参数的绑定

优点:

消除了调用开销,将过程间分析转化为过程内分析

缺点:

函数题变大,编译生成的Go镜像变大

Beast Mode

逃逸分析

分析代码中指针的动态作用域:指针在何处可以被访问