性能优化和自动内存管理 | 青训营

39 阅读4分钟

性能优化和自动内存管理

自动内存管理

  • 动态内存

    • 程序在运行时根据需求动态分配的内存:malloc()
  • 自动内存管理(垃圾回收):由程序语言的运行时系统管理动态内存

    • 避免手动内存管理,专注于实现业务逻辑
    • 保证内存使用的正确性和安全性:double-ffree problem,use-after-free problem
  • 三个任务

    • 为新对象分配空间
    • 找到存活的对象
    • 回收死亡对象的内存空间

相关概念

image-20230730174150314.png

  • Mutator: 业务线程,分配新对象,修改对象指向关系

  • Collector:GC线程,找到存活对象,回收死亡对象的内存空间

  • Serial GC:只有一个collector

image-20230730174047346.png

这种GC在需要GC的时候会暂停,然后使用一个GC线程(collector)去进行GC,GC完成之后再恢复。

  • Parallel GC:支持多个collectors同时回收的GC算法

image-20230730174223521.png

这种GC也会暂停,和Serial GC不同的是Parallel GC在暂停后会使用4个collector线程去进行GC。这样的话parallel的效率就会比Serial
  • Concurrent GC: mutator(s)和collector(s)可以同时执行

image-20230730174342659.png

这种GC算法是指mutator和collector可以同时执行的算法。这种GC算法不会暂停,在需要做GC的时候就开一个collector去做GC。

collectors必须感知对象指向关系的改变 (因为在进行垃圾回收,标记的时候用户的线程也在执行,这就可能导致新的指向对象产生)

评价GC算法

  • 安全性:不能回收存活的对象基本要求
  • 吞吐率:1 - GC时间/程序执行总时间 花在GC上的时间
  • 暂停时间:stop the world(STW) 业务是否感知
  • 内存开销:GC元数据开销

两种常见的GC技术

追踪垃圾回收

  • 对象被回收的条件:指针指向关系不可达的对象

  • 标记根对象

    • 静态变量、全局变量、常量、线程栈等(标记为存活对象)
  • 标记:找到可达对象

    • 求指针指向关系的传递闭包:从根对象出发,找到所有可达对象
  • 清理:所有不可达对象(3个方法)思想:根据对象的生命周期,使用不同的标记和清理策略

    • 将存活对象复制到另外的内存空间 Copying GC
    • 将死亡对象的内存标记为“可分配” Mark-sweep GC
    • 移动并整理存活对象 Mark-compact GC (把存活的对象拷贝到当前空间的最开始的部分)

根据对象的生命周期,使用不同的标记和清理策略

  1. 分代GC

    • 分代假说(Generational hypotheris):大多数的对象很快就死掉了;

    • 每个对象都有年龄:这个年龄就是经历过GC的次数

    • 根据年龄将内存划分为两个区域,一个是年轻代区域(young Generation),一个是老年代区域(old Generation)

      • 年轻代和老年代的对象其生命周期是不一样的,因此把它们划分开,然后执行不同的GC策略,以降低整体的内存管理的开销。
  • 年轻代:

    • 常规的对象分配

    • 由于存活对象很少,可以采用copying collection

image-20230730184934045.png

  • GC吞吐率高

  • 老年代

    • 对象趋于一直活着,反复复制的开销大

    • 可以采用mark-sweep collection

image-20230730184945686.png

引用计数

  • 每个对象都有一个与之关联的引用数目

  • 对象存活的条件:当且仅当引用数大于0

  • 优点

    • 内存管理的操作被平摊到程序执行过程中(执行过程中,当对象引用数量为0的时候自然就将对象回收了)
    • 内存管理不需要了解runtime的实现细节:C++智能指针(smart pointer)
  • 缺点:维护引用计数的开销较大:通过原子操作保证对引用计数操作的原子性可见性

  • 无法回收环形数据结构(a -> b -> c -> a,但是这个环已经是不可达了)-weak reference

  • 内存开销:每个对象都引入额外的内存空间存储引用数目

  • 回收内存时依然可能引发暂停 (回收大结构)