性能优化和自动内存管理
自动内存管理
-
动态内存
- 程序在运行时根据需求动态分配的内存:malloc()
-
自动内存管理(垃圾回收):由程序语言的运行时系统管理动态内存
- 避免手动内存管理,专注于实现业务逻辑
- 保证内存使用的正确性和安全性:double-ffree problem,use-after-free problem
-
三个任务
- 为新对象分配空间
- 找到存活的对象
- 回收死亡对象的内存空间
相关概念
-
Mutator: 业务线程,分配新对象,修改对象指向关系
-
Collector:GC线程,找到存活对象,回收死亡对象的内存空间
-
Serial GC:只有一个collector
这种GC在需要GC的时候会暂停,然后使用一个GC线程(collector)去进行GC,GC完成之后再恢复。
-
Parallel GC:支持多个collectors同时回收的GC算法
这种GC也会暂停,和Serial GC不同的是Parallel GC在暂停后会使用4个collector线程去进行GC。这样的话parallel的效率就会比Serial高
-
Concurrent GC: mutator(s)和collector(s)可以同时执行
这种GC算法是指mutator和collector可以同时执行的算法。这种GC算法不会暂停,在需要做GC的时候就开一个collector去做GC。
collectors必须感知对象指向关系的改变 (因为在进行垃圾回收,标记的时候用户的线程也在执行,这就可能导致新的指向对象产生)
评价GC算法
- 安全性:不能回收存活的对象基本要求
- 吞吐率:1 - GC时间/程序执行总时间 花在GC上的时间
- 暂停时间:stop the world(STW) 业务是否感知
- 内存开销:GC元数据开销
两种常见的GC技术
追踪垃圾回收
-
对象被回收的条件:指针指向关系不可达的对象
-
标记根对象
- 静态变量、全局变量、常量、线程栈等(标记为存活对象)
-
标记:找到可达对象
- 求指针指向关系的传递闭包:从根对象出发,找到所有可达对象
-
清理:所有不可达对象(3个方法)思想:根据对象的生命周期,使用不同的标记和清理策略
- 将存活对象复制到另外的内存空间 Copying GC
- 将死亡对象的内存标记为“可分配” Mark-sweep GC
- 移动并整理存活对象 Mark-compact GC (把存活的对象拷贝到当前空间的最开始的部分)
根据对象的生命周期,使用不同的标记和清理策略
-
分代GC
-
分代假说(Generational hypotheris):大多数的对象很快就死掉了;
-
每个对象都有年龄:这个年龄就是经历过GC的次数
-
根据年龄将内存划分为两个区域,一个是年轻代区域(young Generation),一个是老年代区域(old Generation)
- 年轻代和老年代的对象其生命周期是不一样的,因此把它们划分开,然后执行不同的GC策略,以降低整体的内存管理的开销。
-
-
年轻代:
-
常规的对象分配
-
由于存活对象很少,可以采用copying collection
-
-
GC吞吐率高
-
老年代
-
对象趋于一直活着,反复复制的开销大
-
可以采用mark-sweep collection
-
引用计数
-
每个对象都有一个与之关联的引用数目
-
对象存活的条件:当且仅当引用数大于0
-
优点
- 内存管理的操作被平摊到程序执行过程中(执行过程中,当对象引用数量为0的时候自然就将对象回收了)
- 内存管理不需要了解runtime的实现细节:C++智能指针(smart pointer)
-
缺点:维护引用计数的开销较大:通过原子操作保证对引用计数操作的原子性和可见性
-
无法回收环形数据结构(a -> b -> c -> a,但是这个环已经是不可达了)-weak reference
-
内存开销:每个对象都引入额外的内存空间存储引用数目
-
回收内存时依然可能引发暂停 (回收大结构)