这是我参与「第三届青训营 -后端场」笔记创作活动的的第3篇笔记
1.自动内存管理
- 正确性
- 安全性
常见问题:
double-free problem ,user-after-free problem
三个任务:
- 为新对象分配空间
- 找到存活对象
- 回收死亡对象的内存空间
1.1相关概念
- Mutator:业务线程,分配新对象,修改对象指向关系
- Collector:GC线程,找到存活对象,回收死亡对象的内存空间
- Serial GC:只有一个collector
- Parallel GC:支持多个collectors同时回收的GC算法
- Concurrent GC:mutator(s)和 collector(s)可以同时执行 (Collectors必须感知对象指向关系的改变!)
评价GC算法:
1.2追踪垃圾回收
- 对象被回收的条件:指针指向关系不可达的对象
- 标记根对象
- 静态变量、全局变量、常量、线程栈等
- 标记:找到可达对象
- 求指针指向关系的传递闭包:从根对象出发,找到所有可达对象
- 清理:所有不可达对象
- 将存活对象复制到另外的内存空间(Copying GC)
- 将死亡对象的内存标记为 "可分配"(Mark-sweep GC)
- 移动并整理存活对象(Mark-compact GC)
根据对象的生命周期,使用不同的标记和清理策略
1) CopyingGC
Copying GC:将对象复制到另外的内存空间
2) Mark-sweepGC
Mark-sweep GC: 使用 free list 管理空闲内存
3) Mark-compactGC
原地整理对象
1.3 分代GC
-
年轻代(Younggeneration)
-
常规的对象分配
-
由于存活对象很少,可以采用copying collection
-
GC吞吐率很高
-
-
老年代(Oldgeneration)
-
对象趋向于一直活着,反复复制开销较大
-
可以采用mark-sweep collection
-
1.4 引用计数
- 每个对象都有一个与之关联的引用数目
- 对象存活的条件:当且仅当引用数大于0
优点:
- 内存管理的操作被平摊到程序执行过程中
- 内存管理不需要了解runtime的实现细节,例如:C++智能指针(smartpointer)
缺点:
- 维护引用计数的开销较大:通过原子操作保证对引用计数操作的原子性和可见性
- 无法回收环形数据结构——解决方法:weak reference等
- 内存开销:每个对象都引入的额外内存空间存储引用数目
- 回收内存时依然可能引发暂停
2.Go内存管理及优化
2.1缓存
- TCMalloc:thread caching
- 每个p包含一个mcache用于快速分配,用于为绑定于p上的g分配对象
- mcache管理一组mspan
- 当mcache中的mspan分配完毕,向mcentral申请带有未分配块的mspan
- 当mspan中没有分配的对象,mspan会被缓存在mcentral中,而不是立刻释放并归还给OS
2.2现存问题
- 对象分配是非常高频的操作:每秒分配GB级别的内存
- 小对象占比较高
- Go内存分配比较耗时
- 分配路径长:g->m->p->mcache->mspan->memory block->return pointer
- pprof:对象分配的函数是最频繁调用的函数之一
2.3BalancedGC
- 每个g都绑定一大块内存(1 KB),称作 goroutine allocation buffer (GAB)
- GAB 用于noscan类型的小对象分配: <128B
- 使用三个指针维护GAB:base, end, top
- Bump pointer (指针碰撞)风格对象分配
- 无须和其他分配请求互斥
- 分配动作简单高效
if top+size<=top{
addr:=top
top+=size
return addr
}
技术实现:
- GAB对于Go内存管理来说是一个对象
- 本质:将多个小对象的分配合并成一次达对象的分配
- 问题:GAB的对象分配方式会导致内存被延迟释放
-
方案:移动GAB中存活的对象
-
当GAB总大小超过一定阈值时,将GAB中存活的对象复制到另外分配的GAB中
-
原先的GAB可以释放,避免内存泄漏
-
本质:用copying GC的算法管理小对象
-