这是我参与[第三届青训营-后端场]笔记创作活动的第1篇笔记

自动内存管理技术

回收对象：不可达的对象。回收开始时会扫描gc roots，例如全局变量，栈的对象，静态变量，常量等。从gc roots出发，沿着指针追踪扫描所有可达对象。扫描结束后回收不可达对象。

对象整理是为了避免内存碎片问题，go的内存分配采用tcmalloc，可以有效的减少内存碎片。
go的编译器会通过逃逸分析把不会逃逸的大部分新生变量分配到栈上，这些变量会被栈直接回收，不需要通过GC回收，而长期生存的变量一般都分配到堆上。而分代假设主要是将GC目标放在新生变量上，这对go来说性能提升不是很大。

继承了插入写屏障的优点，

Sweep Termination: 对未清扫的span进行清扫, 只有上一轮的GC的清扫工作完成才可以开始新一轮的GC（新GC会协助清理上一个GC的sweep）
Mark: （allcoBits,gcmarkBits）

Mark Prepare：初始化GC任务，包括开启写屏障(write barrier)和辅助GC(mutator assist)，统计root对象的任务数量等，这个过程需要STW。
GC Drains: 扫描所有root对象，包括全局指针和goroutine(G)栈上的指针（扫描对应G栈时需停止该G)，将其加入标记队列(灰色队列)，并循环处理灰色队列的对象，直到灰色队列为空。该过程后台并行执行。

目前整个GC流程会进行两次STW(Stop The World), 第一次是Mark阶段的开始, 第二次是Mark Termination阶段.

需要注意的是, 不是所有根对象的扫描都需要STW, 例如扫描栈上的对象只需要停止拥有该栈的G.从go 1.9开始, 写屏障的实现使用了Hybrid Write Barrier, 大幅减少了第二次STW的时间。

采用的是类似TCMalloc的分配算法。

Page：和tcmalloc的page一样为8KB。
Span：代码中为mspan，由一个或多个page组成，内存管理的基本单位。
mcache：类似tcmalloc的线程缓存，但是go中是一个P对应一个mcache。mcache保存了各种大小不同的span，并按span class划分，小对象<=32KB直接在mcache分配，起到了缓存作用，并且是无锁分配。
mcentral：与tcmalloc的CentralCache一样，是全局缓存，需要加锁访问。同样是按span class分类，多个span串成链表。一个mcentral对应一个span class，有两个链表，分别是nonempty和empty。nonempty链表中的span都至少有一个空闲的对象空间。而empty链表中的span没有空闲的对象空间，已经被mcache取走但还未归还的span。
mheap：和tcmalloc的pageheap类似，堆内存的抽象，把从os申请的page组成span并保存起来。mheap把span组织成二叉排序树而不是链表，分为free（空闲并非垃圾回收过的）和scav（被垃圾回收过的），并用heapArena进行管理。

编译优化