这是我参与「第三届青训营 -后端场」笔记创作活动的第2篇笔记

青训营

性能优化-提高软件系统处理能力，减少不必要的消耗。

为什么要做性能优化？

带来用户体验的提升
降低成本，提高效率

1自动内存管理

1.1自动内存管理

自动内存管理(垃圾回收)：由程序语言的运行时系统管理动态内存

三个任务

为新对象分配空间
找到存活对象
回收死亡对象的内存空间

1.2 追踪垃圾回收

对象被回收的条件：指针指向关系不可达的对象
标记根对象静态变量、全局变量、常量、线程栈等
标记：找到可达对象从根对象出发，找到所有可达对象
清理：所有不可达对象 Copying GC Mark-sweep GC Mark-compact GC

根据对象的生命周期，采取不同的策略

1.3 分代GC（Generational GC）

在这里插入图片描述针对老年代：如果发现有很多的碎片，也可以采用Mark-compact GC

1.4引用计数

每个对象都有一个与之关联的引用数目
对象存活的条件：当且仅当引用数大于0
优点内存管理的操作被平摊到程序执行过程中内存管理不需要了解runtime的实现细节：C++智能指针（smart pointer）
缺点维护引用计数的开销较大：需要原子操作（开销比较大）无法回收环形数据结构-weak reference 每个对象都需要引入额外内存空间存储引用计数回收内存时依然可能引发暂停

2.Go内存管理及优化

2.1 Go内存分配

2.1.1 分块

目标：为对象在heap上分配内存
提前将内存分块
对象分配：根据对象的大小，选择最合适的块返回

2.1.2 缓存

在这里插入图片描述

TCMalloc: thread caching
每个p包含一个mcache用于快速分配，用于为绑定于p上的g分配对象
mcache管理一组mspan
当mcache中的mspan分配完毕，向mcentral申请带有未分配块的mspan
当mspan中没有分配的对象，mspan会被缓存在mcentral中，而不是立刻释放并归还给OS

2.2 Go 内存管理优化

对象分配是非常高频的操作：每秒分配GB级别的内存
小对象占比较高
Go内存分配比较耗时分配路径长：g->m->p->mcache->mspan->memory block->return pointer pprof:对象分配的函数是最频繁调用的函数之一

2.3 我们的优化方法：Balanced GC

每个g都绑定一大块内存（1KB），称作goroutine allocation buffer(GAB)
GAB用于noscan类型的小对象分配：< 128B
使用三个指针维护GAB：base,end,top
Bump pointer（指针碰撞）风格对象分配无须和其他分配请求互斥分配动作简单高效
GAB对于Go内存管理来说是一个大对象
本质：将多个小对象的分配合并成一次大对象的分配
问题：GAB的对象分配方式会导致内存被延迟释放如下图所示，GAB中一个小对象的存活会导致整个GAB不能被释放。针对上面的问题采取的解决方案：
方案：移动GAB中存活的对象当GAB总大小超过一定阈值时，将GAB中存活的对象复制到另外分配的GAB中原先的GAB可以释放，避免内存泄漏本质：用copying GC的算法管理小对象

3.编译器和静态分析

3.1 编译器的结构

重要的系统软件
分析部分（前端front end）
综合部分（后端 back end）

3.2 静态分析

静态分析：不执行程序代码，推导程序的行为，分析程序的性质
控制流：程序执行的流程
数据流：数据在控制流上的传递

在这里插入图片描述控制流分析：数据流分析：

3.3 过程内分析和过程间分析

过程内分析仅在函数内部进行分析
过程间分析考虑函数调用时参数传递和返回值的数据流和控制流

一般来说，过程间分析需要同时分析控制流和数据流-联合求解，比较复杂。

4.Go编译器优化

为什么做编译器优化？

用户无感知，重新编译即可获得性能收益
通用性优化

4.1 函数内联（Inlining）

内联：将被调用函数的函数体的副本替换到调用位置上，同时重写代码以后反映参数的绑定。优点：

消除函数调用开销，例如传递参数，保存寄存器等
将过程间分析转换为过程内分析，帮助其他优化，例如逃逸分析。

缺点：

函数体变大，instruction cache 不友好
编译生成的Go镜像变大

内联策略：

根据调用函数和被调用函数的规模
。。。。

4.2 Beast Mode

Go函数内敛受到的限制较多语言特性，例如iterface,defer等，限制了函数内敛内敛策略非常保守
Beast mode:调整函数内敛的策略，使更多函数被内联降低函数调用的开销增加了其他优化的机会：逃逸分析
开销： Go镜像增加 ~10% 编译时间增加

4.3 逃逸分析

逃逸分析：分析代码中指针的动态作用域：指针在何处可以被访问

在这里插入图片描述

Beast mode : 函数内联拓展了函数边界，更多对象不逃逸
优化：未逃逸的对象可以在栈上分配 对象在栈上分配和回收很快：移动sp 减少在heap上的分配，降低GC负担

在这里插入图片描述

后端-高性能 Go 语言发行版优化与落地实践|青训营笔记

1自动内存管理

1.1自动内存管理

1.2 追踪垃圾回收

1.3 分代GC（Generational GC）

1.4引用计数

2.Go内存管理及优化

2.1 Go内存分配

2.1.1 分块

2.1.2 缓存

2.2 Go 内存管理优化

2.3 我们的优化方法：Balanced GC

3.编译器和静态分析

3.1 编译器的结构

3.2 静态分析

3.3 过程内分析和过程间分析

4.Go编译器优化

4.1 函数内联（Inlining）

4.2 Beast Mode

4.3 逃逸分析