性能分析工具pprof-采样过程和原理及性能调优案例
这是我参与「第五届青训营 」伴学笔记创作活动的第 7 天
>CPU
- 采样对象:函数调用和她们占用的时间
- 采样率:100次/秒,固定值
- 采样时间:从手动启动到手动结束
操作系统
每10ms向进程发送一次SIGPROF信号
进程
每次接收到SIGPROF会记录调用堆栈
写缓冲
每100ms读取已经记录的调用栈并写入输出流
>Heap-堆内存
- 采样程序通过内存分配器在堆上分配和释放的内存,记录分配/释放的大小和数量
- 采样率:每分配512kb记录一次,可在运行开头修改,1为每次分配均记录
- 采样时间:从程序运行开始到采样时
- 采样指标:alloc_space,alloc_objects,inuse_space,inuse_objects
- 计算方式:inuse=alloc-free
>Goroutine-协程&ThreadCreate-线程创建
-
Goroutine
- 记录所有用户发起且在运行中的goroutine,runtime.main的调用栈信息
-
ThreadCreate
- 记录程序创建的所有系统线程的信息
>Block-阻塞 & Mutex-锁
-
阻塞操作
- 采样阻塞操作的次数和耗时
- 采样率:阻塞耗时超过阈值的才会被记录,1为每次阻塞均记录
-
锁竞争
- 采样争抢锁的次数和耗时
- 采样率:只记录固定比例的锁操作,1为每次加锁均记录
性能调优案例
1. 业务服务优化
- 服务:能单独部署,承载一定功能的程序
- 依赖:Service A 的功能实现依赖 Service B 的相应结果,称为Service A依赖 Service B
- 调用链路:能支持一个接口请求的相关服务集合及其相互之间的依赖关系
- 基础库:公共的工具包、中间件
流程
>建立服务性能评估手段
-
服务器性能评估方式
- 单独benchmark无法满足复杂逻辑分析
- 不同负载情况下性能表现差异
-
请求流浪构造
- 不同请求参数覆盖逻辑不同
- 线上真实流量情况
-
压测范围
- 单机器压测
- 集群压测
-
性能数据采集
- 单机性能数据
- 集群性能数据
>分析性能数据,定位性能瓶颈
- 使用库不规范
>重点优化项改造
-
正确性是基础
-
相应数据diff
- 线上请求数据录制回放
- 新旧逻辑接口数据diff
>优化效果验证
-
重复压测验证
-
上线评估优化效果
- 关注服务监控
- 逐步放量
- 收集性能数据
>进一步优化,服务整体链路分析
- 规范上游服务调用接口,明确场景需求
- 分析链路,通过业务流程优化提升服务性能
2. 基础库优化
>AB实验SDK的优化
-
分析基础库核心逻辑和性能瓶颈
- 设计完善改造方案
- 数据按需获取
- 数据序列化协议优化
-
内部压测验证
-
推广业务服务落地验证
3. Go语言优化
>编译器&运行时优化
- 优化内存分配策略
- 优化代码编译流程,生成更高效的程序
- 内部压测验证
- 推广业务服务落地验证
优点
- 接入简单,只需要调整编译配置
- 通用性强
总结
-
性能调优原则
- 要依靠数据不是猜测
-
性能分析工具pprof
- 熟练使用pprof工具排查性能问题并了解其基本原理
-
性能调优
- 保证正确性
- 定位主要瓶颈