性能分析工具及性能调优案例|青训营笔记

2023-02-11 114 阅读3分钟

性能分析工具pprof-采样过程和原理及性能调优案例

这是我参与「第五届青训营」伴学笔记创作活动的第 7 天

>CPU

采样对象：函数调用和她们占用的时间
采样率：100次/秒，固定值
采样时间：从手动启动到手动结束

操作系统

每10ms向进程发送一次SIGPROF信号

进程

每次接收到SIGPROF会记录调用堆栈

写缓冲

每100ms读取已经记录的调用栈并写入输出流

>Heap-堆内存

采样程序通过内存分配器在堆上分配和释放的内存，记录分配/释放的大小和数量
采样率：每分配512kb记录一次，可在运行开头修改，1为每次分配均记录
采样时间：从程序运行开始到采样时
采样指标：alloc_space，alloc_objects，inuse_space，inuse_objects
计算方式：inuse=alloc-free

>Goroutine-协程&ThreadCreate-线程创建

Goroutine
- 记录所有用户发起且在运行中的goroutine，runtime.main的调用栈信息
ThreadCreate
- 记录程序创建的所有系统线程的信息

>Block-阻塞 & Mutex-锁

阻塞操作
- 采样阻塞操作的次数和耗时
- 采样率：阻塞耗时超过阈值的才会被记录，1为每次阻塞均记录
锁竞争
- 采样争抢锁的次数和耗时
- 采样率：只记录固定比例的锁操作，1为每次加锁均记录

性能调优案例

1. 业务服务优化

服务：能单独部署，承载一定功能的程序
依赖：Service A 的功能实现依赖 Service B 的相应结果，称为Service A依赖 Service B
调用链路：能支持一个接口请求的相关服务集合及其相互之间的依赖关系
基础库：公共的工具包、中间件

流程

>建立服务性能评估手段

服务器性能评估方式
- 单独benchmark无法满足复杂逻辑分析
- 不同负载情况下性能表现差异
请求流浪构造
- 不同请求参数覆盖逻辑不同
- 线上真实流量情况
压测范围
- 单机器压测
- 集群压测
性能数据采集
- 单机性能数据
- 集群性能数据

>分析性能数据，定位性能瓶颈

使用库不规范

>重点优化项改造

正确性是基础
相应数据diff
- 线上请求数据录制回放
- 新旧逻辑接口数据diff

>优化效果验证

重复压测验证
上线评估优化效果
- 关注服务监控
- 逐步放量
- 收集性能数据

>进一步优化，服务整体链路分析

规范上游服务调用接口，明确场景需求
分析链路，通过业务流程优化提升服务性能

2. 基础库优化

>AB实验SDK的优化

分析基础库核心逻辑和性能瓶颈
- 设计完善改造方案
- 数据按需获取
- 数据序列化协议优化
内部压测验证
推广业务服务落地验证

3. Go语言优化

>编译器&运行时优化

优化内存分配策略
优化代码编译流程，生成更高效的程序
内部压测验证
推广业务服务落地验证

优点

接入简单，只需要调整编译配置
通用性强

总结

性能调优原则
- 要依靠数据不是猜测
性能分析工具pprof
- 熟练使用pprof工具排查性能问题并了解其基本原理
性能调优
- 保证正确性
- 定位主要瓶颈