性能分析工具及性能调优案例|青训营笔记

102 阅读3分钟

性能分析工具pprof-采样过程和原理及性能调优案例

这是我参与「第五届青训营 」伴学笔记创作活动的第 7 天

>CPU

  • 采样对象:函数调用和她们占用的时间
  • 采样率:100次/秒,固定值
  • 采样时间:从手动启动到手动结束

操作系统

每10ms向进程发送一次SIGPROF信号

进程

每次接收到SIGPROF会记录调用堆栈

写缓冲

每100ms读取已经记录的调用栈并写入输出流

>Heap-堆内存

  • 采样程序通过内存分配器在堆上分配和释放的内存,记录分配/释放的大小和数量
  • 采样率:每分配512kb记录一次,可在运行开头修改,1为每次分配均记录
  • 采样时间:从程序运行开始到采样时
  • 采样指标:alloc_space,alloc_objects,inuse_space,inuse_objects
  • 计算方式:inuse=alloc-free

>Goroutine-协程&ThreadCreate-线程创建

  • Goroutine

    • 记录所有用户发起且在运行中的goroutine,runtime.main的调用栈信息
  • ThreadCreate

    • 记录程序创建的所有系统线程的信息

>Block-阻塞 & Mutex-锁

  • 阻塞操作

    • 采样阻塞操作的次数和耗时
    • 采样率:阻塞耗时超过阈值的才会被记录,1为每次阻塞均记录
  • 锁竞争

    • 采样争抢锁的次数和耗时
    • 采样率:只记录固定比例的锁操作,1为每次加锁均记录

性能调优案例

1. 业务服务优化

  • 服务:能单独部署,承载一定功能的程序
  • 依赖:Service A 的功能实现依赖 Service B 的相应结果,称为Service A依赖 Service B
  • 调用链路:能支持一个接口请求的相关服务集合及其相互之间的依赖关系
  • 基础库:公共的工具包、中间件

流程

>建立服务性能评估手段

  • 服务器性能评估方式

    • 单独benchmark无法满足复杂逻辑分析
    • 不同负载情况下性能表现差异
  • 请求流浪构造

    • 不同请求参数覆盖逻辑不同
    • 线上真实流量情况
  • 压测范围

    • 单机器压测
    • 集群压测
  • 性能数据采集

    • 单机性能数据
    • 集群性能数据

>分析性能数据,定位性能瓶颈

  • 使用库不规范

>重点优化项改造

  • 正确性是基础

  • 相应数据diff

    • 线上请求数据录制回放
    • 新旧逻辑接口数据diff

>优化效果验证

  • 重复压测验证

  • 上线评估优化效果

    • 关注服务监控
    • 逐步放量
    • 收集性能数据

>进一步优化,服务整体链路分析

  • 规范上游服务调用接口,明确场景需求
  • 分析链路,通过业务流程优化提升服务性能

2. 基础库优化

>AB实验SDK的优化

  • 分析基础库核心逻辑和性能瓶颈

    • 设计完善改造方案
    • 数据按需获取
    • 数据序列化协议优化
  • 内部压测验证

  • 推广业务服务落地验证

3. Go语言优化

>编译器&运行时优化

  • 优化内存分配策略
  • 优化代码编译流程,生成更高效的程序
  • 内部压测验证
  • 推广业务服务落地验证

优点

  • 接入简单,只需要调整编译配置
  • 通用性强

总结

  • 性能调优原则

    • 要依靠数据不是猜测
  • 性能分析工具pprof

    • 熟练使用pprof工具排查性能问题并了解其基本原理
  • 性能调优

    • 保证正确性
    • 定位主要瓶颈