使用perf + 火焰图分析程序性能

2,022 阅读1分钟

1、perf命令简要介绍

性能调优时,我们通常需要分析查找到程序占用CPU百分比高的热点代码片段,这便需要使用 perf record 记录单个函数级别的统计信息,并使用 perf report 来显示统计结果;

perf record

perf report

举例:

    sudo perf record -e cpu-clock -g -p 13373
  • -g 选项是告诉perf record额外记录函数的调用关系

  • -e cpu-clock 指perf record监控的指标为cpu周期

  • -p 指定需要record的进程pid

程序运行完之后,perf record会生成一个名为perf.data的文件,如果之前已有,那么之前的perf.data文件会被覆盖

获得这个perf.data文件之后,就需要perf report工具进行查看

perf report -i perf.data
  • -i 指定要查看的文件

然而,这种格式很不直观,我们需要使用FlameGraph工具再将perf的输出转换成SVG图形,这样结果会展示的更加直观。

2、使用火焰图展示结果

1、Flame Graph项目位于GitHub上:github.com/brendangreg…

2、可以用git将其clone下来:git clone github.com/brendangreg…

我们以perf为例,看一下flamegraph的使用方法:

  1. 第一步,使用perf record采样数据
    sudo perf record -e cpu-clock -g -p 28591

Ctrl+c结束执行后,在当前目录下会生成采样数据perf.data.

  1. 第二步,用perf script工具对perf.data进行解析
    perf script -i perf.data &> perf.unfold
  1. 第三步,将perf.unfold中的符号进行折叠:
    ./stackcollapse-perf.pl perf.unfold &> perf.folded
  1. 最后一步,最后生成svg图:
    ./flamegraph.pl perf.folded > perf.svg