1. Linux性能分析
1.1 perf + 火焰图
从2.6.31内核开始,Linux内核自带了一个性能分析工具perf,能够进行函数级与指令级的热点查找。通过它,应用程序可以利用 PMU,tracepoint 和内核中的特殊计数器来进行性能统计。它不但可以分析指定应用程序的性能问题 (per thread),也可以用来分析内核的性能问题,当然也可以同时分析应用代码和内核,从而全面理解应用程序中的性能瓶颈。
1.2 测试代码
#include <unistd.h>
int main(int argc, char **argv)
{
while(true)
{
usleep(100);
}
return 0;
}
1.3 测试脚本
# 安装perf
yum install perf
# 生成采样数据perf.data
perf record -e cpu-clock -g -p 28026
# 用perf script工具对perf.data进行解析
perf script -i perf.data &> perf.unfold
# 下载FlameGraph项目
git clone https://github.com/brendangregg/FlameGraph.git
# 将perf.unfold中的符号进行折叠
./stackcollapse-perf.pl perf.unfold &> perf.folded
# 最后生成svg图
./flamegraph.pl perf.folded > perf.svg
1.4 效果图
y轴表示调用栈,每一层都是一个函数。调用栈越深,火焰就越高,顶部就是正在执行的函数,下方都是它的父函数。
x 轴表示抽样数,如果一个函数在 x 轴占据的宽度越宽,就表示它被抽到的次数多,即执行的时间长。注意,x 轴不代表时间,而是所有的调用栈合并后,按字母顺序排列的。
火焰图就是看顶层的哪个函数占据的宽度最大。只要有"平顶"(plateaus),就表示该函数可能存在性能问题。
2. Windows性能分析
2.1 vs性能探查器
对于windows客户端开发而言,vs2015及之后的版本有比较完善的性能分析工具,相信大家都用过,可以处理掉大部分的性能异常问题。
但如何对软件整体的性能评估,正在运行的软件的异常性能分析等,vs性能分析工具并不是那么好用。
2.2 WPT
那如何分析软件的整体性能,分析正在运行软件的性能情况呢?WPT(Windows Performance Toolkit)是微软提供的一套用于分析程序性能的工具包,它其中包含两个主要的工具:
- WPR(Windows Performance Recorder)是一个事件记录工具,使用它可以监测系统状态(CPU、磁盘I/O、堆分配、栈调用…),并生成一个.etl(Event trace log)日志文件
- WPA(Windows Performance Analyzer)是一个日志分析工具,使用它可以对WPR生成的.etl日志文件加以分析得出方便人阅读的数据图表。
2.2.1 WPT的安装
-
下载Windows10 sdk(developer.microsoft.com/en-us/windo…)
-
双击安装adksetup进行安装:
-
WPT默认目录为C:\Program Files (x86)\Windows Kits\10\Windows Performance Toolkit\可以在这个目录下找到WPR和WPA
2.2.2 WPT使用
- 测试代码
#include <windows.h>
int main()
{
while (true)
{
Sleep(1);
}
return 0;
}
- 测试过程
-
编译生产testPerformance.exe,双击运行testPerformance.exe
-
运行WPRUI.exe,开始记录(测试取样一分钟)
-
保存
-
打开wpa.exe进行分析(File --> Open 选择刚才保存的文件);选择CPU、然后选择对应的进程进行分析,如下图:
-
菜单(Trace --> Configure Symbol Paths)添加符号文件路径
-
菜单(Trace --> Load Symbols)
展开调用堆栈,最后可以定位到是main函数占用cpu 0.09
2.2.3 总结
通过WPT可以分析PC软件/服务的详细性能情况,结合符号文件可以定位到代码,这样可以了解一款软件的性能情况,并做实际的性能优化。