实践前提:正确安装 perf 和 FlameGrap。若没安装,心领神会亦可。
1 示例程序
#define m_loop() ({ for(int i=0; i < 1000000; ++i); })
void fb(void) {
m_loop();
}
void fj(void) {
fb();
}
void fy(void) {
m_loop();
}
void loop(void) {
for (;;) {
fy();
fj();
m_loop();
}
}
int main(void)
{
loop();
return 0;
}
编译如下。
$ gcc sp.c -o sp
从以上程序的简单性可以估计出
- loop 函数将几乎占满进程运行时间
- fy() fj() m_loop() 分别约占loop() 三分之一比例时间
2 性能监控
# 运行 sp
$ ./sp
# 另开终端运行perf
$ ps -ef |grep "./sp" # pid: 5523
# 监控 10s
$ perf record -ag -F -p 5523 -- sleep 10
$ 查看结果(摘取部分)
$ perf report -n --stdio
100.00% 33.37% 329 sp sp [.] loop
|
|--66.63%--loop
| |
| |--34.79%--fj
| | fb
| |
| --31.85%--fy
|
--33.37%--putenv
main
loop
即 loop cpu 占比自耗 33.37%;其他消耗占66.63%——fj() 通过调用 fb() 占34.79%,fy() 占比31.85%,与第一小节根据源码所估计的差不多。
3 用火焰图
如果函数调用栈很深、调用关系比较复杂,与火焰图方式相比,通过字符界面观察cpu占比会比较麻烦。
# 将 perf 监控数据输出到 FlameGraph
$ perf script > FlameGraph/perf.script
$ cd FlameGraph
$ ./stackcollapse-perf.pl perf.script > perf.stack
$ ./flamegraph.pl perf.stack > perf.svg
浏览器打开perf.svg如下。
通过查看火焰图顶部,loop() 自身消耗一部分cpu,fy() 消耗一部分 cpu,fj() 通过调用 fb() 消耗一部分cpu。在浏览器打开svg图片界面上,将鼠标放在相应函数处,可以显示相应cpu占比,也支持一些缩放等鼠标事件。