strace 是什么
strace 是一个可用于诊断和调试的 Linux 用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。
strace 作为一种动态跟踪工具,能够帮助我们高效地定位进程和服务故障。它像是一个侦探,打开应用进程的这个黑盒子,通过系统调用的蛛丝马迹,告诉你进程大概在干嘛,进而找到异常的真相。
strace 怎么用
运行模式
strace 有两种运行模式。
一种是通过它启动要跟踪的进程。用法很简单,在原本的命令前加上 strace 即可。
比如我们要跟踪 “/usr/local/bin/a.out” 这个命令的执行,可以这样:
strace /usr/local/bin/a.out
另外一种运行模式,是跟踪已经在运行的进程,在不中断进程执行的情况下,理解它在干嘛。
这种情况,给 strace 传递个 -p pid 选项即可。
比如,a.out 进程的 pid 是 345,可以这样:
strace -p 345
完成跟踪时,按 Ctrl + C 结束 strace 即可。
常用选项
从一个示例命令来看:
strace -tt -T -v -f -e trace=file -o /tmp/strace.log -s 1024 -p 345
- -tt:在每行输出的前面,显示毫秒级别的时间
- -T:显示每次系统调用所花费的时间
- -v:对于某些相关调用,把完整的环境变量,文件 stat 结构等打出来
- -f:跟踪目标进程,以及目标进程创建的所有子进程
- -e:控制要跟踪的事件和跟踪行为,比如指定要跟踪的系统调用名称
- -o:把 strace 的输出单独写到指定的文件
- -s:当系统调用的某个参数是字符串时,最多输出指定长度的内容,默认是 32 个字节
- -p:指定要跟踪的进程 pid,要同时跟踪多个 pid,重复多次 -p 选项即可
- -c:统计系统调用的次数和其所花的时间
这里特别说下 strace 的 -e trace 选项。
要跟踪某个具体的系统调用,如 -e trace=open 即可。
但有时候我们要跟踪一类系统调用,比如所有和文件名有关的调用、所有和内存分配有关的调用。
如果人工输入每一个具体的系统调用名称,可能容易遗漏。
于是 strace 提供了几类常用的系统调用组合名字。
- -e trace=file 跟踪和文件访问相关的调用(参数中有文件名)
- -e trace=process 和进程管理相关的调用,比如 fork/exec/exit_group
- -e trace=network 和网络通信相关的调用,比如 socket/sendto/connect
- -e trace=signal 信号发送和处理相关,比如 kill/sigaction
- -e trace=desc 和文件描述符相关,比如 write/read/select/epoll
- -e trace=ipc 进程间通信相关,比如 shmget
strace 问题定位案例
定位进程异常退出
/usr/local/samba/bin/nmbd 启动失败,nmbd 是一个域名服务的进程。
这个服务进程是开源代码编译出来的,也就是说,并不是我们自己开发的代码,因此该服务进程的启动流程我们并不熟悉。像这样的情况,可以用 strace 来跟踪看看,到底是哪里出现了异常。
strace -tt -T /usr/local/samba/bin/nmbd
咦?看到 nmbd 进程 exited with 0 正常退出了,考虑到这个进程是个守护进程,主进程确实会 exit 的。
再看到有个 clone 的系统调用,想到 fork 这个系统调用最终调用的是 clone,就知道 nmbd 进程创建了一个子进程,然后父进程就退出了。所以要加一个参数 -f 来跟踪子进程
strace -tt -T -f /usr/local/samba/bin/nmbd
看到确实子进程是异常退出了,exited with 1,所以 nmbd 进程启动失败。
对比了一下之前版本 OK 的启动 log。
发现 /usr/local/samba/var/nmbd 这个目录有异常
OK 时是一个普通的目录
NG 时是一个软链接
最终查看了相关代码,改成目录,nmbd 进程就可以正常启动了
性能分析
假如有个需求,统计某个目录 cpp 文件的代码行数。这里提供两个 Shell 脚本实现:
poor_script.sh
#!/bin/bash
total_line=0
while read filename; do
line=$(wc -l $filename | awk '{print $1}')
(( total_line += line ))
done < <(find . -type f -iname '*.cpp')
echo "total line: $total_line"
good_script.sh
#!/bin/bash
find . -type f -iname '*.cpp' -print0 | wc -l --files0-from=- | tail -n 1
两段代码实现的目的是一样的。我们通过 strace 的 -c 选项来分别统计两种版本的系统调用情况和其所花的时间(使用 -f 同时统计子进程的情况)
strace -c -f ./poor_script.sh
strace -c -f ./good_script.sh
从两个输出可以看出,good_script.sh 很快就可以得到结果:95985 行。它大部分的调用(calls)开销是文件操作(read/open/write/close)等,统计代码行数本来就是干这些事情。
而 poor_script.sh 完成同样的任务则花了更久的时间。它大部分的调用开销都在进程和内存管理上(wait4/mmap/getpid…)。
实际上,从两个图中 clone 系统调用的次数,我们可以看出 good_script.sh 只需要启动 3 个进程,而 poor_script.sh 完成整个任务居然启动了 392 个进程,而进程创建和销毁的代价是相当高的,性能不差才怪。如果目录下的 cpp 文件再多一些,那要花费的时间将会更久!
总结
当发现进程或服务异常时,我们可以通过 strace 来跟踪其系统调用,“看看它在干啥”,进而找到异常的原因。熟悉常用系统调用,能够更好地理解和使用 strace。
当然,strace 也不是万能的,当目标进程卡死在用户态时,strace 就没有输出了。
这个时候我们需要其他的跟踪手段,比如 gdb 等。