基础知识
问题
什么是句柄?
句柄(file descriptor)即文件描述符,简称fd。Linux 系统中,把一切设备都视作文件,当进程打开现有文件或创建新文件时,内核向进程返回一个文件描述符。
FD作为文件句柄的实例,可以用来表示一个打开的文件,一个打开的网络流(socket),管道或者资源(如内存块),输入输出(in/out/error)。
句柄的类型
FD类型 | 说明 |
---|---|
socket | 与网络请求相关 |
anon_inode:[eventpoll] | HandlerThread 线程 Looper相关 |
anon_inode:[eventfd] | HandlerThread 线程 Looper相关 |
anon_inode:[timerfd] | 系统文件描述符类型,和应用关系不大 |
anon_inode:[dmabuf] | InputChannel泄露时增加明显 |
/vendor/ | 一般是系统操作使用 |
/dev/ashmem | 数据库操作相关 |
pipe: | 一般是系统操作使用 |
/sys/ | 一般是系统操作使用 |
/data/data/ | 打开文件相关 |
/data/app/ | 打开文件相关 |
/storage/emulate/0/ | 打开文件相关 |
查看进程句柄数量
adb shell
su
ps |grep 应用包名 |grep -v channel |grep -v Daemon
ls -l /proc/$pid/fd |grep "" -c
查看进程所有句柄信息
adb shell
su
ps |grep 应用包名 |grep -v channel |grep -v Daemon
lsof -p pid
分析过程
句柄是进程级的,一般每个进程限制 1024 ,而每次打开文件只会增加1~2个句柄,因此出现句柄泄漏,一般都是进行了大量的重复性操作。所以分析句柄泄露,首先要做的是找复现路径。
一、找复现路径
和测试沟通,出现句柄泄漏时正在跑拍照测试,了解了拍照测试的流程,分以下几步:
-
进入相机
-
点击拍照
-
点击保存
-
退出相机
按照这个步骤,手动操作几次,查看进程句柄数量,发现出现句柄数量增加
更小粒度的复现步骤
找到了初步复现步骤之后,接下来是找更小粒度的复现步骤,上述步骤的1、2、3均有可能导致句柄泄露
做了几个测试:
-
1—>4
-
1—>2—>4
结果发现进入退出相机,就会发生泄漏
二、确定句柄泄漏类型
确认复现路径之后,接下里就要确认是哪种类型的句柄发生了泄漏
可以通过 lsof -p pid 打印当前进程的所有句柄
确认方式
对照组:首次进入退出相机,打印当前进程的所有句柄
对比组1:重复进入退出相机,打印当前进程的所有句柄
对比组2:在对比组1的基础上,再重复进入退出相机,打印当前进程的所有句柄
然后把所有句柄数据对比发现:
增加的部分是 eventfd,而这个类型就是:HandlerThread 线程 Looper相关
三、找到问题代码,解决问题
在业务代码里面查所有涉及到 HandlerThread 的地方,定位到是小视频模块使用到 HandlerThread 没释放导致。
参考文档:
一文帮你搞懂 Android 文件描述符 - 掘金
Android FD 文件描述符 泄露总结 - 掘金
理解Linux的文件描述符FD与Inode - 知乎