GDI对象泄漏导致程序UI界面绘制异常的问题排查

news2025/1/20 1:50:24

目录

1、问题说明

2、初步分析

3、查看任务管理器,并使用GDIView工具分析

5、采用历史版本比对法,确定初次出现问题的时间点,并查看前一天的代码修改记录

6、将修改的代码与测试现象结合起来,最终定位问题

7、事后的思考

8、最后


VC++常用功能开发汇总(专栏文章列表,欢迎订阅,持续更新...)icon-default.png?t=MBR7https://blog.csdn.net/chenlycly/article/details/124272585C++软件异常排查从入门到精通系列教程(专栏文章列表,欢迎订阅,持续更新...)icon-default.png?t=MBR7https://blog.csdn.net/chenlycly/article/details/125529931        最近在项目中遇到了一个GDI对象泄露问题,排查该问题也用了不少时间,其问题场景和排查方法很有代表性,今天将当时排查的过程做个详细的记录和总结,以供大家借鉴或参考。

1、问题说明

        某天早上来公司上班,有同事反馈我们开发的PC客户端软件的UI界面显示出问题了,窗口中部分区域与按钮等显示不全,应该是部分界面绘制失败了,但软件并没有崩溃。同事说前一天晚上他们为了测试移动APP,使用我们的PC端软件和移动app进行了联动,进行了一夜的拷机测试,早上来就发现PC客户端出了上述问题。他们没有关闭软件,保留着现象及现场,喊我们过去看看是怎么回事。

2、初步分析

         于是我去查看现象,根据以往经验,感觉很有可能是GDI句柄泄漏引起界面绘制异常,当程序的GDI对象接近1万个时,界面就会出现绘制失败,显示不全的问题。

在Windows系统中,每个进程的GDI对象总数是有上限的,上限就是10000个,当接近或达到这个上限时,界面就会绘制失败,甚至程序会出现闪退崩溃。

        类似的问题,前几天有同事反馈过,但其没保留现象,直接将程序重启了,所以当时没有进行分析,这次这个同事反馈的这个问题,从现象上看和之前同事反馈的问题是类似,正好借此机会详细排查一下。

3、查看任务管理器,并使用GDIView工具分析

        为了验证GDI对象泄露的猜想,先是打开系统的任务管理器去查看软件进程的GDI对象总数。打开任务管理器,点击详细信息标签页,找到目标软件进程,看到进程的GDI总数确实有异常,已经达到了9999个,差1个就到1万的上限了,如下所示:

        正常情况下,进程在某个时刻使用的GDI对象总数也就几百个左右,最多也就1000多个,此处居然达到了9999个,肯定是有GDI对象泄露了。使用完的GDI对象,没有调用DeleteObject等接口将之释放掉,这样会导致程序中占用的GDI对象越来越多,如果有GDI对象泄露的代码在频繁的执行,那么泄露会很明显,到任务管理器中可以看到目标进程的GDI对象总数在持续不断的上升,可能很快就要达到10000个上限了。

        默认情况下,任务管理器的进程列表中不会显示进程的GDI总数,需要右键点击列表头,在弹出的右键菜单中点击“选择列”:

然后在弹出的窗口中找到GDI对象选项:

 勾选上即可看到进程的GDI对象总数。

正常情况下,进程的GDI对象最多只会有上千个,如果有好几千,一般可能是有GDI对象泄漏。

4、GDIView可能对Win10兼容性不好,显示的GDI对象个数不太准确

        仅仅通过任务管理器中的GDI对象总数判断出有GDI对象是不够的,因为GDI对象有多种,比如常见的GDI对象有Pen(用来划线的画笔)、Brush(用来填充区域颜色的画刷)、Bitmap(用来绘制图片的位图)、Font(用来控制文字显示大小及字形的字体)、Region(区域)、DC(用来绘制窗口的设备上下文)等,如下:

        为了有针对性的排查,我们还需要知道具体是哪种类型的GDI对象有泄露,这就需要使用GDI对象查看工具GDIView。于是在同事的电脑上到GDIView官网上下载了GDIView工具,因为当前Windows系统是64位的,所以要下载64位的GDIView,64位系统上不能运行32位的GDIView,直接运行会报错(按讲64位系统是支持32位程序的,可能是GDIview工具自己的限制),如下:

        启动64位GDIView工具后,看到All GDI数目为9999:

查看其他具体类型的项,只有Bitmap位图对象数目比较多,但只有1000多个(1436个),其他类型的GDI对象都比较少,那这个9999总数主要是由哪个对象泄露引发的呢?从最后的分析结果看,是Bitmap对象泄露引起的,那Bitmap对象数应该有好几千个,为啥GDIView中只显示1000多个?应该是GDIView工具对Win10系统兼容性不好,显示的各个GDI对象的数目有问题,之前我们在Win7和XP系统上用GDIView工具排查过GDI泄露问题,GDIView中显示的各个类型的GDI对象都是比较准的。

5、采用历史版本比对法,确定初次出现问题的时间点,并查看前一天的代码修改记录

        GDIView中看不到具体是哪个类型的GDI泄露,这样我们就没法进行有针对性的排查。好在我们有个脚本控制的自动化代码编译系统,只要有修改代码,每天都会自动编译版本,生成程序的安装包,如下所示:

于是我们只能使用历史版本比对法,取几个时间点的版本(安装包),多次安装并执行程序,然后再采取二分法取版本,看看是从哪天开始有这个问题的,然后我们查看前一天提交的代码,可能就能找到排查问题的线索了。

历史版本比对法,比较适用相对独立的客户端程序,虽然是个比较笨重、原始的办法,但很多时候都比较有用,我们在项目中已多次使用。

        最终通过对比发现,从2022年12月15日开始编译的版本都有内存泄露的问题,12月14日的版本是没问题的。于是在SVN上查看前一天(12月14日)的代码提交记录,看看可能是修改哪一处的代码引发的。但12月14日当天修改的代码是处理业务服务器重连问题,修改了相关的逻辑,但这些修改的代码都和GDI绘制没关系,为啥会触发GDI对象泄露呢?很是奇怪!到此,排查问题的线索似乎又断了。

6、将修改的代码与测试现象结合起来,最终定位问题

        12月14日之前业务服务器的重连功能都是有问题的,12月14日修改代码后,重连功能就没问题了。这时,测试同事又提供了一个关键的线索,用当前最新的版本的客户端软件,登录公网上的通用平台是没有GDI对象泄露的,但登录公司内部的内网测试平台就有GDI对象泄露。这两个平台有啥差别,导致同一个版本的客户端软件登录后有不同的表现呢?

        于是结合修改的代码,12月14日修改的代码是关于某类业务服务器断链后的重连代码,12月14日之前的重连代码都是有问题的。难道是两个平台上某个业务服务器的连通状态是不一样的?于是用客户端分别登录这两个平台,查看日志,看看两个平台的所有业务服务器的连接状态。果然是有差异的,公网平台上的所有业务服务器都是能正常连接的,但内网测试平台上某个业务服务器一直是连不上的,一直在不断重连(业务服务器连不上时会自动去重连)。

        于是查看触发重连时的整个流程的所有代码,然后果然找到了问题,重连的流程中会去调用一个接口去自动生成一张图片,调用CreateCompatibleBitmap API函数去创建一个Bitmap位图对象,但这个Bitmap位图对象在使用完后,没有调用DeleteObject将Bitmap对象释放掉,所以导致了GDI对象泄露。问题代码片如下:

HDC hdc = ::GetDC( NULL );
HDC memDC = ::CreateCompatibleDC( hdc );

HBITMAP hBitmap, hOldBitmap; 
// 调用CreateCompatibleBitmap创建一个与设备描述表兼容的位图(问题就出在这个)
hBitmap = ::CreateCompatibleBitmap( hdc, nWidth, nHeight ); 
hOldBitmap = (HBITMAP)SelectObject( memDC, hBitmap ); 

::SetBkColor( memDC, WHITE_BRUSH ); // 区域刷白

// 设置字体
// 字体创建
LOGFONT lf;
u32 dwXDpi = GetDeviceCaps( hdc, LOGPIXELSX ); // 得到当前显示设备的水平单位英寸像素数;
if ( dwXDpi != 0)
{
    nPointSize = static_cast<u32>( nPointSize * 96.0 / dwXDpi );
}
memset( &lf, 0, sizeof(LOGFONT) );
lf.lfHeight = -MulDiv ( nPointSize, GetDeviceCaps ( hdc, LOGPIXELSY ), 72 );
lf.lfWidth = lf.lfHeight/2;
lf.lfOutPrecision = OUT_STRING_PRECIS;
lf.lfQuality = CLEARTYPE_QUALITY;
lf.lfWeight = FW_NORMAL;
_tcscpy( lf.lfFaceName, _T("微软雅黑") );
HFONT hFont = ::CreateFontIndirect( &lf );

::SetBkMode(memDC, TRANSPARENT);
::SetTextColor( memDC, RGB( 213, 242, 253 ) );
HFONT hOldFont = (HFONT)::SelectObject( memDC, hFont );

RECT rcDest;
rcDest.left = 0;
rcDest.top = 0;
rcDest.right = nWidth;
rcDest.bottom = nHeight;

if ( emLogoPos == emTopLeft_Api || emLogoPos == emBottomLeft_Api )
{
    ::DrawText( memDC, strName, strName.GetLength(), &rcDest, DT_LEFT | DT_SINGLELINE );
}
else
{
    ::DrawText( memDC, strName, strName.GetLength(), &rcDest, DT_RIGHT | DT_SINGLELINE );
}

//::BitBlt( hdc, 0,0,nWidth,nHeight, memDC,0,0, SRCCOPY );

CUIString strFile = GetSelfFilePath()+ LOGO_BMP_FILE;
SaveBitmapToBmpFile( hBitmap, strFile, LOGO_DPI_32 );

::SelectObject( memDC, hOldFont );
::SelectObject( memDC, hOldBitmap );

if ( hFont != NULL )
{
    ::DeleteObject( hFont );
}

if ( NULL != memDC )
{
    ::DeleteDC( memDC );
}
::ReleaseDC( NULL, hdc );

代码结尾处释放了Font字体对象和DC对象,但忘记释放Bitmap对象。在代码片的结尾处应该调用DeleteObject将之前创建的Bitmap对象释放掉,即:

if ( hBitmap != NULL )
{
    ::DeleteObject( hBitmap );
}

修改后的代码块如下:


        因为测试平台上某个业务服务器始终有问题,客户端连接不上,一直在不断的重连,所以这段包含GDI对象泄露的代码在持续不断的执行,这样在长时间的拷机运行之后,导致程序的GDI对象总数达到了9999个。至此终于找到产生GDI对象泄露的源头,修改代码后编译版本再安装运行,就不再有内存泄露了。

        这个地方也说明一个问题,GDIView在Win10系统中运行,显示的各类型的GDI对象的数目是不准确的。本问题中,是Bitmap对象有泄露,Bitmap对象应该有好几千个才对,结果GDIView中显示的Bitmap对象只有1000多个,这个显示不准确的问题下次要注意了。其实,一开始看到Bitmap对象有1000多个,就应该觉察到Bitmap对象有问题了,一般情况下不可能有这么多的!

      此外,之前也写过一篇使用GDIView排查GDI对象泄漏的案例,感兴趣的话可以查看对应的文章:

使用GDIView工具排查GDI对象泄漏问题icon-default.png?t=MBR7https://blog.csdn.net/chenlycly/article/details/125399896

7、事后的思考

        这段生成图片的代码是十多年前写的,出自于一个刚毕业的应届生之手,应该是因为经验不足,写出的代码不规范,在使用完创建的GDI对象之后应及时地将对象释放掉。我们平时一再地强调,写代码一定要规范,要尽量考虑的全面一些,否则可能会埋下一些或大或小的隐患。

        此外,这段GDI对象泄露的代码掩藏的比较深,在业务服务器都能正常连接的平台上(比如给客户使用的商用平台)不会触发GDI泄露。公司内部的测试平台正好这段时间业务服务器有问题,触发了客户端软件的重连流程,才将这个内存泄露的问题暴露出来。

在公司内部测试基本没问题的软件,拿到客户的机器上,拿到各式各样的运行环境中,可能会出现这样那样的问题,比如复杂组网环境中的网络连通问题、软件运行异常等。公司内部的测试及运行环境毕竟是有限的,很多潜在的问题可能很难暴露出来。

8、最后

       该问题实例中的问题可能并不是很难,但整个问题的排查方法和思路,以及不同场景下的不同表现现象的启示,都很有参考价值。所以本文详细记录了整个问题的排查过程,以供大家借鉴或参考。


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/152198.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Simulating Content Consistent Vehicle Datasets with Attribute Descent(略读)

提出了一个大型的3D合成数据集VehicleX。其中各个3D模型都有现实世界的车型对应。整个数据集有1362个id&#xff0c;其中包括11种主流车型。 论文&#xff1a;https://arxiv.org/pdf/1912.08855.pdf 摘要 本文使用图形引擎来模拟带有免费注释的大量训练数据。 在合成数据和真…

回归预测 | MATLAB实现RF随机森林多输入单输出回归预测(含回归树,误差柱状图,多指标)

回归预测 | MATLAB实现RF随机森林多输入单输出回归预测(含回归树,误差柱状图,多指标) 目录 回归预测 | MATLAB实现RF随机森林多输入单输出回归预测(含回归树,误差柱状图,多指标)效果分析基本介绍输出结果程序设计学习总结参考资料效果分析

Mars3D Studio平台发布

近日我们基于提供丰富及智能化功能&#xff0c;助力团队做出精美的交互场景的理念&#xff0c;研发了Mars3D Studio平台&#xff0c;于2023年1月10日正式发布上线&#xff01;欢迎大家访问http://studio.mars3d.cn/ 网站进行体验。一、资源广场团队公开的丰富资源数据&#xff…

LeetCode题目笔记——1658. 将 x 减到 0 的最小操作数

文章目录题目描述题目难度——中等方法一&#xff1a;反向思考&#xff0c;双指针求最长子数组代码/Python代码/C方法二&#xff1a;滑动窗口代码总结我把这篇也归到面试题那一栏&#xff0c;因为觉得这题的思路和思考方式还挺好的&#xff0c;或许能用到其他题上 题目描述 给…

基于Node.js Vue清新严选助农电商平台/电商平台/购物平台

摘 要网络技术的快速发展给各行各业带来了很大的突破&#xff0c;也给各行各业提供了一种新的管理模块&#xff0c;对于清新严选助农电商将是又一个传统管理到智能化信息管理的改革&#xff0c;设计清新严选助农电商平台的目的就是借助计算机让复杂的购买商品操作变简单&#x…

gcc和gdb的使用——Linux

Linux学习全部合集点击即可订阅 “人生得意须尽欢” 这里是目录标题gcc的基本操作gcc处理代码的步骤预处理编译汇编链接头文件和库静态库动态库gdb调试makefile什么是makefile&#xff1f;进度条的实现缓冲区回车和换行git的使用.gitigonregcc的基本操作 编写代码的最基本操作…

【工具Share】用VBA获取批量文件中的同一个单元格内容

最近鼓捣了个工具&#xff0c;可以批量从固定文件夹的excel中获取同一个单元格中的具体内容&#xff08;当然&#xff0c;你也可以根据自己的需要&#xff0c;进行多个单元格内容的取得&#xff09; 可能这么说比较抽象&#xff0c;举例来说比如你在多个相同模板的excel中定义了…

java循环结构的概述

在之前的文章中&#xff0c;已经给大家详细地介绍过变量相关的内容&#xff0c;比如变量的概念、命名规范、变量的定义及底层原理等内容。但其实变量还有作用范围的概念&#xff0c;并且根据作用范围的不同&#xff0c;变量还可以分为成员变量、局部变量等内容。在我们今天开始…

Nacos config 配置中心详解

Nacos 提供用于存储配置和其他元数据的 key/value 存储&#xff0c;为分布式系统中的外部化配置提供服务器端和客户端支持。使用 Spring Cloud Alibaba Nacos Config&#xff0c;您可以在 Nacos Server 集中管理你 Spring Cloud 应用的外部属性配置。Spring Cloud Alibaba Naco…

【算法基础(1)】认识时间复杂度和常用排序算法

1 认识时间复杂度 1.1 什么是时间复杂度&#xff1f; 时间复杂度是一个函数&#xff0c;它定性描述该算法的运行时间&#xff0c;在软件开发中&#xff0c;时间复杂度就是用来方便开发者估算出程序运行时间&#xff0c;通常用算法的操作单元数量来代表程序消耗的时间&#xf…

pageoffice在线编辑word文件并禁止选中

一、整篇文档禁止选中 wordDoc.setDisableWindowSelection(true); //禁止word的选择文字功能 二、根据条件判断是否禁止选中 比如&#xff1a;选中内容超过一定字数&#xff0c;取消选中 解决方案&#xff1a;使用后端提供的OnWordSelectionChange事件。 PageOfficeCtrl po…

sgRNAs基因编辑

CRISPR-Cas9知识学习笔记 https://www.163.com/dy/article/FGCP58KC0532AN5N.html https://crispr.dbcls.jp CRISPR&#xff08;clustered regularly interspaced short palindromic repeats&#xff0c;成簇的规律间隔短回文重复序列&#xff09;和CRISPR-associated protein …

Spring Cloud Gateway服务网关的部署与使用(结合nacos)

一、微服务网关1.什么是微服务网关在传统的单体架构中&#xff0c;我们只需要开放一个服务给客户端调用即可。但是微服务架构中是将一个系统拆分成多个微服务&#xff0c;不同的微服务一般会有不同的网络地址&#xff0c;客户端在访问这些微服务时必须记住几十甚至百个地址&…

springboot多项目结构

微服务的目录结构一般分为如下几个模块&#xff1a; 当我们做的项目稍微大一点之后&#xff0c;就会经常遇到需要把不同的模块分离出来的时候&#xff0c;比如微信的朋友圈、微信支付、聊天服务等模块&#xff0c;像这种微服务项目一般都会把base、common、前端抽离出来。 com…

DP8403国产3W双通道无滤波器D类立体声音频放大器兼容替代CS8403

目标DP8403简介功能框图&#xff1a;DP8403主要特性DP8403简介 DP8403是3W双通道无滤波器D类立体声音频功率放大器芯片&#xff0c;能够以D类放大器的效率提供AB类功率放大器的性能。采用D类结构&#xff0c;DP8403 能够在 4Ω负载和 5V 电源条件下&#xff0c;提供高达 3W 输…

MySQL (五)------数据库三范式、外键约束、多表间关系、多表关联查询、子查询

数据库三范式 好的数据库设计对数据的存储性能和后期的程序开发&#xff0c;都会产生重要的影响。建立科学的&#xff0c;规范的数据库就需要满足一些规则来优化数据的设计和存储&#xff0c;这些规则就称为范式。 1.1 第一范式: 确保每列保持原子性 第一范式是最基本的范式…

深入理解java反射原理

系列文章目录 文章目录系列文章目录前言一、 如何获取反射中的Class对象&#xff1f;二、反射的步骤三、详细解答1. 获取对象类的实例2、newInstance() 的实现方式3、获取Method对象4. 调用invoke()方法。总结前言 反射是在运行状态中&#xff0c;对于任意一个类&#xff0c;都…

C 程序设计教程(10)—— 数据输入函数(scanf)用法详解

C 程序设计教程&#xff08;10&#xff09;—— 数据输入函数&#xff08;scanf&#xff09;用法详解 该专栏主要介绍 C 语言的基本语法&#xff0c;作为《程序设计语言》课程的课件与参考资料&#xff0c;用于《程序设计语言》课程的教学&#xff0c;供入门级用户阅读。 目录…

Ubuntu安装PyTango步骤

继续上一篇&#xff1a; https://blog.csdn.net/woshigaowei5146/article/details/128443892?spm1001.2014.3001.5502 环境 虚拟机&#xff1a;VMware Ubuntun&#xff1a;20.04LTS Tango&#xff1a;9.3.5 安装 PyTango作为官方debian/ubuntu包在linux上可用: for Python…

195:vue+openlayers 加载json格式热力图,调节半径大小和模糊程度

第195个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+openlayers中加载JSON格式的数据,呈现热力图。这里可以调节热力图的半径大小和模糊程度。 直接复制下面的 vue+openlayers源代码,操作2分钟即可运行实现效果 文章目录 示例效果配置方式示例代码(共100行)headDa…