Cocos Creator3.8 项目实战(八)2D UI DrawCall优化详解(上)

news2024/11/14 3:58:57

游戏开发的朋友都知道,在游戏开发过程中,DrawCall 是我们优化性能的一个非常重要的指标,直接影响游戏的整体性能表现,DrawCall数量越多,帧率会降低,能明显感觉到卡顿。


那今天我们就来聊一聊,2D UI DrawCall优化方法。

本文的主要内容: 什么是Draw call ? Draw Call 中造成性能问题的原因是什么?以及在 Cocos Creator 项目中如何减少DrawCall?


一、Draw Call 介绍


1、什么是Draw Call?

通常我们把 CPU提交数据给GPU,向GPU下渲染命令的过程,称为DrawCall,也叫同一批次渲染。一次 Draw call 就代表一次图形绘制命令。


例如:

CPU调用DirectX中的DrawIndexedPrimitive命令,进行渲染的操作。

CPU调用OpenGL中的glDrawElement命令,进行渲染的操作。


2、Draw Call 中造成性能问题的原因?


CPU和GPU能并行工作,有一个命令缓冲区(Command Buffer),命令缓冲区包含了一个命令队列,当CPU需要渲染对象时,它可以向命令缓冲区添加命令,而GPU完成了上次的渲染任务后,可以继续从命令队列里取出一个命令并执行。


从以上流程,可以看出,性能问题的原因有两个方面:

  • CPU 方面

    CPU在每次调用Draw Call 之前, 需要向GPU 发送很多内容,包括数据、状态和命令等。

    在这一阶段, CPU 需要完成很多准备工作,例如检查渲染状态等,一旦CPU 完成了这些工作, GPU 就可以开始本次的渲染。

    如果Draw Call 的数量太多, CPU 就会把大量时间花费在提交Draw Call 上,造成CPU的性能瓶颈。


  • GPU 方面

    由于CPU的频繁调用绘图指令,那么GPU 也会进行频繁的渲染状态切换。渲染状态就包括:纹理状态,Blend 模式,Stencil 状态,Depth Test 状态等等,也会带来GPU的性能消耗。


那么综合以上的原因,一个很显然的优化想法:就是通过批次合并(后面简称合批)来降低 Draw call 的调用次数。


合批的本质:在一帧的渲染过程中,保证连续节点的渲染状态一致,将尽可能多的节点数据合并一次性提交,从而减少绘图指令的调用次数,降低图形 API 调用带来的性能消耗,同时也可以避免 GPU 进行频繁的渲染状态切换。


需要注意

由于我们需要在CPU 的内存中合并Draw Call,而合并的过程也需要消耗时间。

因此,合并技术更加适合于静态的物体,对于静态物体只需要合并一次即可。

当然,也可以对动态物体进行合并,但由于这些物体是不断运动的,每一帧都需要进行合并然后再发送给GPU,这对空间和时间都会造成一定的影响。


二、合批的条件


1、节点的 Layer 相同才能合批,不同的 Layer 之间不能合批

在游戏运行时,Cocos 引擎是按照节点树的渲染方式,即按层级顺序,从上往下由浅到深进行渲染。

理论上每渲染一张图像(文本最终也是图像)都需要一次 DrawCall。


例如:

下图(1),猜一下DrawCall 次数是多少?

在这里插入图片描述


DrawCall 次数结果是: 5

为什么是5呢? 因为4个item 子对象,每一次都是一次drawcall, 再加上本身引擎有一次drawcall 。

在这里插入图片描述


下图(2),调整了一下排列顺序,猜一下DrawCall 次数是多少?

在这里插入图片描述


仅仅调整了一下顺序,将相同Layer的放在一起,drawcall 次数变成了4 。


在这里插入图片描述


因此,根据上面介绍的游戏渲染按顺序可知,合批的条件之一是:节点的 Layer 相同,不同的 Layer 之间不能进行合批。


2、部分组件无法合批,且会打断其他组件合批


需要进行分模块管理节点树布局,以达到更好的合批效果,无法合批的组件:

  • 内置组件 Mask、Graphics 和 UIMeshRenderer 组件由于材质不同和数据组织方式的差异,无法与其他组件合批。
  • TiledMap、Spine 和 DragonBones 这三个中间件组件遵循自己的内部合批机制。

了解了DrawCall的原理和合批的条件后,接下来就是今日的重点,2D UI DrawCall 优化方法有哪些?


三、2D UI DrawCall 优化方法有哪些?


1、Label 组件DrawCall 优化


(1)、 将要使用的文字制作成图片,然后使用自动图集或 TexturePacker 对文字图片合并到图集

比如游戏中常用的 26个英文字母 、 数字 0-9 , 建议美术可以根据不同颜色、不同大小、不同风格分别制作一张文字图片。


(2)、Cache Mode 缓存类型的合理选择

官方 Cache Mode 说明:

类型功能说明
NONE默认值,Label 中的整段文本将生成一张位图。
BITMAP选择后,Label 中的整段文本仍将生成一张位图,但是会尽量参与动态合图。只要满足动态合图的要求,就会和动态合图中的其它 Sprite 或者 Label 合并 Draw Call。由于动态合图会占用更多内存,该模式只能用于文本不常更新的 Label。此模式在节点安排合理的情况下可大幅降低 Draw Call,请酌情选择使用。
CHAR原理类似 BMFont,Label 将以“字”为单位将文本缓存到全局共享的位图中,相同字体样式和字号的每个字符将在全局共享一份缓存。能支持文本的频繁修改,对性能和内存最友好。不过目前该模式还存在如下限制,我们将在后续的版本中进行优化: 1. 该模式只能用于字体样式和字号(通过记录字体的 fontSize、fontFamily、color、outline 为关键信息,以此进行字符的重复使用,其他有使用特殊自定义文本格式的需要注意)固定,并且不会频繁出现巨量未使用过的字符的 Label。这是为了节约缓存,因为全局共享的位图尺寸为 2048 * 2048,只有场景切换时才会清除,一旦位图被占满后新出现的字符将无法渲染。 2. Overflow 不支持 SHRINK。 3. 不能参与动态合图(同样启用 CHAR 模式的多个 Label 在渲染顺序不被打断的情况下仍然能合并 Draw Call) 4. 目前暂不支持 IsBoldIsItalicIsUnderline 属性。

对上表的实践说明:

  • NONE 一个贴图单独创建一个文本贴图,不能重用,单个贴图占用一个drawcall,不参与动态合批。即使两个相同文本的label也不能合批渲染。

    最佳实践:适用于用完即删且可能会频繁更新大批量文本的需求,如: 聊天功能。


  • BITMAP:动态合图只能往图集上加贴图,而不能继续重用上次的,更不会删除已经作废的子贴图,改变一次就多生成一张文字贴图添加到大小为 2048*2048的通用动态图集中。如果频繁使用动态的文字,则会占用大量内存。

    最佳实践:适用内容不会改变的静态文本,如:界面标题


  • CHAR: 每个字符绘制一次,并添加到大小为2048*2048 的字符图集中,场景不切换时,纹理不会重建,因为纹理大小是有限的,
    导致能显示的字符数也有限。

    最佳实践:适用频繁更新且文本字符内容有限的文本如:分数、倒计时


2、Sprite 组件 Drawcall 优化


对于 Sprite 组件,有静态合图和动态合图两种合批方案。


(1)、静态合图

静态合图就是在开发时将一系列碎图整合成一张大图

图集对于 DrawCall 优化来说非常重要,但是并不是说,把所有图片不管三七二十一,全部打成图集就万事大吉了,这里面也有门道,胡乱打图集的话说不定还会变成负优化。


这个门道就是:尽量将处于同一界面(UI)下的相邻且渲染状态相同的碎图,打包成图集,才能达到减少 DrawCall 的目的。


整合成大图有两种方式:

  • 使用手动图集资源

  • 使用自动图集资源


以上两种整合大图的方式,在往期文章 CocosCreator3.8研究笔记(十)CocosCreator 图像资源的理解,有详细介绍,这里就不再细说。


(2)、动态合图

Cocos Creator 提供了 动态合图(Dynamic Atlas)的功能,能在项目运行时动态地将贴图合并到一张大贴图中。

当渲染一张贴图的时候,动态合图系统会自动检测这张贴图是否已经被合并到了图集(图片集合)中,如果没有,并且此贴图又符合动态合图的条件,就会将此贴图合并到图集中。


动态合图是按照 渲染顺序 来选取要将哪些贴图合并到一张大图中的,这样就能确保相邻的 DrawCall 能合并为一个 DrawCall

动态合图遵循上述第二点的合批的条件


启用、禁用动态合图

Cocos Creator 在初始化过程中,会根据不同的平台设置不同的CLEANUP_IMAGE_CACHE参数,当禁用 CLEANUP_IMAGE_CACHE 时,动态合图就会默认开启。


强制开启动态合图

macro.CLEANUP_IMAGE_CACHE = false;
dynamicAtlasManager.enabled = true;

强制禁用动态合图

dynamicAtlasManager.enabled = false;

注意:

(1)、这些代码请写在项目脚本中的最外层

不要写在 onLoad/start 等类函数中,才能确保在项目加载过程中即时生效。

否则如果在部分贴图缓存已经释放的情况下才启用动态图集,可能会导致报错。

(2)、只有纹理开启了 Packable 选项的精灵才能够参与动态合图,该选项默认开启。

在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1075111.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3D 生成重建005-NeRF席卷3D的表达形式

3D生成重建005-NeRF席卷3D的表达形式 文章目录 0 论文工作1 论文方法1.1 体渲染1.2 离散积分1.3位置编码1.4分层采样1.5 影响 2 效果 0 论文工作 NeRF(神经辐射场技术)最早2020年提出用于新视图合成任务,并在这个领域取得了优秀的效果。如下图所示,受到…

JAVA 自定义注解,实现数据脱敏处理

1:自定义注解 /*** 脱敏注解**/ Retention(RetentionPolicy.RUNTIME) Target(ElementType.FIELD) JacksonAnnotationsInside JsonSerialize(using SensitiveSerialize.class) public interface Sensitive {/*** 脱敏数据类型*/SensitiveTypeEnum type();}2&#x…

怎么在图片上加logo?

怎么在图片上加logo?在工作中我们经常需要给图片添加logo,例如公司的产品图片在对外发布时需要添加公司的logo,这样的做的目的主要有以下目的: ① 品牌推广:将品牌的logo添加到图片中可以增加品牌曝光度,并…

【Rust】Rust环境配置与语法基础

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍Rust环境配置与语法基础。 学其所用,用其所学。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下,下次更新不迷…

使用python连接Linux服务器发送指定命令

1.安装paramiko库 pip install paramiko2.使用paramiko库连接linux #导入库 import paramiko#创建一个sshclient对象 ssh paramiko.SSHClient()#允许连接不在know_host中的主机 ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())#连接主机 ssh.connect(hostname&q…

nginx运行vue项目的dist文件

目录 1、安装nginx1.1、nginx常用命令1.2、将nginx注册为Windows系统服务 2、拷贝文件3、修改配置文件4、访问 1、安装nginx 官网下载:http://nginx.org/en/download.html 下载完之后直接解压即可 注:存放路径最好不要有中文、空格 1.1、nginx常用命令…

接口测试必备技能

接口测试,其实并没有那么可怕,但是作为测试人员也是必不可少的技能。 接口分为:内部接口和外部接口。 内部接口:是浏览器与服务器的接口。这个很容易理解,web开发一般分前端和后端,前端开发人员用html/css…

FusionCharts Suite XT v3.21 Crack

FusionCharts Suite XT v3.21 在圆环图和饼图上将图例和数据值显示为百分比或绝对值。 2023 年 10 月 4 日 - 15:15新版本 特征 通过允许用户将图例和数据值显示为百分比或绝对值,改进了圆环图和饼图。 添加了一个新功能,可以删除任何可能导致代码错误的…

MySQL-2(14000字详解)

一: 数据库约束 在 MySQL 中,约束是用于限制数据库表中数据的规则或条件。它们是为了保证数据的完整性和一致性。MySQL 提供了多种约束类型,包括 NOT NULL、UNIQUE、DEFAULT、PRIMARY KEY、FOREIGN KEY 和 CHECK等等 NOT NULL 约束&#xf…

【Redis】String内部编码方式

String内部编码方式 int: 8个字节的长整型embstr: 小于等于39个字节的字符串raw: 大于39个字节的字符串

Visual Studio 2022 修改字符集的方法

在射频识别技术课程实验过程中发现的报错问题,搞了半天才找到原因,是字符集设置有问题。下图为报错: 根本原因是默认的字符编码集是Unicode。 改成使用多字节字符集就好了。以下为修改方法。

Jetpack:003-布局中组件的对齐方式

文章目录 1. 概念介绍2. 使用方法2.1 行布局中的对齐方式2.2 列布局中对齐方式 3. 示例代码4. 内容总结 我们在上一章回中介绍了Jetpack中的页面和布局,本章回中将介绍 布局中组件的对齐方式。闲话休提,让我们一起Talk Android Jetpack吧 1. 概念介绍 …

大数据软件系统开发框架

大数据处理框架是用于处理大规模数据集的软件工具和平台,它们可以帮助分析、存储和处理庞大的数据量。以下是一些常见的大数据处理框架,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 1.A…

pytorch_神经网络构建3

文章目录 卷积神经网络实现卷积层,池化层池化层:数据标准化AlexNet卷积网络深层网络结构vgggoogleNet网络结构ResNet网络结构DensNet网络结构训练卷积神经网络会遇到的一些问题学习率衰减 卷积神经网络 前面讲述了逻辑回归分类,模拟函数回归问题,单层,深层网络,它们以点和向量…

基于SSM的开心农家乐系统设计与实现

末尾获取源码 开发语言:Java Java开发工具:JDK1.8 后端框架:SSM 前端:采用JSP技术开发 数据库:MySQL5.7和Navicat管理工具结合 服务器:Tomcat8.5 开发软件:IDEA / Eclipse 是否Maven项目&#x…

Tomcat安装

tomcat.apache.org 下载Tomcat8 根据系统选择安装包 配置JAVA_HOME 解压文件,启动Tomcat 启动成功,默认占用8080端口 MAC版本在bin目录输入./startup.sh启动Tomcat 访问Tomcat:localhost:8080 根据tomcat版本选择servlet版本 tomc…

OpenWRT配置SFTP远程文件传输,实现数据安全保护

文章目录 前言1. openssh-sftp-server 安装2. 安装cpolar工具3.配置SFTP远程访问4.固定远程连接地址 前言 本次教程我们将在OpenWRT上安装SFTP服务,并结合cpolar内网穿透,创建安全隧道映射22端口,实现在公网环境下远程OpenWRT SFTP&#xff…

运算符

目录 算术运算符 比较运算符 逻辑运算符 位运算符 运算符的优先级 MySQL从小白到总裁完整教程目录:https://blog.csdn.net/weixin_67859959/article/details/129334507?spm1001.2014.3001.5502 数据库中的表结构确立后,表中的数据代表的意义就已经确定。而…

[护网杯 2018]easy_tornado 解析

打开网页有三个链接,依次点开之后获得一个fllllllllllllag一个render和一个MD5加密格式 之后尝试去访问/fllllllllllllag 直接跳出报错界面。 但这个报错界面居然是可以改的 试着注入一下 看了师傅的wp发现好像没有,要从框架入手 框架就是标题的torna…

[极客大挑战 2020]Roamphp2-Myblog - 伪协议+文件上传+(LFIZIP)||(LFIPhar)【***】

[极客大挑战 2020]Roamphp2-Myblog 1 解题流程1.1 分析1.2 解题1.3 中场休息——再分析1.3.1 浅层分析1.3.2 难点疑惑1.3.3 深度分析 1.4 重整旗鼓——再战1.4.1 解法一:zip伪协议1.4.2 解法二:phar伪协议 2 总结展望 1 解题流程 1.1 分析 1、点击logi…