跟我学c++中级篇——C++中的缓存利用

news2024/12/27 8:41:48

一、缓存

学习过计算机知识的一般都知道缓存这个概念,大约也知道缓存是什么。但是如果是程序员,如何更好的利用缓存,可能就有很多人不太清楚了。其实缓存的目的非常简单,就是了更高效的操作数据。大家都听说过“局部性原理”,可以这样说,如果计算机中不存在局部性原理这个概念,就不大会有缓存这个概念。
局部性原理可以划分为时间局部性和空间局部性,这个非常好理解。前者指在较短的时间内不断的访问相同的数据;后者则为访问的数据空间范围较小(比如数组,可能更容易访问附近的数据)。
这里不给大家分析硬件或者其它什么几级缓存的相关技术,那些分析无论是书籍还是资料或者网上都非常多,这里只分析缓存的应用级别的情况。
伪共享 局部性原理

二、缓存命中

一般来说,缓存的主要作用就是增加了一个快速访问的中间层,减少了去较慢的内存中操作数据的过程。所以其命中率可以考虑下面两个方面:
1、缓存大小
缓存的大小直接决定的命中率的高低,理论上讲,缓存越大越好。但这玩意儿贵啊。而且一般缓存都在CPU内部,成本相当高昂。所以要大小适中,后来为了增加命中率,又非常聪明的想出了多级缓存的方式,从而平衡命中率和命中代价。至于缓存分级有兴趣可以查看一下相关书籍。
2、缓存替换策略
缓存也可以看做内存,所以它也有管理的策略。想一下内存中如何替换内存页,缓存基本也差不多。这里就存在一个问题,如果当几次没有命中的数据如何被替换?假如刚刚替换出去的又要访问,不就降低了访问的效率么。所以这个替换的策略也非常重要,常见的如LRU,FIFO,LFU等等,大家可查看相关的资料,这里不是重点就不展开了。
一般来说,只要指定是硬件,缓存基本大小就无法更改了。相关的替换策略一般也很少改动,但可以根据需要选取合适的CPU更好。

三、C++如何更高效的利用缓存

既然控制不了缓存的大小,但可以根据相关的策略和缓存的原理进行编码的控制。缓存的原理就是局部性的问题,也即空间和时间上的局部性。那么在时间局部性上就可以把经常访问的数据放到缓存(或寄存器);而空间局部性上就可以把经常访问的相关数据放在一起引入缓存中去。那大方向就指明了,C++编码可以做如下的控制:
1、内存处理
要想将内存的数据有效的转化为缓存,提高命中效率,可以从优化布局,比如常见的结构体的字段的顺序啊,指针数据的处理啊等等。内存对齐 ,这个更常见。把相关的数据搞到和Cache行大小相关(最小单元的处理);另外就是多使用类似数组的连续内存数据结构,少使用类似List这种非连续的内存。
2、函数处理
要想增加函数处理的效率,首先想到的就是使用内联函数,同时减少函数中的对象的传递,特别是大对象的传递。要避免过深的嵌套调用和递归调用,防止缓存中途失效,还需要重新从内存加载就得不偿失了。
3、循环处理
前面分析过循环处理的很多优化,往往编译器都能做到。但还是需要注意要对相关的循环过程中的循环次数的优化,特别是在处理一些大型的数据时(比如特别大的数组、矩阵等)可以考虑前面并行编程优化时提到的分块处理,分治同样也适应缓存的优化。
4、IO的控制
在一些库或接口中,提供了硬盘等IO的缓冲设置,其实这也可以划到缓存当中来。如果使用良好的预读写函数处理,可能大幅度提高缓存的命中率真,从而提高读写的效率。
5、使用内存或对象池
这个很容易明白,其实和使用数组方式类似,将相关的对象直接固定在一个位置而不是反复的分配,无法形成有效的缓存。
6、减少判断和跳转的语句
这个不光对缓存有用,对CPU中的流水指令也很重要,经常的反复的无规则的跳转,缓存就失去了意义 。
7、减少内存碎片
内存碎片增多,就意味着连续性的降低,从而导致缓存在固定的大小范围内引入的相关范围的减少,从概率上讲,会降低命中率。消除内存碎片最常用的是使用内存池技术。
8、消除伪共享
这个非常重要,在如今多核泛滥的情况下,不处理这种情况,就等于是降低命中率。可以参看前面的文章“多线程的伪共享”中消除的方法即使用填充法或使用一些关键字来处理。
9、处理好并行情况的竞态
这个其实和判断语句有些相似,都是尽量保证高命率的可能的内存数据保留在缓存中,毕竟缓存的大小有限。

四、例程

下面看一些简单的应用:

//使用关键字处理对齐
struct alignas(8) Test {
    int a;
    int32_t b;
};
//数组行优先访问
for (int r = 0; r < 1000; ++r) {
    for (int c = 0; c < 1000; ++c) {
        array[r][c] = 0;
    }
 }
}
//循环优化
for (int i = 0; i < 800; i += 8) {
    readData(array[i]);
    readData(array[i+1]);
    readData(array[i+2]);
    readData(array[i+3]);
    readData(array[i+4]);
    readData(array[i+5]);
    readData(array[i+6]);
    readData(array[i+7]);
}
//经常访问数据放置相近
struct Data{
...
int height,weight,old;

...
};

其实这些方法很简单,就是使用的时候要在思想上有一个处理的想法,而不是粗暴的想到哪儿就写到哪儿。

五、总结

总之,如何在编程层面对缓存命中进行处理,是一个综合考量的过程。开发者需要根据实际情况如何用最小的代价实现更好的命中率。不过可惜的是,对于大多数程序员来说,这都是在实际场景中很难遇到的情况。对于普通程序员来说,好好优化,但不要过度优化代码,更不要过早的展开优化。养成一个好的数据定义的内存布局概念,就基本可以达到要求了。
不过,需要注意的是,不同的架构芯片可能缓存机制有所不同,如果真要写贴近硬件的缓存机制相关代码,需要严格的按照相关的硬件说明进行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2266283.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

01 - 初识 Spring

初识Spring 企业级应用 企业级应用是指那些为商业组织、⼤型企业而创建并部署的解决⽅案及应用。这些⼤型的企业级应用结构复 杂、涉及的外部资源众多&#xff0c;事务密集&#xff0c;数据规模⼤&#xff0c;用户数量多&#xff0c;有较强的安全性考虑和较⾼的性能要求。 …

NLP 中文拼写检测纠正论文-04-Learning from the Dictionary

拼写纠正系列 NLP 中文拼写检测实现思路 NLP 中文拼写检测纠正算法整理 NLP 英文拼写算法&#xff0c;如果提升 100W 倍的性能&#xff1f; NLP 中文拼写检测纠正 Paper java 实现中英文拼写检查和错误纠正&#xff1f;可我只会写 CRUD 啊&#xff01; 一个提升英文单词拼…

【CSS in Depth 2 精译_091】15.4:让 CSS 高度值过渡到自动高度 + 15.5:自定义属性的过渡设置(全新)+ 15.6:本章小结

当前内容所在位置&#xff08;可进入专栏查看其他译好的章节内容&#xff09; 第五部分 添加动效 ✔️【第 15 章 过渡】 ✔️ 15.1 状态间的由此及彼15.2 定时函数 15.2.1 定制贝塞尔曲线15.2.2 阶跃 15.3 非动画属性 15.3.1 不可添加动画效果的属性15.3.2 淡入与淡出 15.4 过…

PMP项目管理考试模拟真题及答案(中文版)

1、赶工一个任务时&#xff0c;你应该关注: A 尽可能多的任务。 B 非关键任务。 C 加速执行关键路径上的任务。 D通过成本最低化加速执行任务。 正确答案:C 2、“在对软件编码前我不能进行软件测试。”这句话说明了哪种依赖关系? A 随意的 B软逻辑关系 C 优先 D 强制…

CentOS7下的vsftpd服务器和客户端

目录 1、安装vsftpd服务器和ftp客户端&#xff1b; 2、配置vsftpd服务器&#xff0c;允许普通用户登录、下载、上传文件&#xff1b; 3、配置vsftpd服务器&#xff0c;允许anonymous用户登录、下载、上传文件&#xff1b; 4、配置vsftpd服务器&#xff0c;允许root用户登录…

本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——12使用YOLO-Bin

本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——12使用YOLO-Bin ​ 根据前面内容&#xff0c;所有的子任务已经基本结束&#xff0c;接下来就是调用转化的bin模型进行最后的逻辑控制了 1 .YOLO的bin使用 ​ 对于yolo其实有个简单的办法&#xff0c;也…

109.【C语言】数据结构之求二叉树的高度

目录 1.知识回顾&#xff1a;高度&#xff08;也称深度&#xff09; 2.分析 设计代码框架 返回左右子树高度较大的那个的写法一:if语句 返回左右子树高度较大的那个的写法二:三目操作符 3.代码 4.反思 问题 出问题的代码 改进后的代码 执行结果 1.知识回顾&#xf…

STM32学习(一)

STM32是什么 STM32是意法半导体&#xff08;ST&#xff09;公司基于ARM Cortex-M内核开发的32位微控制器‌。他的名字是由&#xff1b;意大利SGS&法国Thomson共同研制的&#xff0c;中国人民取两家公司名称的首字母于是ST就是这样来的&#xff0c;M是单片机M-Micro Contro…

Windows、CentOS环境下搭建自己的版本管理资料库:GitBlit

可以搭建属于公司内部或者个人的Git服务器&#xff0c;方便程序代码及文档版本管理。 官网&#xff1a;http://www.gitblit.com/ Windows环境下安装 提前已经安装好了JDK。 官网下载Windows版的GitBlit。 将zip包解压到自己想要放置的文件夹下。 建立版本库路径&#xff0c…

音视频入门基础:MPEG2-TS专题(22)——FFmpeg源码中,获取TS流的音频信息的实现

一、引言 通过FFmpeg命令可以获取到TS文件/TS流的音频压缩编码格式、音频压缩编码格式的profile、音频采样率、通道数、音频码率信息&#xff1a; ./ffmpeg -i XXX.ts 本文以音频为AAC为例讲述FFmpeg到底是从哪个地方获取到这些音频信息的。 二、音频压缩编码格式 FFmpeg获取…

中伟视界:电话、短信怎么在矿山智能分析平台中的报警等级管理中分级通知到相关人员

在现代矿山安全管理中&#xff0c;通讯报警系统的有效性不可忽视&#xff0c;智慧矿山的融合通信与AI智能预警的联动&#xff0c;已经成为矿山智能化的一个发展方向。随着科技的发展&#xff0c;矿山智能分析平台越来越受到企业的青睐&#xff0c;通过对报警信息的分级管理&…

音视频入门知识(二)、图像篇

⭐二、图像篇 视频基本要素&#xff1a;宽、高、帧率、编码方式、码率、分辨率 ​ 其中码率的计算&#xff1a;码率(kbps)&#xff1d;文件大小(KB)&#xff0a;8&#xff0f;时间(秒)&#xff0c;即码率和视频文件大小成正比 YUV和RGB可相互转换 ★YUV&#xff08;原始数据&am…

论文研读:AnimateDiff—通过微调SD,用图片生成动画

1.概述 AnimateDiff 设计了3个模块来微调通用的文生图Stable Diffusion预训练模型, 以较低的消耗实现图片到动画生成。 论文名&#xff1a;AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning 三大模块&#xff1a; 视频域适应…

百度地图绘制行政区域及设置中心点

// 画行政区 const drwaDistrict (disList, clear true) > {clear && clearOverlays();if (!bMapGL.value) return;let bd new bMapGL.value.Boundary();disList.map((item) > {bd.get(item, function (rs1) {// rs1 是行政区对应的点集合 此处非每次必反信息…

jetson Orin nx + yolov8 TensorRT 加速量化 环境配置

参考【Jetson】Jetson Orin NX纯系统配置环境-CSDN博客 一 系统环境配置&#xff1a; 1.更换源&#xff1a; sudo vi /etc/apt/sources.list.d/nvidia-l4t-apt-source.list2.更新源&#xff1a; sudo apt upgradesudo apt updatesudo apt dist-upgrade sudo apt-get updat…

VirtualBox下ubuntu23.04使用主机串口以及使用 minicom 进行串口调试

VirtualBox下ubuntu23.04使用主机串口以及使用 minicom 进行串口调试 一、打开设备管理器看主机&#xff08;Window系统&#xff09;是否识别出串口&#xff0c;我这边显示的串行通信端口是COM3 二、打开VirtualBox&#xff0c;设置串口和USB设备 串口设置&#xff1a; 启用…

Python 自动化 打开网站 填表登陆 例子

图样 简价&#xff1a; 简要说明这个程序的功能&#xff1a; 1. **基本功能**&#xff1a; - 自动打开网站 - 自动填写登录信息&#xff08;号、公司名称、密码&#xff09; - 显示半透明状态窗口实时提示操作进度 2. **操作流程**&#xff1a; - 打开网站后自动…

本原多项式

将 G F ( p ) GF(p) GF(p)延伸为有 p m p^m pm个元素的域&#xff0c;称之为 G F ( p ) GF(p) GF(p)的扩域&#xff0c;表示为 G F ( p m ) GF(p^m) GF(pm). G F ( p ) GF(p) GF(p)是 G F ( p m ) GF(p^m) GF(pm)的子集。 G F ( p m ) GF(p^m) GF(pm)元素个数为 p m p^m pm。 …

【物联网技术与应用】实验15:电位器传感器实验

实验15 电位器传感器实验 【实验介绍】 电位器可以帮助控制Arduino板上的LED闪烁的时间间隔。 【实验组件】 ● Arduino Uno主板* 1 ● 电位器模块* 1 ● USB电缆*1 ● 面包板* 1 ● 9V方型电池* 1 ● 跳线若干 【实验原理】 模拟电位器是模拟电子元件&#xff0c;模…

能省一点是一点 - 享元模式(Flyweight Pattern)

享元模式&#xff08;Flyweight Pattern&#xff09; 享元模式&#xff08;Flyweight Pattern&#xff09;享元模式&#xff08;Flyweight Pattern&#xff09;概述享元模式包含的角色&#xff1a;享元模式应用场景 talk is cheap&#xff0c; show you my code总结 享元模式&a…