内存对齐的原理和使用

news2024/10/1 23:32:44

1. 什么是内存对齐?

内存对齐是指将数据存储在内存中时,按照数据类型的大小,将数据放在特定的内存边界上。例如,4 字节的 int 通常放在能够被 4 整除的地址上,8 字节的 double 则放在能被 8 整除的地址上。

2. 为什么需要内存对齐?

内存对齐有几个关键的原因:

2.1 提高 CPU 访问速度
  • CPU 访问内存时,会一次性读取一定数量的字节(通常是 4、8 或 16 字节)。当数据地址是对齐的,CPU 可以在一次内存读取操作中完整读取数据,这显著提升了效率。
  • 如果数据没有对齐,CPU 可能需要执行多次内存读取操作来获取完整的数据。例如,如果一个 4 字节的 int 存储在一个未对齐的位置(比如 3 字节边界上),那么 CPU 需要读取两次内存块,将其拼接成一个完整的数据。这会降低系统性能。
2.2 硬件要求
  • 一些处理器架构(如早期的 RISC 处理器或某些嵌入式系统)不允许从非对齐的内存地址读取数据。如果数据没有对齐,硬件可能会抛出错误,导致程序崩溃。
  • 对于允许非对齐访问的架构(如大多数 x86 处理器),虽然可以处理非对齐数据,但这往往伴随着性能上的显著开销。
2.3 避免额外的计算复杂性
  • 如果数据不对齐,编译器和硬件需要额外计算如何正确读取和写入数据。这增加了编译器和 CPU 的复杂性,也可能会导致更高的功耗。

3. 内存对齐的原理

内存对齐遵循以下基本规则:

  • 数据的起始地址必须是它大小的整数倍。例如,4 字节的 int 变量的地址通常是 4 的倍数,8 字节的 double 变量的地址是 8 的倍数。
  • 现代编译器通常会为不同类型的数据设置默认的对齐规则,确保数据存储在合适的内存地址上。

4. 内存对齐的代价:填充字节

为了满足对齐要求,编译器可能会在内存中引入一些填充字节(padding bytes),这些字节不会存储有效数据,但它们确保后续的数据地址是对齐的。

示例:

假设有一个包含不同类型成员的结构体:

struct Example {
    char a;   // 1字节
    int b;    // 4字节
    short c;  // 2字节
};

在 32 位系统上,内存对齐可能是这样的:

| a (1 byte) | padding (3 bytes) | b (4 bytes) | c (2 bytes) | padding (2 bytes) |
  • a 占 1 字节,但 b 是 4 字节的 int,需要对齐到 4 字节边界,因此 a 后面有 3 个填充字节。
  • c 是 2 字节的 short,为了对齐结构体的总大小,也可能引入额外的 2 字节填充。

总大小为 12 字节,而不是简单的 7 字节。

5. 内存对齐的影响

  • 性能提升:对齐使得 CPU 能够更高效地访问内存,尤其是当大量数据处理时,这一点显得尤为重要。
  • 空间开销:虽然内存对齐可能引入填充字节,增加内存使用,但这通常是必要的权衡,因为提升了数据访问效率。

6. 手动控制对齐

在 C++ 中,可以使用 #pragma packalignas 关键字来手动调整结构体的对齐方式。例如,#pragma pack(1) 可以让编译器不插入填充字节,减少内存占用。但这可能会牺牲性能,甚至导致某些平台上的错误。

7.使用#pragma pack 来关闭内存对齐

手动控制内存对齐手动控制内存对齐是一种手段,可以通过编译器指令调整数据结构的内存对齐方式,以减少内存浪费或满足特殊的内存布局需求。通常情况下,编译器会自动为数据类型安排合理的对齐,但在某些场景下,你可能需要手动修改对齐策略。常用的手段包括 #pragma packalignas 关键字。下面详细解释这两种方法:

1. #pragma pack

#pragma pack 是一种预处理指令,用来控制结构体或类的对齐方式。它可以通过设定字节边界来调整结构体中的填充字节。

语法:
#pragma pack(n)
  • 其中 n 表示对齐字节边界,例如 1248 等。编译器会强制将结构体成员对齐到 n 字节的边界上。
示例:
#pragma pack(1)
struct Example {
    char a;  // 1字节
    int b;   // 4字节
    short c; // 2字节
};
#pragma pack() // 恢复默认对齐

#pragma pack(1) 下,编译器将强制所有成员不插入任何填充字节,对齐到 1 字节边界,结构体内存布局如下:

| a (1 byte) | b (4 bytes) | c (2 bytes) |

此时,整个结构体大小为 7 字节,没有任何填充字节。

不使用 #pragma pack 的默认布局:

如果不使用 #pragma pack(1),编译器会按照默认对齐方式处理。以 4 字节对齐为例,Example 结构体的默认内存布局为:

| a (1 byte) | padding (3 bytes) | b (4 bytes) | c (2 bytes) | padding (2 bytes) |

默认情况下,int b 需要对齐到 4 字节边界,因此在 a 后面插入了 3 个字节的填充,使得 b 正好对齐到 4 字节边界,最后结构体大小为 12 字节

优缺点:
  • 优点:可以减少不必要的内存填充,尤其在数据存储、网络传输等场景下,可以节省内存。
  • 缺点:强制对齐到小字节边界可能导致性能下降,尤其是在现代 CPU 上,非对齐的内存访问可能会引起多次内存访问,导致系统性能变差。

8 使用alignas 关键字

alignas 是 C++11 引入的关键字,它可以在声明变量或结构体成员时,指定某个成员的对齐方式。

语法:
alignas(n) type var;
  • 其中 n 是对齐要求的字节数,type 是变量类型,var 是变量名称。alignas 可以为数据结构的某个特定成员或整个结构体设置对齐。
示例:
struct Example {
    char a;                  // 1字节
    alignas(8) int b;        // 强制 b 对齐到 8 字节
    short c;                 // 2字节
};

在这个例子中,int b 强制对齐到 8 字节边界。内存布局将变为:

| a (1 byte) | padding (7 bytes) | b (4 bytes) | c (2 bytes) | padding (2 bytes) |

整个结构体大小为 16 字节。相比默认情况下的对齐方式(4 字节对齐),b 现在被强制对齐到 8 字节,因此插入了更多的填充字节以确保对齐。

对齐整个结构体:

alignas 还可以用于整个结构体的对齐,例如:

struct alignas(16) Example {
    char a;
    int b;
};

这会确保 Example 结构体的起始地址是 16 字节对齐的,通常在需要满足特定硬件需求或 SIMD(单指令多数据)操作时会使用。

优缺点:
  • 优点alignas 提供了更细粒度的控制,允许为特定变量或结构体自定义对齐方式。
  • 缺点:过度使用可能增加填充字节,从而浪费内存;同时,也会影响性能,尤其是在对齐过度的情况下。

3. #pragma packalignas 的比较

  • 适用范围#pragma pack 主要用于控制整个结构体的对齐方式,而 alignas 可以细粒度控制特定成员或整个结构体的对齐。
  • 灵活性alignas 更灵活,因为它可以精确控制特定成员的对齐,而 #pragma pack 是全局性的。
  • 兼容性#pragma pack 是一种编译器指令,不同编译器可能有不同的实现和支持;alignas 是标准的 C++ 关键字,跨平台兼容性更好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2183378.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

STL--string类

我们从这篇文章之后就正式开始学习STL的string,字面看起来是不是像C语言里面的字符串之类的处理方法,是的,C里面也是对字符串的一些处理函数,但是C有很多这样的函数,给大家推荐一个网站 ,这个网站是C的官网…

Python | Leetcode Python题解之第448题找到所有数组中消失的数字

题目&#xff1a; 题解&#xff1a; class Solution:def findDisappearedNumbers(self, nums: List[int]) -> List[int]:n len(nums)for num in nums:x (num - 1) % nnums[x] nret [i 1 for i, num in enumerate(nums) if num < n]return ret

Verilog基础:$display系统函数和C语言中的库函数printf的区别

相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html?spm1001.2014.3001.5482 Verilog中的$display系统函数和C语言中的库函数printf都是用于输出信息&#xff0c;但它们的用法存在一定差别&#xff0c;本文将简要描述。 $display系统函数的B…

Javaweb商城项目

smbms 视频教程&#xff1a;javaweb-30&#xff1a;smbms项目搭建_哔哩哔哩_bilibili 一.项目分析 1.项目结构 2.数据库表 CREATE DATABASE smbms;USE smbms;DROP TABLE IF EXISTS smbms_address;CREATE TABLE smbms_address (id bigint(20) NOT NULL AUTO_INCREMENT CO…

计算机毕业设计 家校互联管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…

2024年录屏软件排行榜:班迪录屏等四款软件实测!

不论是学习、娱乐还是工作&#xff0c;都有可能需要用到屏幕录制功能。在这篇文章中&#xff0c;我们将从不同的使用场景出发&#xff0c;为大家推荐几款实用的录屏工具——福昕录屏大师、转转大师录屏、爱拍录屏以及班迪录屏。 Foxit REC 直达链接&#xff08;复制到浏览器打…

Flexible组件的用法

文章目录 1. 概念介绍2. 使用方法3. 示例代码我们在上一章回中介绍了扩展内容相关的知识,本章回中将介绍Flexible组件.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 我们在前面章回中介绍了扩展列表相关的内容,当页面中其它组件和扩展列表一起使用时,扩展列表有可能会…

SpringBoot——基础配置

但是还需要删除pom.xml中的标签——模板的文件也同样操作 banner的选项——关闭 控制台 日志 banner图片的位置——还会分辨颜色 在 Java 的日志框架&#xff08;如 Logback、Log4j2 等&#xff09;中&#xff0c;logging.level.root主要用于设置根日志记录器的日志级别…

【Redis】如何在 Ubuntu 上安装 Redis 5

&#x1f970;&#x1f970;&#x1f970;来都来了&#xff0c;不妨点个关注叭&#xff01; &#x1f449;博客主页&#xff1a;欢迎各位大佬!&#x1f448; 本期内容主要介绍如何在 Ubuntu 上安装 Redis5 一些碎碎念&#xff1a; 本来这期内容介绍如何在 Centos 安装 Redis …

常用的Java安全框架

Spring Security&#xff1a; 就像Java安全领域的“瑞士军刀”&#xff0c;功能全面且强大。 支持认证、授权、加密、会话管理等安全功能。 与Spring框架无缝集成&#xff0c;使用起来特别方便。 社区活跃&#xff0c;文档丰富&#xff0c;遇到问题容易找到解决方案。 Apach…

SigmaStudio控件Cross Mixer\Signal Merger算法效果分析

衰减与叠加混音算法验证分析一 CH2:输入源为-20dB正弦波1khz CH1叠加混音&#xff1a;参考混音算法https://blog.csdn.net/weixin_48408892/article/details/129878036?spm1001.2014.3001.5502 Ch0衰减混音&#xff1a;外部多个输入源做混音时&#xff0c;建议参考该算法控件&…

网络通信——OSPF协议(基础篇)

这里基础是因为没有讲解OSPF中的具体算法过程&#xff0c;以及其中很多小细节。后续会更新。 目录 一.OSPF的基础信息 二.认识OSPF中的Router ID 三.OSPF中的三张表 四.OSPF中的度量方法&#xff08;计算开销值&#xff09; 五. OSPF选举DR和BDR&#xff08;就是这个区域…

简单vue指令实现 el-table 可拖拽表格功能

安装 SortableJS sorttableJs 相关优点如下&#xff1a; 相关配置项 参考 &#x1f449; SortableJS中文官网 pnpm i sortablejs封装成指令 不多逼逼&#xff0c;直接上才艺 &#x1f92a;&#x1f92a;&#x1f92a; 先安装一个 nanoid 插件 用于生成随机id&#xff0c;注…

图神经网络:处理复杂关系结构与图分类任务的强大工具

创作不易&#xff0c;您的打赏、关注、点赞、收藏和转发是我坚持下去的动力&#xff01; 图神经网络&#xff08;Graph Neural Network, GNN&#xff09;是针对图数据的一类神经网络模型。图数据具有节点&#xff08;节点代表实体&#xff09;和边&#xff08;边代表节点之间的…

LeetCode[中等] 55.跳跃游戏

给你一个非负整数数组 nums &#xff0c;你最初位于数组的 第一个下标 。数组中的每个元素代表你在该位置可以跳跃的最大长度。 判断你是否能够到达最后一个下标&#xff0c;如果可以&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 思路 贪心算法 可达位置…

html5 + css3(下)

目录 CSS基础体验cssCSS引入方式选择器选择器-标签选择器-类选择器-id选择器-通配符 文字基本样式1.1 字体大小1.2 字体粗细1.3 字体样式&#xff08;是否倾斜&#xff09; 文字-字体1.4 常见字体系列&#xff08;了解&#xff09;1.5 字体系列 拓展-层叠性font复合属性文本缩进…

erlang学习:Linux命令学习8

shell脚本案例学习 循环求 1-100 的每一步和 —案例 j0 i1 while((i<100)) do j$((ji)) echo $j ((i)) done每 30 s循环判断一次 user 用户是否登录系统 —案例 设置了一个次数&#xff0c;如果循环了五次在user文件中添加user用户&#xff0c;表示用户登录 USERS"u…

嵌入式 ADC基础知识

在现实世界中&#xff0c;常见的信号大都是模拟量&#xff0c;像温度、声音、气压等&#xff0c;但在信号的处理与传输中&#xff0c;为了减少噪声的干扰&#xff0c;较多使用的是数字量。因此我们经常会将现实中的模拟信号&#xff0c;通过 ADC 转换为数字信号进行运算、传输、…

Java | Leetcode Java题解之第442题数组中重复的数据

题目&#xff1a; 题解&#xff1a; class Solution {public List<Integer> findDuplicates(int[] nums) {int n nums.length;List<Integer> ans new ArrayList<Integer>();for (int i 0; i < n; i) {int x Math.abs(nums[i]);if (nums[x - 1] > …

端到端如火如荼, 传统规划控制还有前途吗?

近些年自动驾驶领域一定绕不开端到端, 伴随着各大车企纷纷转向拥抱端到端, 传统PnC的处境似乎愈发尴尬了起来. 但是端到端真的如水中月镜中花般美好吗? 不可否认深度学习给诸多领域带来了天翻地覆的变化, 但是自动驾驶直接关系到交通安全. 自动驾驶系统的输出, 必须具备足够的…