深度刨析数据在内存中的存储

news2024/11/25 11:53:11

图片来源于网络

✨博客主页:小钱编程成长记
🎈博客专栏:进阶C语言

深度刨析数据在内存中的存储

  • 1.数据类型介绍
    • 1.1 类型的基本归类
  • 2.整形在内存中的存储
    • 2.1 原码、反码、补码
    • 2.2 大小端介绍
  • 3.浮点型在内存中的存储
    • 3.1 一个例子
    • 3.2 浮点数的存储规则
    • 3.3指数E从内存中取出的三种情况:
    • 3.3一个例子的解释
  • 4.总结

1.数据类型介绍

char ------------ 字符数据类型
short int ------- 短整型
int --------------- 整型
long int -------- 长整型
long long int – 更长整型
float ------------ 单精度浮点型
double --------- 双精度浮点型

short, long, long long后的int可省略。
有些小伙伴可能会有疑问,在C语言中有字符串类型吗? 答案是没有。

类型的意义:

1.使用这个类型开辟内存空间的大小(大小决定了使用范围)。
2.提供了看待内存空间的视角。

1.1 类型的基本归类

整型家族:

char
	unsigned char
	signed char
short
	unsigned short [int]
	signed short [int]
int
	unsigned int
	signed int
long
	unsigned long [int]
	signed long [int]
long long
	unsigned long long [int]
	signed long long [int]
  1. C语言规定:short == signed short, int、long、long long也一样,
    但char是否是signed char ,C语言标准中并没有规定,取决于编译器。
  2. unsigned是无符号型,signed是有符号型,这两种类型的区别是数据的二进制的最高位是否为符号位。

[int]是什么意思呢?

意思是这里的int可以省略。

字符类型为什么会被归类到整型家族呢?

因为字符在内存中存储的是字符的ASCII码值,ASCII码值是整型,所以字符类型归类到整型家族。

浮点型家族:

float
double
long double

构造类型(自定义类型):

> 数组类型
> 结构体类型  struct
> 枚举类型  enum
> 联合类型  union

数组类型为什么也是自定义类型呢?

如:int arr[10] ; arr的类型是int [10] ,数组的大小改变了,数组类型也就改变了,又因为数组的大小是我们自己设置的,所以数组类型也是自定义类型。

指针类型:

int* pi;
char* pc;
float* pf;
void* pv;//无具体类型的指针

空类型:

void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型。
如:void test(void) { } , void* pv;

2.整形在内存中的存储

一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。
那接下来我们谈谈数据在所开辟内存中到底是如何存储的?
比如:

int a = 20;
int b = -10;

我们知道编译器为 a 分配四个字节的空间。
那到底如何存储?
接下来我们一起来了解下面的概念:

2.1 原码、反码、补码

计算机中的整数有三种2进制表示方法,即原码、反码和补码。
三种表示方法均有 符号位 数值位 两部分,符号位都是用0表示“正”,用1表示“负”。
正数的原、反、补码都相同。

负整数的三种表示方法各不相同。 区别如下:

原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码 :
将原码的符号位不变,其他位依次按位取反就可以得到反码。
补码:
反码+1就得到补码。

对于整形来说:数据存放内存中其实存放的是补码。
那是为什么呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;

例如:

//1-1 -> 1+(-1)
00000000000000000000000000000001//1的补码
10000000000000000000000000000001//-1的原码
11111111111111111111111111111110//-1的反码
11111111111111111111111111111111//-1的补码
//1和-1的补码相加得
100000000000000000000000000000000
//共33位
//因为整型只有4字节,32位,所以最高位溢出丢失,结果得到 0,结果正确。

//若用原码来计算,则结果为
10000000000000000000000000000010
//相加得-2,则结果错误。

同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
原码与补码的相互转换

我们来看看在内存中的存储:
在这里插入图片描述

小知识

0 1 2 3 4 5 6 7 8 9 a b c d e f  (0 ~ 15)
15 -> 1111  所以十六进制中的1位等于二进制中的4位,
十六进制中的2== 二进制中的8== 一字节
例如:
int a = 10;
因为整型是4字节,32bit, 所以10在内存中是这样存储的:00000000000000000000000000001010
又因为二进制太长了,为了方便我们查看,编译器显示的的是十六进制0x0000000a

我们看上面的图片,图片中在内存中的数据的顺序为什么是反的呢?
那就要学习下面的知识了。

2.2 大小端介绍

什么是大端小端:

大端(存储)模式:全称大端字节序存储模式,是指数据的低位字节处的数据保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式:全称小端字节序存储模式,是指数据的低位字节处的数据保存在内存的低地址中,而数据的高位,保存在内存的高地址中。
如图:
在这里插入图片描述

为什么讨论顺序是以字节为单位?

因为内存的基本单位是一字节,一个地址管理一个内存单元(一字节),只有大于一字节才有顺序这一说。

为什么有大端和小端:

为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8 bit的char之外,还有16 bit的short 型,32bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如:一个16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为 高字节, 0x22为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高 地址中,即 0x0011中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式 还是小端模式。

3.浮点型在内存中的存储

常见的浮点数:

3.14
1E10 == 1.0 * 10^10(科学计数法)
浮点数家族包括:float、double、long double 类型。
浮点数表示的范围:在float.h中定义,可以找到这个头文件查看, 如下所示:
在这里插入图片描述

3.1 一个例子

浮点数存储的例子:

int main()
{
	int n = 9;
	float *pFloat = (float *)&n;
	printf("n的值为:%d\n",n);
	printf("*pFloat的值为:%f\n",*pFloat);
	
	*pFloat = 9.0;
	printf("num的值为:%d\n",n);
	printf("*pFloat的值为:%f\n",*pFloat);
	return 0;
}

在这里插入图片描述

3.2 浮点数的存储规则

num 和 *pFloat 在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?
要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。
详细解读:
根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:

  • (-1)^S * M * 2^E
  • (-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数。
  • M表示有效数字,大于等于1,小于2。
  • 2^E表示指数位。

举例来说:

十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。 那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。
十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。那么,S=1,M=1.01,E=2。

IEEE 754规定:

对于32位的浮点数(float),最高的1位是符号位S,接着的8位是指数E,剩下的32位为有效数字M。
在这里插入图片描述
对于64位的浮点数(double),最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。
在这里插入图片描述

注意:1. 浮点数没有原码、反码、补码。只有整型有原码、反码、补码。
------ 2. 有几位有效数字,这种类型的精度就到几。

IEEE 754对有效数字M有一些特别规定

前面说过1≤M<2, 就是说,M可以写成1.xxxxxx 的形式,其中xxxxxx表示小数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的 xxxxxx部分。
比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。
以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,就可以保存23位小数,就等于可以保存24位有效数字。

至于指数E,情况就比较复杂

首先,E为一个无符号整数(unsigned int)
这意味着,如果E为8位,它的取值范围为0 ~ 255;
如果E为11位,它的取值范围为0 ~ 2047。
但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,这样就用无符号整型表示出了负数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。
比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

有些小伙伴可能会有疑问,如果一个一个数的指数E是负数,并且加上中间数仍为负数怎么办?

出现了这种情况,那就说明这个数的范围超出了当前这个数的浮点型范围,这个数需要更大的浮点型。

3.3指数E从内存中取出的三种情况:

E不全为0或不全为1

这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。

E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,
有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示 ±0,以及接近于0的很小的数字。

E全为1

这时,如果有效数字M全为0,表示 ±无穷大(正负取决于符号位S);好了,关于浮点数的表示规则,就说到这里。

注意:对于一些浮点数,它不能通过二进制准确的表示出来。比如:0.14,0.2,0.3等就无法用二进制数字来精确地表示出来,这就导致了部分浮点数在内存中很难被精确保存。

3.3一个例子的解释

int main()
{
	int n = 9;
	float *pFloat = (float *)&n;
	printf("n的值为:%d\n",n);
	printf("*pFloat的值为:%f\n",*pFloat);
	
	*pFloat = 9.0;
	printf("num的值为:%d\n",n);
	printf("*pFloat的值为:%f\n",*pFloat);
	return 0;

取出浮点数:
让我们回到一开始的问题:为什么以单精度浮点型指针pFloat的视角打印9;得到的结果却是0.000000?
首先先将整型9拆分,因为在内存中存储的都是二进制,所以拆分的是9的二进制。

9 —> 0 00000000 00000000000000000001001

我们是站在pFloat的视角打印的9,在pFloat的视角下地址都是float*,地址在内存中管理的空间上的数据是float类型的。我们要取出打印这个单精度浮点数,就要找到第1位符号位S,后面的8位指数E,最后的23位有效数字M。
由上面的二进制可知:S = 0,E = 00000000,M = 00000000000000000001001
因为E为全0,所以指数E应该为1 - 127 = -126,有效数字M不在是1.xxxxx…的小数,而是还原为0.xxxx…的小数。
因此,浮点数V就写成了:

V = (-1)^0 * 0.00000000000000000001001 * 2^(-126)

很显然,V是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000

存储浮点数:
我们再看例题的第二部分,pFloat指向的数据(n的地址所管理的空间上的数据)已经被改为了float类型数据9.0。
但在int 类型的n的视角下,还把float类型的9.0当作整型,以整型的形式打印9.0。
我们先来思考一下9.0在内存中的32位二进制是什么样的?

9.0 -->1001.0 --> (-1)^0 * 1.001 * 2^3 --> S = 0, M = 1.001, E(十进制) = 3 + 127 = 130

所以,二进制中第一位符号位S = 0,有效数字位为001后面补0,凑满23位,
指数E为130的二进制 = 10000010 。

9.0的二进制即为:0 10000010 00100000000000000000000

转换成十进制正是 1091567616 。

4.总结

好啦,这就是本篇文章的所有内容了,本篇文章主要详细讲述了整型和浮点型数据在内存中的存储,两者有很大差异。最后,感谢大家的阅读,点赞收藏加关注,C语言学习不迷路!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/959626.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

树和二叉树基础

引言&#xff1a; 树是一种非线性的结构&#xff0c;也是由一个一个的结点构成。 树的一些基本概念&#xff1a; 节点的度&#xff1a;一个节点含有的子树的个数称为该节点的度&#xff1b;如上图&#xff1a;A的度为6 叶节点或终端节点&#xff1a;度为0的节点称为叶节点。…

聊天机器人将取代人工客服?电商界的超级“贵人”

聊天机器人在全球范围内取得了成功&#xff0c;目前有58%的 B2B公司和42%的 B2C公司使用聊天机器人&#xff0c;而且这个数字预计还会继续增长。原因有很多&#xff0c;聊天机器人能够模拟人类交互并每天 24小时提供客户服务。当客户有疑问时&#xff0c;不用等上几小时才能得到…

【RabbitMQ】RabbitMQ 服务无法启动。系统出错。发生系统错误 1067。进程意外终止。

问题描述 RabbitMQ 服务无法启动。 rabbitmq-service.bat startRabbitMQ 服务正在启动 . RabbitMQ 服务无法启动。系统出错。发生系统错误 1067。进程意外终止。原因分析 RabbitMQ和Erlang版本不匹配。 解决方案 查询并安装RabbitMQ版本对应Erlang版本 https://www.rabbitm…

[ROS]yolov8部署ROS

Yolov8是一种基于PyTorch深度学习框架的轻量级目标检测算法&#xff0c;具有高效、准确和快速的特点&#xff0c;因此在机器人领域得到了广泛的应用。而ROS&#xff08;Robot Operating System&#xff09;是一个用于机器人软件开发的框架&#xff0c;提供了各种工具和库&#…

高级DBA带你解决达梦国产数据库数据同步至clickhouse数据库通用方法(全中国唯一一份)关键技术讲解

步骤1、安装达梦8国产数据库 参考笔者之前写的博文&#xff0c;怎么安装国产达梦8数据库&#xff0c;按博文提前装好&#xff01; https://blog.csdn.net/nasen512/article/details/126872483 步骤2、安装好clickhouse数据库 参考笔者之前写过的博文&#xff0c;将clickho…

Hadoop HDFS 高阶优化方案

目录 一、短路本地读取&#xff1a;Short Circuit Local Reads 1.1 背景 ​1.2 老版本的设计实现 ​1.3 安全性改进版设计实现 1.4 短路本地读取配置 1.4.1 libhadoop.so 1.4.2 hdfs-site.xml 1.4.3 查看 Datanode 日志 二、HDFS Block 负载平衡器&#xff1a;Balan…

python通过docker打包执行

背景 正常情况下,python脚本执行需要安装有python环境,那python环境虽然也可以通过移植的方法来安装,那总归是比较麻烦的,下面通过docker打包的方式来执行python脚本 1、安装python镜像 准备两个文件即可,dockerfile、requirements.txt两个文件的内容分别如下 同目录下…

如何做好住宅区门禁监控,这回总算说全了

门禁监控在现代社会中已经变得愈发重要&#xff0c;特别是在住宅小区。随着城市化进程的加速和人口密度的增加&#xff0c;住宅小区的安全管理成为了一个至关重要的挑战。为了确保居民的安全和财产的保护&#xff0c;门禁监控系统逐渐成为了必备的设施之一。 客户案例 太原某小…

人大金仓V8数据库安装补充资料

之前写过一篇人大金仓数据库安装文档,自我感觉太过简练。这里补充一些资料。 命令行安装过程中,英文提示还比较简单。 安装默认第一项是完整安装,第二项是安装客户端软件,第三项是自定义安装。 这里选择了第一项。 File Path需要输入license文件的绝对路径且包括文件名。…

Jetpack Compose Accompanist最近的更新-2023年8月25日

Jetpack Compose Accompanist最近的更新-2023年8月25日 这篇文章更新了Jetpack Compose Accompanist库的情况&#xff0c;介绍了其目的和最新上传的功能&#xff0c;包括Pager、Flow Layout、Navigation Animation和Insets-UI。同时&#xff0c;提到了对一些库未来发展的讨论。…

光伏瓦屋顶

光伏瓦是由非晶硅材料制成的有光伏电池的屋面板&#xff0c;把光伏组件嵌入支撑结构&#xff0c;使太阳能板和建筑材料结为一体&#xff0c;直接应用于屋顶&#xff0c;和普通屋面瓦一样安装在屋面结构上。然后&#xff0c;光伏材料和组件将光转化为电能&#xff0c;通过吸收太…

5步搞定!!1Centos 7设置elasticsearch 7.12.1开机自启动

搞虚拟机玩&#xff0c;从网上看了很多es开机自启的方法&#xff0c;都试了&#xff0c;没有效果&#xff0c;最后尝试了shell脚本的方式&#xff0c;记录一下&#xff01; .sh文件内容&#xff1a; #!/bin/bash export JAVA_HOME/path/to/elasticsearch/jdk export JRE_HOME$…

Mybatis学习|基本的crud、数据库字段与对照类字段不一致问题

1.查询&#xff1a;根据id去查用户 在Dao层的UserMapper接口中增加根据id查用户的方法&#xff0c;定义方法名、传的参数以及返回值 在与UserMapper接口绑定的UserMapper.xml中配置该方法对应的sql语句 编写测试用例 2.增加&#xff1a;插入一个新用户 在Dao层的UserMapper接…

Spring源码分析(十)Bean实例化(下)

目录 1.1 循环依赖1.2 属性填充1.2.1 populateBean方法1.2.2 initializeBean方法执行Aware方法执行BeanPostProcessor后置处理器的前置处理方法执行初始化方法执行BeanPostProcessor后置处理器的后置处理方法&#xff1a;postProcessAfterInitialization()&#xff0c;允许对be…

低代码在未来会颠覆开发行业吗?

今天是正经男&#xff0c;我们严肃讨论一下一直以来争吵不休的取代问题。 低代码开发平台&#xff0c;低代码技术会取代开发人员么&#xff1f; 一、背景 低代码开发平台的普及&#xff0c;让很多公司对快速生成应用抱有很大期望。甚至有人认为&#xff0c;低代码开发平台未来会…

IntelliJ IDEA 2023.2.1 Android开发变化

IntelliJ IDEA 2023.2.1之前的版本&#xff0c;Empty Activity是指Empty View Activity&#xff0c;而现在Empty Activity是指Empty Compose Activity&#xff0c;另外多了一个Empty View Activity的选项 这表明官方推荐使用Compose这种声明式的编程方式来描述UI&#xff0c;命…

正中优配:炒股软件自动提示买卖点?

股票商场好像大海般改变多端&#xff0c;许多股民往往由于没有精确的生意点而错失良机&#xff0c;导致亏损惨重。在这种情况下&#xff0c;许多炒股爱好者就开始寻觅主动提示生意点的炒股软件&#xff0c;以便在股票商场中抢占先机。 可是&#xff0c;真的有这样奇特的炒股软…

如何给文件夹设置密码

文件夹怎么设置密码,如何给文件夹设置密码?有些重要的文件或比较隐私的文件存放在电脑上&#xff0c;这些文件我们只希望自己能看到并使用&#xff0c;不希望别人访问。那么&#xff0c;最好的办法就是去对这些文件进行加密。 才不怕别人看到自己的隐私&#xff0c;设置密码&a…

什么是RESTful API,Spring MVC如何支持RESTful架构

文章目录 &#x1f388;个人主页&#xff1a;程序员 小侯 &#x1f390;CSDN新晋作者 &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 ✨收录专栏&#xff1a;Java框架 ✨文章内容&#xff1a;Spring MVC支持RESTful架构 &#x1f91d;希望作者的文章能对你有所帮助&#xf…

问道管理:日换手率达20是好是坏?

关于股票商场的出资者而言&#xff0c;日换手率是一个非常重要的目标。日换手率是指股票当日买卖量与该股总股本之比。假如一只股票的日换手率过高&#xff0c;那么就意味着该股票的流动性较强&#xff0c;而假如日换手率过低&#xff0c;那么就意味着该股票的流动性较弱。 那…