【C进阶】深度剖析数据在内存中的存储

news2024/11/24 8:45:12

目录

一、数据类型的介绍

1.类型的意义:

2.类型的基本分类

二、整形在内存中的存储

1.原码 反码 补码

2.大小端介绍

3.练习

三、浮点型在内存中的存储

1.一个例子

  2.浮点数存储规则


一、数据类型的介绍

前面我们已经学习了基本的内置类型以及他们所占存储空间的大小:

char          //字符数据类型

short         //短整型

int             //整形

long          //长整形

long long   //更长的整形

float           //单精度浮点型

double      //双精度浮点型

1.类型的意义:

1.使用这个类型开辟内存空间的大小(大小决定了使用的范围)

2.决定了如何看待内存空间的视角:

int 和float类型都是4个字节,但是一个是整形,一个是浮点型,看待内存空间的视角不一样

2.类型的基本分类

(1)整形家族:

char:

        unsigned char

        signed  char

short :

       unsigned short  [int]     //短整型,这个int整形可以省略

        signed  short   [int]

int :

      unsigned int

        signed  int

long :

       unsigned long [int]

        signed  long [int]

【温馨提示】:char类型也是整形家族的原因:

字符在内存中存储的是字符的ACSII码值(0-127),ASCII码值是整形,所以字符类型归类到整形家)族 

signed -有符号的:当第一位代表符号位的时候,就是有符号的

unsigned -无符号的:当每一位都是数值位,有效位的时候就是无符号的

【注意】:

当我们没有写signed和unsigned时,int,short和long类型默认就是signed有符号的

eg:当我们写出int a的默认的其实就是signed int类型

but :C语言并没有规定char是否是signed char(这个取决于编译器,大部分是signed char)


(2)浮点数家族:都可以表示小数

 float     //精度小一些,单精度

double   //精度大一些,双精度


(3)构造类型(自定义类型)

>数组类型

>结构体类型 struct

>枚举类型 enum

>联合类型 union


(4)指针类型

int *pi

char *pc

float *pf

void * pv  (无具体类型的指针)


(5) 空类型

void 表示空类型(无类型)

通常应用于函数的返回类型,函数的参数,指针类型

eg:int main(void)就表示main函数不需要参数

但是实际上main函数是有三个参数的int main(int argc,char *argv[  ],char *envp[  ]),这三个参数需要用的时候才需要写,不需要括号直接写void即可

二、整形在内存中的存储

计算机能够处理的是二进制数据,整形和浮点型在内存中也都是以二进制的形式进行存储的

1.原码 反码 补码

整形的二进制表示有三种:原码,反码,补码

正的整数:原码,反码,补码相同

负的整数:原码,反码,补码要进行计算

整数在内存中存储的是补码的二进制序列

eg:

int a = -10;//int类型占4个字节-32bit位
    10000000 00000000 00000000 00001010  原码
    11111111 11111111 11111111 11110101  反码
    1 1111111 11111111 11111111 11110110  补码(最高一位表示符号位,其他31位表示数值位)

    unsigned int b = -10;
    1 1111111 11111111 11111111 11110110  补码(32位全都表示数值位)


对于整形来说,数据存放内存中其实存放的是补码

为什么呢?

使用补码,可以将符号位和数值域统一处理;同时,加减法也可以统一处理(cpu只有加法器),此外,补码和原码相互转换,其运算过程是相同的,不需要额外的硬件电路

eg:

    1-1
    电脑转化为1+(-1)
    00000000 00000000 00000000 00000001  1的原反补码
    10000000 00000000 00000000 00000001  -1的原码
    11111111 11111111 11111111 11111110  -1的补码
    11111111 11111111 11111111 11111111  -1的补码
    如果就是简单的原码相加得到的就是-2(还会犹豫要不要加符号位)
    但是如果是补码相加得到的就是正确的结果,每个位上不断进1,最后最前面多出来一位为1直接舍弃,其他位都为0

2.大小端介绍

int a=0x11223344(根据数据的存储44位于低字节处,11位于高字节处)

大端字节序存储:

把一个数据的低位字节处的数据存放在内存的高地址处,高位字节处的数据存放在内存的低地址处

小端字节序存储:

把一个数据的低位字节处的数据存放在内存的低地址处,高位字节处的数据存放在内存的高地址处

【注意】:数据存放的时候是以字节为单位存储讨论顺序的,所以叫做大小端字节序存储

char类型不需要考虑大小端,char类型就占一个字节,没有顺序可言


为什么存在大小端字节序存储呢?

这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式


百度笔试题:

请简述大端字节序和小端字节序的概念,设计一个程序来判断当前机器的字节序

思路:

给一个int类型的变量a:让其为1(这样十六进制简单0x 00 00 00 01),然后再通过char*一次访问一个字节,打印出来看是00还是01,从而判断大小端

代码实现:

#include<stdio.h>
int main()
{
	int a = 1;
	char* p = (char*)&a;   //要将&a(int *)强制转化为char *
	if (*p == 1)
		printf("小端\n");
	else
		printf("大端\n");
	return 0;
}

【自定义函数进行判断】:

#include<stdio.h>
int check_sys()
{
	int a = 1;
	return *(char*)&a;
}
int main()
{
	if(check_sys()==1)
		printf("小端\n");
	else
		printf("大端\n");
	return 0;
}

3.练习

<1>下面程序输出什么?

#include <stdio.h>
int main()
{
char a= -1;
signed char b=-1;
unsigned char c=-1;

printf("a=%d,b=%d,c=%d",a,b,c);

return 0;
}

答案:

-1 -1 255

解释:

首先-1是整数,原码:10000000 00000000 00000000 00000001

                         反码:111111111 111111111 111111111 111111110

                         补码:111111111 111111111 111111111 111111111

但是char类型只有8个比特位,所以补码存起来就是111111111,而且第一位为符号位(对于a和b)

%d是10进制的形式打印有符号的整数

那么就需要进行整形提升(无符号数高位补0,有符号数高位补符号位)(对原码整形提升)

对于a和b:整形提升后补码为111111111 111111111 111111111 111111111(也就是-1)

对于c:整形提升后补码为00000000 00000000 00000000 111111111(又因为是无符号的整形,补码和原码一样)(也就是255)


 <2>下面程序输出什么?

#include <stdio.h>
int main()
{
	char a = -128;
	printf("%u\n", a);
	return 0;
}

答案:

4294967168

解释:

-128的原码:10000000 00000000 00000000 10000000

           反码:111111111 111111111 111111111 011111111

           补码:111111111 111111111 111111111 10000000

存进a的补码:10000000(1为符号位)

对a进行整形提升:111111111 111111111 111111111 10000000(有符号位高位补符号位1)

%u是10进制的形式打印无符号的整数

那么打印就当a是无符号数打印,对于无符号数原反补码相同,直接算即可


 <3>下面程序输出什么?

#include <stdio.h>
int main()
{
	char a = 128;
	printf("%u\n", a);
	return 0;
}

答案:

4294967168

解释:

虽然signed char最大只能是127,但是还是可以赋值为128,可以自行截断

128的原码:00000000 00000000 00000000 10000000

存进a的补码:10000000(1为符号位)

对a进行整形提升:111111111 111111111 111111111 10000000(有符号位高位补符号位1)

10进制无符号形式打印


【总结】: 

signed char:-128~127

char-假设是有符号的char(1个字节=8bit) (第一位为符号位)第一列为原码

00000000   0

00000001   1

00000010   2

00000011   3

...                ...

011111111  127

10000000 -128  11111111(反) 110000000(补:多出来一位要删去)

10000001  -127  11111110           111111111

...

111111110  -2      10000001            10000010

111111111  -1      10000000            10000001

259545bbc6cc455e84e6d31bce030392.png  

假设是unsigned char:0~255

 00000000

00000001   1

00000010   2

00000011   3

...                

011111111  127

10000000  128

...

111111110  254

111111111  255

f55ff4f0670841ef97bf266f8929b3c7.png


  <4>下面程序输出什么?

int i= -20;
unsigned int j = 10;
printf("%d\n", i+j);

答案:

-10

解释:

-20:原码:10000000 00000000 00000000 00010100

         反码:111111111 111111111 111111111 11101011

         补码:111111111 111111111 111111111 11101100

10:原反补码:00000000 00000000 00000000 00001010(相加时最高位变为符号位)

补码进行相加:111111111 111111111 111111111 11110110(补码)

反码:10000000 00000000 00000000 00001001

原码:10000000 00000000 00000000 00001010(-10)


   <5>下面程序输出什么?

unsigned int i;
for(i = 9; i >= 0; i--)
{
printf("%u\n",i);
}

答案:

9到0再到4294967295,一直减小,死循环

解释:

unsigned int的范围就是>=0的,所以for循环的判断条件恒成立,类比unsigned char当0继续减小,就到了255,unsigned int也是这样的


    <6>下面程序输出什么?

int main()
{
char a[1000];
int i;
for(i=0; i<1000; i++)
{
a[i] = -1-i;
}
printf("%d",strlen(a));
return 0;
}

答案:

255

解释:

strlen是统计\0(也就是0)之前的字符个数

a[ i ]里面放的是-1,-2,-3...-128 127 ...6 5 4 3 2 1 0

一共就是128+127=255个数


     <7>下面程序输出什么?

#include <stdio.h>
unsigned char i = 0;
int main()
{
for(i = 0;i<=255;i++)
{
printf("hello world\n");
}
return 0;
}

答案:

死循环

解释:

unsigned char的范围就是0-255,for循环的条件恒成立,进入死循环


三、浮点型在内存中的存储

常见的浮点数:

3.14159

1E10(也就是1.0*10^10)

浮点数家族包括:float,double,long double类型

浮点数表示的范围:float.h中定义

1.一个例子

int main()
{
int n = 9;
float *pFloat = (float *)&n;
printf("n的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
*pFloat = 9.0;
printf("num的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
return 0;
}

结果:

ce965ae2386e42bd865ff15d005098d2.png


  2.浮点数存储规则

任意一个二进制浮点数V可以表示成下面的形式

8e461bb8b5c646cfb73859976bcddd99.png

eg:10进制的5.5转化为二进制

101.1(小数点后面一位就是2的-1次方也就是0.5)

二进制浮点数表示也就是(-1)^0*1.011*2^2(小数点提前两位,也就是*2^2(二进制),如果是十进制就是2^10) 

得出:S=0,M=1.011,E=2


对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M

91b86202a4ac410298f2f938092a3cb4.png
对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M
 da94adf1bdbd42eb97effc98d4bd4e81.png


有效数字M的存储:

对于有效数字M,1<=M<2,在计算机内部保存M的时候,默认小数点前面一位为1,所以保存只保存小数点后面的数字,这样就节省了一位数的空间,以32位为例,虽然留给M只有23位,但是相当于保存了24位有效数字 

有效数字E的存储:

 首先E是一个为无符号数,如果E为8位,它的取值范围为0-255;如果E为11位,它的取值范围为0-2047。存入E的真实值时必须加上一个中间值,对于8位的E这个中间值为127,对于11的E,这个中间值为1023

eg:2^10的E为10,所以保存32位浮点数时,必须保存成10+127=137,即10001001

 指数E从内存中取出还可以再分成三种情况:

(1)E不全为0或不全为1:

指数E的计算值减去127(或1023),得到真实值,再将M小数点前面的1补上

eg:

0.5的二进制为0.1,浮点数表示:1.0*2^(-1),E存储为-1+127=126,也就是01111110,而尾数1.0去除1就是0,那么0.5的二进制表示形式就是:

0 01111110 00000000000000000000000

(2)E全为0:

这时浮点数的指数E等于1-127(或者1-1023)即为真实值

M这时也不需要加上小数点前面的1,而是还原成0.xxxx的小数,这样做是为了表示正负0,以及接近于0的很小的数

(3)E全为1:

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s)


 现在再来解释一下前面的例子:

从int类型的9来看:

int n=9;

00000000 00000000 00000000 00001001(int类型二进制)

但是当它强制类型转化为float*时,代表的含义就不一样了

0 00000000 00000000000000000001001

这时的E为全0,那么E=-126,M也不用补0,即M=0.00000000000000000001001,S=0

那么*pFloat也就是(-1)^0*0.00000000000000000001001*2^(-126),这个数是极其小的,打印出来就直接是0.000000(float打印小数点后6位)

从float类型的9.0来看:(当*pFloat=9.0以后)

9.0(1001.0)

浮点型表示形式:(-1)^0*1.001*2^3

二进制表示:0 10000010 00100000000000000000

然后%d形式打印:n的视角看这是补码,符号位是0,为正数,原反补码相同,转化为10进制也就是1091567616


本次内容就到此啦,欢迎评论区或者私信交流,觉得笔者写的还可以,或者自己有些许收获的,麻烦铁汁们动动小手,给俺来个一键三连,万分感谢 ! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/949999.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PyTorch 深度学习实践 第10讲刘二大人

总结&#xff1a; 1.输入通道个数 等于 卷积核通道个数 2.卷积核个数 等于 输出通道个数 1.单通道卷积 以单通道卷积为例&#xff0c;输入为&#xff08;1,5,5&#xff09;&#xff0c;分别表示1个通道&#xff0c;宽为5&#xff0c;高为5。假设卷积核大小为3x3&#xff0c…

直线模组选型的参考要素有哪些?

直线模组在自动化行业领域使用广泛&#xff0c;在不同设备运用直线模组&#xff0c;相对来说区别还是比较大的&#xff0c;而选择直线模组也是有很多要素决定的&#xff0c;因此懂得直线模组的选型也是至关重要的。 很多人都觉得选型是比较困难的&#xff0c;尤其是对于公司采购…

Ansible学习笔记10

1、在group1的被管理机里的mariadb里创建一个abc库&#xff1b; 1&#xff09; 然后我们到agent主机上进行检查&#xff1a; 可以看到数据库已经创建成功。 再看几个其他命令&#xff1a; #a组主机重启mysql&#xff0c;并设置开机自启 ansible a -m service -a "namemy…

Java中异或操作和OTP算法

最近在研究加密算法&#xff0c;发现异或操作在加密算法中用途特别广&#xff0c;也特别好用。下面以Java语言为例&#xff0c;简单记录一下异或操作&#xff0c;以及在算法中的使用&#xff0c;包括常用的OTP算法。 一&#xff0c;异或操作特征 1&#xff0c; 相同出0&#…

二分类问题使用rmse训练会是什么结果

通常情况下&#xff0c;使用均方根误差&#xff08;RMSE&#xff0c;Root Mean Square Error&#xff09;来训练二分类问题可能并不是最优选择&#xff0c;因为RMSE通常用于衡量连续值的预测误差&#xff0c;而不是分类问题。二分类问题更常用的衡量标准是交叉熵损失&#xff0…

行业追踪,2023-08-30

自动复盘 2023-08-30 凡所有相&#xff0c;皆是虚妄。若见诸相非相&#xff0c;即见如来。 k 线图是最好的老师&#xff0c;每天持续发布板块的rps排名&#xff0c;追踪板块&#xff0c;板块来开仓&#xff0c;板块去清仓&#xff0c;丢弃自以为是的想法&#xff0c;板块去留让…

java八股文面试[数据库]——MySql聚簇索引和非聚簇索引索引区别

聚集索引和非聚集索引 聚集索引和非聚集索引的根本区别是表记录的排列顺序和与索引的排列顺序是否一致。 1、聚集索引 聚集索引表记录的排列顺序和索引的排列顺序一致&#xff08;以InnoDB聚集索引的主键索引来说&#xff0c;叶子节点中存储的就是行数据&#xff0c;行数据在…

使用errors.Wrapf()代替log.Error()

介绍不同语言的错误处理机制: Error handling patterns[1] Musings about error handling mechanisms in programming languages[2] 项目中 main调func1&#xff0c;func1调取func2... 这样就会出现很多的 if err ! nil { log.Printf()} , 在Kibana上查看时会搜到多条日志, 需要…

解决iPad故障问题的三种重置方式:出厂恢复、软重置和强制重启

这篇文章解释了如何重新启动iPad,以及如果它没有响应,如何强制它重新启动。它还包括如何重置iPad的其他选项。 一、重启iPad的最简单方法(所有型号) 基本的重新启动是最容易做到的,也是遇到硬件问题时应该尝试的第一件事。该过程不会删除你的数据或设置。请执行以下步骤…

源码编译安装opencv4.6.0,别的版本也行

1.下载opencv4.6.0 系统: ubuntu 1804 64位点我下载opencv 4.6.0 https://codeload.github.com/opencv/opencv/zip/refs/tags/4.6.0 2.编译安装opencv4.6.0 进入到下载目录下: unzip -qo opencv-4.6.0.zip -d ./ cd opencv-4.6.0 mkdir build cd build cmake -D…

六、事务-5.事务隔离级别

一、概念 从上至下&#xff0c;隔离级别越来越高&#xff0c;数据越来越安全&#xff0c;性能越来越低。 读未提交read uncommitted —— 隔离级别最低&#xff08;数据安全性最差&#xff09;&#xff0c;性能最好串行化serializable ——隔离级别最高&#xff0c;性能最差 …

【GNN+异常检测】Deep Anomaly Detection on Attributed Networks

文章目录 论文简介摘要属性网络相关介绍存在的问题论文贡献1. 提出的模型 - Dominant2. 实验 论文简介 原文题目&#xff1a;Deep Anomaly Detection on Attributed Networks 中文题目&#xff1a;基于属性网络的深度异常检测 发表会议&#xff1a;SIAM International Conferen…

Java“魂牵”京东店铺所有商品数据接口,京东店铺所有商品API接口,京东API接口申请指南

要通过京东的API获取店铺所有商品数据&#xff0c;您可以使用京东开放平台提供的接口来实现。以下是一种使用Java编程语言实现的示例&#xff0c;展示如何通过京东开放平台API获取整店商品数据&#xff1a; 首先&#xff0c;确保您已注册成为京东开放平台的开发者&#xff0c;…

快速提升代码性能:FastAPI多线程的利用

在现代网络应用中&#xff0c;高性能和快速响应是至关重要的&#xff0c;Python 的 FastAPI 框架以其出色的性能和简单易用的特点&#xff0c;成为了许多开发者的首选。然而&#xff0c;在某些场景下&#xff0c;单线程运行可能无法满足需求&#xff0c;这时候就需要考虑使用多…

【AutoLayout案例08-基于AutoLayout的动画 Objective-C语言】

一、好,那么,再给大家说一个什么呢 1.再给大家说一个,这么一个东西, 我们之前,通过frame,是不是可以通过animateWithDuration,可以执行动画吧 通过直接设置frame的方式,可以执行动画, 我们这里,通过约束,的方式, 也可以执行动画, 通过约束,也可以执行动画, …

基于FlaUI自动化+chatGPT实现微信自动回复

先看效果图 本次主要介绍如何实现自动回复&#xff1a; 1.将文件传输助手置顶&#xff0c;模拟鼠标点击文件传输助手&#xff1b; 2.一直刷新会话列表&#xff0c;有新的消息就需要回复内容&#xff1b; 3.当刷新到新的消息时&#xff0c;模拟鼠标点击到对应的会话人&#x…

擦除信道(erasure channel)

定义 二进制擦除通道&#xff08;BEC&#xff09;是一种信道模型。发送端发送一个比特&#xff08;0或1&#xff09;&#xff0c;接收端要么正确接收该比特&#xff08;0或1&#xff09;&#xff0c;要么以概率 P e P_{e} Pe​接收到该比特没有被接收的信息&#xff08;即“擦除…

公司电脑文件数据透明加密、防泄密系统

一套利用驱动层透明加密技术实现电子文件安全加密的防护产品&#xff0c;从源头上保障数据安全和使用安全的加密系统。该系统遵循基于文件生命周期安全防护的思想&#xff0c;集成了密码学、访问控制和审计跟踪等技术手段&#xff0c;对企事业单位电子文件的存储、访问、传播和…

【UE 材质】实现角度渐变材质、棋盘纹理材质

目标 步骤 一、角度渐变材质 1. 首先通过“Mask”节点将"Texture Coordinate" 节点的R、G通道分离 2. 通过“RemapValueRange”节点将0~1范围映射到-1~1 可以看到此时R通道效果&#xff1a; G通道效果&#xff1a; 继续补充如下节点 二、棋盘纹理材质 原视频链接&…

Docker(三) 创建Docker镜像

一、在Docker中拉取最基本的Ubuntu系统镜像 搜索Ubuntu镜像 Explore Dockers Container Image Repository | Docker Hub 下载镜像 docker pull ubuntu:22.04 二、在镜像中添加自己的内容 使用ubuntu镜像创建容器 docker run -it ubuntu:20.04 /bin/bash 在容器中创建了一个文…