写在开头
关于复习的相关内容其实从一开始就列出了大纲,但是迟迟没有开始复习,一方面是因为学校学业却是繁忙,另一方面还是内心对旧知识掌握不熟练需要再学一遍的畏惧和懒惰,但如今,复习必须开始了。今天我从C语言的最开始,数据存储开始讲起,慢慢回忆起尘封的往事---C语言。
C语言数据储存
数据类型的基本介绍
在C语言中,最基本的内置类型是必须要求掌握的。这也非常普遍的应用于我们的代码编写中。他们分别是
-
属于整型:
-
char (unsigned char & signed char)
-
short (unsigned short & signed short)
-
int (unsigned int & signed int)
-
long (unsigned long & signed long)
-
long long
-
-
属于浮点数
-
float
-
double
-
long double
-
-
属于构造类型
-
数组类型
-
结构体类型 struct
-
枚举类型 enum
-
联合类型 union
-
-
指针类型
-
空类型 (void) 通常用在函数的返回类型,函数参数,指针类型等。
整型在内存中的存储
在语言的层面,创建一个变量是在内存中开辟出空间,而开辟多少空间的依据是变量本身的类型。比如int 类型的变量在被分配空间时,会被分配4个字节,也就是32bit 位的空间。那么数据到底在所开辟出来的内存中是如何存储的呢?
原码、反码、补码
计算机中总共有三种对整数的二进制表示方法,分别是原码、反码、补码。
三种表示方法中,都有符号位和数值位两部分组成。符号位0为正,1为负。而数值位略微复杂,需要分为正数和负数两种情况,正数的原反补都相同,负数的三种表示方法均不同。下面介绍一下原码、反码和补码:
原码:直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码:原码的符号位不变,其他位依次按位取反得到反码。
补码:反码+1得到补码。
对于整型数据,内存中存放的是补码。
因为:在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理 (在CPU中只有加法器,利用补码可以做到加减统一处理);此外,补码和原码的相互转化,运算过程相同,不需要额外的硬件电路。
那我们可以尝试着算一下20 和 -10 在内存中的存储。
但是如果我们在VScode中输入
int main() { int a = 20; int b = -10; return 0; }
并且监视内存,可以发现a、b变量在内存中的显示分别为
a : 0x14 00 00 00 b : 0xf6 ff ff ff
它们在内存中显示的是0x前缀,代表是16进制,但是却与我们转化的恰好相反,这是因为大小端存储模式。
大小端模式
大端存储模式:数据的低位保存在内存的高地址中,数据的高位保存在内存的低地址中。
小端存储模式:数据的低位保存在内存的低地址中,数据的高位保存在内存的高地址中。
记忆方法:小->低->低,剩下相反。
为什么存在大小端模式之分:计算机系统以字节作为内存的单位,每个地址对应一个字节。对于位数大于8位 (bit) 的处理器,由于寄存器的宽度大于1字节,那么必然存在着多字节间排列的问题,因此导致了大端存储和小端存储。
常用机器一般采取小端模式。
//判断当前机器字节序列 int check_sys() { int i = 1; return (*(char*)&i); } int main() { int ret = cheack_sys(); if(ret == 1) { printf("小端"); } else{ printf("大端"); } return 0; }
浮点数的存储
浮点数的表示范围在 float.h 中定义。
根据国际标准IEEE754,任何一个二进制浮点数V可以表示成下面的形式:
(-1)^S * M * 2^E // (-1)^S 表示符号位。当S=0,V为正数;S=1,V为负数 // M代表有效数字,大于等于1,小于2。 //所以M只可能写成1.xxxxxxx的形式,计算机会默认略去小数点前面的1,只会保存小数位,这样可以节省1为有效数字。 // 2^E 表示指数位。E位一个无符号整数。但是科学计数法中指数位是可以出现负值的。所以IEEE754规定,存入内存时E的真实值必须加上中间数,32位浮点数,中间数位127,64位浮点数,中间数为1023. // 比如E = 10,保存成32位浮点数时,保存为10+127 = 137 // 就是带符号位的二进制的科学计数法
IEEE 754规定:
32位的浮点数,最高位的1位是符号位S,紧接着的8位是指数E,剩下的23位为有效数字M。
64位的浮点数,最高位的1位是符号位S,紧接着11位是指数E,剩下的52位为有效数字M。
指数E可以细分为三种情况。
-
二进制E不全为0或者不全为1
浮点数采用下面规则表示,E的计算值减去中间数(127 或者 1023),得到真实值。M加上第一位的1,得到真实的有效数字。
举例:
-
二进制E全为0 (极限接近0的小数)
浮点数的指数位E就等于 1 - 中间值,即为真实值。
M不再加上1,而是还原为0.xxxxxx的小数,用于表示极限接近于0的很小的数字。
-
二进制E全为1 (正负∞)
正负取决于符号位
数据存储小节完。