目录
- 前言
- 一、数据的表示
- 1.数据与信息
- 2.计算机中的数据
- 3.计算机中数据的单位
- 二、数据的存储
- 三、数据的处理
- 1.进位计数值
- 2.进制间转换
- 四、字符编码
- 总结
前言
本小节主要介绍在计算机中数据的表示、存储与处理。要知道计算机内部使用二进制数据,也就是0和1组成的数据。要了解数据单位有哪几种,如何存储数据,有哪些进位计数值,如何转换。计算机字符编码是怎么回事。
一、数据的表示
1.数据与信息
- 数据是没有被分析和解释的原始或未加工的材料,比如数字、字符等。
- 信息则是已经被处理和组织,能够传达有意义的信息和知识的结果。
在计算机应用中,数据和信息的界限有时是模糊的。它们之间的区别并不是绝对的,取决于数据的处理方式和行业应用。
2.计算机中的数据
冯·诺依曼提出计算机使用二进制(17世纪至18世纪的德国数学家莱布尼茨第一个提出)。
计算机是使用二进制的形式来表示所有的数据和指令的。二进制(Binary)是一种数制,只包含0和1两个字符,是计算机系统中数据处理的最基本单位。
3.计算机中数据的单位
计算机中的数据单位主要有以下几种:
单位 | 说明 | |
---|---|---|
位(Bit) | 计算机中最基本的数据单位,它只有0和1两种状态。位是计算机处理信息的最小单位。 | |
字节(Byte) | 字节是计算机内存中存储、传输和处理信息的基本单位。 | 1Byte = 8Bit |
千字节(KB) | 千字节是计算机中常用的存储容量单位。 | 1KB= 1024Byte |
兆字节(MB) | 兆字节是计算机中大容量存储设备(如硬盘、光盘等)的常用容量单位。 | 1MB=1024KB |
吉字节(GB) | 吉字节是计算机中用于描述大型存储设备容量的单位。 | 1GB=1024MB |
太字节(TB) | 太字节是计算机中存储容量更大的单位。 | 1TB=1024GB |
遵循国际标准,数据单位一般采用二进制计算(每个单位等于1024的倍数),而非十进制计算(每个单位等于10的倍数)。
字长: 计算机中的字长是指CPU每次能够处理的二进制数据的位数,通常计算机的字长越长,处理速度和能力越强,所能表示的整数范围也就越广。
二、数据的存储
计算机中存储数据的最小单位是Bit,存储容量的基本单位是字节。
计算机中数据的存储可以分为两个方面:内存存储和外存储。
- 内存存储指的是计算机在运行程序时,所使用的内部存储器,通常被称为RAM (随机访问内存)。RAM在计算机关闭或断电时,其中的数据会被清除,因此数据的永久存储需要使用外存储方式。
- 外存储是指计算机中用来存储程序和数据的非易失性存储器,常见的外存储器包括机械硬盘(HDD)、固态硬盘(SSD)、USB闪存盘、CD/DVD光盘等。这些存储器的数据可以长期保留,即使关闭电源也不会丢失。
数据在计算机中的存储方式,通常以二进制的形式储存在计算机的内部存储器和外部存储器中。计算机通过操作二进制码来实现对数据的储存、传输和处理。
三、数据的处理
1.进位计数值
二进制(Binary) 八进制(Octonary)
十进制(Decimal) 十六进制(Hexadecimal)
二进制是计算机中最基本的进位计数值,使用数字 0 和 1 表示,也成为“二进制数(Binary)”。计算机内部的所有存储、传输和处理都是以二进制的形式进行的。
进位:逢2进1
二进制 | 十进制 | 二进制 | 十进制 | |
---|---|---|---|---|
0 | 0 | 101 | 5 | |
1 | 1 | 1010 | 10 | |
10 | 2 | 1100100 | 100 | |
11 | 3 | 11001000 | 200 | |
100 | 4 | 11111010000 | 2000 |
八进制是一种在计算机领域中用的进位计数值,使用数字 0 至 7 表示,每三个二进制位可以表示一个八进制数位。在一些程序设计语言和操作系统中,八进制数值可以用前缀数字0来表示。
进位:逢8进1
八进制 | 十进制 | 八进制 | 十进制 | |
---|---|---|---|---|
0 | 0 | 24 | 20 | |
1 | 1 | 36 | 30 | |
2 | 2 | 50 | 40 | |
10 | 8 | 144 | 100 | |
11 | 9 | 1750 | 1000 |
十六进制是另一种在计算机领域中用的进位计数值,使用数字 0 至 9 和字母 A 至 F(AF表示1015) 表示,每四个二进制位可以表示一个十六进制数位。在一些程序设计语言和操作系统中,十六进制数值可以用前缀0x或h来表示。
进位:逢16进1
十六进制 | 十进制 | 十六进制 | 十进制 | |
---|---|---|---|---|
0 | 0 | f | 15 | |
1 | 1 | 10 | 16 | |
2 | 2 | 64 | 100 | |
a | 10 | 3e8 | 1000 | |
b | 11 | 2710 | 10000 |
2.进制间转换
二进制转为十进制(按权展开求和)将二进制的数写成加权系数展开式,而后根据十进制的加法规则进行求和。
11001 = 1x 2 4 2^{4} 24+1x 2 3 2^{3} 23+0x 2 2 2^{2} 22+0x 2 1 2^{1} 21+1x 2 0 2^{0} 20=25
规律:个位上的数字的次数是0,十位上的数字的次数是1,…,依次递增,而十分位的数字的次数是-1,百分位上数字的次数是-2,…,依次递减。
十进制转为二进制(除2取余,逆序排列)用2整除十进制整数,可以得到一个商和余数;再用2去除商,又会得到一个商和余数,如此进行,直到商为小于1时为止,然后把先得到的余数作为二进制数的低位有效位,后得到的余数作为二进制数的高位有效位,依次排列起来。
53
2
\sqrt[2]{53}
253=26…1
26
2
\sqrt[2]{26}
226=13…0
13
2
\sqrt[2]{13}
213=6…1
6
2
\sqrt[2]{6}
26=3…0
3
2
\sqrt[2]{3}
23=1…1
1
2
\sqrt[2]{1}
21=0…1
由下往上依次排列所得余数:110101
四、字符编码
计算机字符编码是将文本字符映射到数字代码的过程。 由于计算机只能处理数字,因此需要一种方式将文本字符转换成数字,在计算机内部进行处理和存储。字符编码就是描述如何将字符映射为数字的一组规则。
常见的字符编码包括ASCII码、Unicode、UTF-8等。
ASCII码是最早的字符编码方式,它使用7位二进制数来表示128个字符,包括英文字母、数字和一些标点符号。
Unicode是一种字符集标准,它将全世界所有的字符都标准化到一个集合中,使得不同的语言都可以使用相同的数字代码来表示字符。UTF-8是基于Unicode的一种变长字符编码方式,使用1到4个字节来编码每个字符。
通过字符编码,计算机可以在不同的系统和应用程序之间共享数据,并且支持多语言和跨语言通信。我们日常编程中一般设置编码为UTF-8。
总结
计算机中数据的表示、存储和处理,还有字符编码都需要了解。