文章目录
- 前言
- 一、什么是大小端
- 二、如何判断大小端
- 三、大小端的转换
- 3.1 使用标准库函数
- 3.2 手动实现大小端转换
前言
本文主要探讨计算机中大小端的相关概念以及如何进行大小端的判断和转换等。
一、什么是大小端
大小端(Endianess)是指计算机系统在存储多字节数据时,字节的顺序,即存储数据的字节顺序。
计算机系统的内存是以字节为单位进行划分的,每个地址单元都对应着一个字节,一个字节的大小为8bit,可以存放一个8位的二进制数,比如10101010。但是在C语言中除了8bit的char类型之外还有16bit的short类型,32bit的long类型,这主要取决于具体的编译器。且对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于1个字节,那么必然存在着如何将多个字节安排进入内存的问题,因为就产生的大端存储模式和小端存储模式。
如下所示为数据0x12345678在计算机存储器中的大小端存储模式。
大端(Big Endian): 数据的高位字节存放在低地址,低位字节存放在高地址。
小端(Little Endian): 数据的低位字节存放在低地址,高位字节存放在高地址。
二、如何判断大小端
以下是一些常见处理器架构及其对应的字节序(大小端)总结表:
处理器架构 | 字节序 |
---|---|
Intel x86 | Little-Endian |
Power-PC | Big-Endian |
ARM | 默认 Little-Endian |
STM32 | Little-Endian |
判断系统的字节序(大小端)主要依赖于检查内存中数据的排列方式,例如我们可以通过定义一个联合体,将一个整型数据的地址与字符数组的地址重叠,从而通过查看存储顺序来判断字节序。
#include <stdio.h>
typedef union {
int i;
char c[4]; // 假设 int 是 4 字节
} Endianness;
int main() {
Endianness e;
e.i = 0x01020304; // 设定一个已知的整数
if (e.c[0] == 0x04) {
printf("小端\n");
} else if (e.c[0] == 0x01){
printf("大端\n");
}
return 0;
}
三、大小端的转换
在处理数据时,尤其是在网络通信和文件读写中,可能需要在大端(Big Endian)和小端(Little Endian)之间进行转换。以下是几种常见的大小端转换方法,包括使用标准库函数和手动实现。
3.1 使用标准库函数
在许多C标准库中,提供了网络字节序的转换函数,可以用来进行大小端的转换。以下是几个常用的函数:
- htonl():将主机字节顺序转换为网络字节顺序(32位整数)
- htons():将主机字节顺序转换为网络字节顺序(16位整数)
- ntohl():将网络字节顺序转换为主机字节顺序(32位整数)
- ntohs():将网络字节顺序转换为主机字节顺序(16位整数)
示例代码:
#include <stdio.h>
#include <arpa/inet.h>
int main() {
uint32_t num = 0x12345678;
uint32_t converted_num = htonl(num); // 转换为网络字节序(大端)
printf("Original: 0x%x\n", num);
printf("Converted: 0x%x\n", converted_num);
uint32_t back_to_host = ntohl(converted_num); // 转换回主机字节序
printf("Back to Host: 0x%x\n", back_to_host);
return 0;
}
编译输出如下:
jeff@jeff:/tmp$ gcc -o test test.c
jeff@jeff:/tmp$ ./test
Original: 0x12345678
Converted: 0x78563412
Back to Host: 0x12345678
jeff@jeff:/tmp$
3.2 手动实现大小端转换
如果没有标准库可用,可以手动实现大小端的转换,以下是一个手动转换32位和16位整数的示例。
32位整数转换
uint32_t swap_uint32(uint32_t num) {
return ((num >> 24) & 0xff) | // 取出最高字节并移到最低位
((num >> 8) & 0xff00) | // 取出次高字节并移到次低位
((num << 8) & 0xff0000) | // 取出次低位并移到次高位
((num << 24) & 0xff000000); // 取出最低位并移到最高位
}
16位整数转换
uint16_t swap_uint16(uint16_t num) {
return (num >> 8) | (num << 8);
}
原理分析:
这里简单讲一下32位整数的转换原理,比如传进一个num = 0x12345678,那么我们的目的是想要输出num = 0x78563412。
0x12345678 的二进制形式为 00010010 00110100 01010110 01111000
1. 取出最高字节并移到最低位
(num >> 24) & 0xff
即
00000000 00000000 00000000 00010010 &
00000000 00000000 00000000 11111111
结果为
00000000 00000000 00000000 00010010
2. 取出次高字节并移到次低位
(num >> 8) & 0xff00
即
00000000 00010010 00110100 01010110 &
00000000 00000000 11111111 00000000
结果为
00000000 00000000 00110100 00000000
3. 取出次低位并移到次高位
(num << 8) & 0xff0000
即
00110100 01010110 01111000 00000000 &
00000000 11111111 00000000 00000000
结果为
00000000 01010110 00000000 00000000
4. 取出最低位并移到最高位
(num << 24) & 0xff000000
即
01111000 00000000 00000000 00000000 &
11111111 00000000 00000000 00000000
结果为
01111000 00000000 00000000 00000000
最后再将结果进行或运算就得到0x78563412了,其实说白了就是用左移、右移操作符进行数据位的移动,然后用按位与提取指定数据位,最后再用按位或将数据拼接在一起。
示例代码:
#include <stdio.h>
#include <stdint.h> // 添加此行以包含 uint32_t 和 uint16_t 的定义
uint32_t swap_uint32(uint32_t num) {
return ((num >> 24) & 0xff) |
((num >> 8) & 0xff00) |
((num << 8) & 0xff0000) |
((num << 24) & 0xff000000);
}
uint16_t swap_uint16(uint16_t num) {
return (num >> 8) | (num << 8);
}
int main() {
uint32_t num32 = 0x12345678;
uint16_t num16 = 0x1234;
uint32_t converted32 = swap_uint32(num32);
uint16_t converted16 = swap_uint16(num16);
printf("Original 32-bit: 0x%x, Converted: 0x%x\n", num32, converted32);
printf("Original 16-bit: 0x%x, Converted: 0x%x\n", num16, converted16);
return 0;
}
编译输出如下:
jeff@jeff:/tmp$ gcc -o test2 test2.c
jeff@jeff:/tmp$ ./test2
Original 32-bit: 0x12345678, Converted: 0x78563412
Original 16-bit: 0x1234, Converted: 0x3412
jeff@jeff:/tmp$