问题
使用两次sscanf()库函数从两个字符串中按照指定的格式读取数据,执行完毕后发现第一个正常读取的数据被篡改。项目在Ubuntu上使用CMake和Ninja构建项目,编译时没有错误和警告。
复现
为方便调试,在keil中编译stm32工程代替,为了更直观,将两个变量放在结构体中,并一字节对齐。伪代码如下:
char str[] = "15";
#pragma pack(1)
typedef struct{
uint8_t id;
uint16_t count;
}attr_t;
#pragma pack()
void test_func(void)
{
int ret = 0;
attr_t attr = {0,0x1234};
printf("&attr.id = %p &attr.count= %p\r\n",&attr.id,&attr.count);
printf("attr.count = 0x%04X\r\n",attr.count);
ret = sscanf(str, "%d", &attr.id);
if (ret != 1) {
printf("can't parse str\n");
}
printf("attr.count = 0x%04X attr.id = %d\r\n",attr.count,attr.id);
//proc_func(attr.count,attr.id);
}
输出结果如下:
理想情况下count的值应该是0x1234,执行sscanf()函数后的值确实是0x1234,但是在获取id值之后,这个数据就被篡改了。
原因
获取id时,id类型为unsigned char,而%d对应的是int类型,count和id变量相邻,因此被篡改。
更直观的把字符串str改为"123456"。
初始化时:
RAM内容:
获取id后
RAM内容:
串口输出:
123456十六进制为0x01E240,因此count值为0x01E2,id值为0x40(64)。
其他
其实在使用KEIL编译时,上面伪代码会报警告:
使用gcc编译时也会有警告:
因此,应该使用正确的格式来消除警告,同时要确保输入的字符串不能超出变量的取值范围。对于unsigned char
类型,格式可以使用%hhu,同时需要注意输入的字符串范围为0-255,超出范围后同样会导致数据溢出或截断,得到意想不到的结果。
在stm32下,同样是str为"123456",格式改为使用%hhu,此时没有警告,输出结果为:
格式 | 说明 |
---|---|
%d | 以十进制形式输入或输出有符号整数 |
%u | 以十进制形式输入或输出无符号整数 |
%i | 根据输入数据的格式自动判断是十进制、八进制还是十六进制整数,并进行相应的转换和存储。 |
%o | 以八进制形式输入或输出无符号整数 |
%x/%X | 以十六进制形式输入或输出无符号整数 |
%f | 以小数形式输入或输出单精度浮点数 |
%lf | 以小数形式输入或输出双精度浮点数 |
%e/%E | 以指数形式输入或输出浮点数 |
%c | 用于输入或输出单个字符 |
%s | 用于输入或输出字符串 |
%p | 以十六进制形式输出指针变量的值 |
%% | 用于输出一个%字符 |
%n | 不输入输出任何数据,而是将到目前为止已读取或输出的字符数存储到对应的变量中。通常用于与其他格式控制符配合使用,获取输入输出的字符数量。 |
另外还有%hhd表示char,%hhu表示unsigned char,占用一个字节;%hd表示short,%hu表示unsigned short,占用两个字节等特殊表示。