本篇博客继续讲解C语言string.h头文件中的库函数。本篇博客计划讲解3个函数,分别是:strstr, strtok, strerror。其中strstr函数我会用一种最简单的方式模拟实现。
strstr
char * strstr ( const char * str1, const char * str2 );
strstr可以在str1中查找str2第一次出现的位置,并且返回一个指针指向该位置。如果找不到,就返回NULL指针。
比如:
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[] = "abcccccdecccdefg";
char arr2[] = "cccd";
char* ret = strstr(arr1, arr2);
if (ret == NULL)
printf("找不到\n");
else
printf("%s\n", ret);
return 0;
}
输出结果:
由于返回了cccd第一次出现的位置,顺着该地址往后打印,就有了以上的结果。
这个函数的使用是非常简单的,它的难点在于如何实现。有一些比较复杂的算法,比如KMP算法,可以实现类似的功能,但是难度较大,不适合初学者,这里我使用一种暴力查找的思路来实现。
首先,搭出框架:
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
const char* cp = str1;
while (*cp)
{
cp++;
}
}
我的想法是,先用cp指针,指向str1的位置,然后使用该指针向后遍历str1这个字符串,看看能不能找到str2,如果找到了就返回cp指针。那每次如何查找呢?可以再定义2个指针s1和s2,s1从cp的位置向后遍历,s2从str2的位置向后遍历。
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
const char* cp = str1;
const char* s1 = str1;
const char* s2 = str2;
while (*cp)
{
s1 = cp;
s2 = str2;
cp++;
}
}
s1和s2指向的字符,如果相等,就遍历下一对,如果s2遇到了\0
,就说明找到了。
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
const char* cp = str1;
const char* s1 = str1;
const char* s2 = str2;
while (*cp)
{
s1 = cp;
s2 = str2;
while (*s1 && *s2 && *s1 == *s2)
{
++s1;
++s2;
}
if (*s2 == '\0')
{
return (char*)cp;
}
cp++;
}
return NULL;
}
strtok
char * strtok ( char * str, const char * sep );
strtok这个函数较为复杂,想要理解并且灵活使用,需要理解以下几点:
- strtok是用来分割字符串的。有些时候,我们想根据某些分隔符来分割一个字符串,就可以使用strtok。比如:
"fish@qq.com"
,如果我们想根据@
和.
这2个分隔符来分割该字符串,就可以分割成3个字符串,分别是:fish
,qq
,com
。 - strtok的第1个参数是待分割的字符串。第2个参数是分隔符的集合,即分隔符(一些字符)组合成的字符串。比如,如果我们想用
@
和.
来分割fish@qq.com
这个字符串(假设把这个字符串存储到了字符数组arr中char arr[] = "fish@qq.com";
),可以这么写:char* ret = strtok(arr, "@.");
。其中"@."
是由1个或多个分隔符组成的字符串。 - 如果“正常”调用该函数,即使用第2点的方式,strtok函数会找到字符串中的第1个分隔符出现的地方,把这个分隔符改成
\0
,并且返回由该分隔符分割的字符串(这个字符串在分隔符前面)。这么说有点抽象,以第2点的例子为例,strtok会在arr中找到第一个@,把@改成\0
,此时arr数组存储的就是:"fish\0qq.com"
,函数会返回f的地址,此时如果使用printf以%s的格式打印这个返回的地址printf("%s\n", ret);
,就会打印出fish。 - 如果调用该函数时,第一个参数为NULL指针,函数会从同一个字符串上次查找到的分隔符的位置开始向后找,找到下一个分隔符,然后返回以该分隔符分割的字符串(这个字符串在分隔符前面)。比如,假设已经像第2、3点所示调用过一次strtok函数了,如果再这么调用:
ret = strtok(NULL, "@.");
,函数就会找到.
所在的位置,并把.
改成\0
,此时arr中存储的就是:"fish\0qq\0com"
,函数会返回第一个q的地址,此时以同样的方式printf("%s\n", ret);
打印这个返回值,就会打印qq。同理,再调用一次ret = strtok(NULL, "@.");
,然后再打印printf("%s\n", ret);
就会打印出com。 - 如果函数没有找到下一个标记,就会返回NULL指针。
所以,根据以上知识点,如果我想要分割一个字符串"hello@world.nihao-shijie@this+is@a.test"
,可以使用一个循环来搞定。注意,一般来说,我们都会先把这个字符串拷贝一份,再来做分割,因为strtok函数会改变原字符串。
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "hello@world.nihao-shijie@this+is@a.test";
char bak[100] = { 0 };
strcpy(bak, arr);
const char* sep = "@.+-";
char* ret = strtok(arr, sep);
while (ret)
{
printf("%s\n", ret);
ret = strtok(NULL, sep);
}
return 0;
}
只有第一次调用是“正常”调用,其他每次调用第一个参数都传NULL指针,这样就会从上次找到的位置接着向后找。哪次没有找到就会返回NULL指针,跳出循环。
输出结果:
strerror
char * strerror ( int errnum );
strerror函数会返回错误码对应的错误信息。使用起来非常简单,比如我强行制造一个错误,让malloc函数开辟很大一块空间。当然,strerror智能检测库函数调用时的错误。
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <errno.h>
int main()
{
size_t n = -1; // 制造一个很大的数
int* p = (int*)malloc(n);
if (p == NULL)
{
printf("malloc: %s\n", strerror(errno));
return 1;
}
// ...
free(p);
p = NULL;
return 0;
}
可以发现,malloc函数开辟空间失败时,使用strerror,把错误码errno转换成了一个字符串,并且返回这个字符串的起始位置。顺着这个位置打印,就打印出了错误信息:“Not enough space”。
errno是一个全局变量,如果库函数调用失败,就会设置错误码,而strerror就可以把该错误码转换成错误信息。注意,errno的使用需要引用头文件errno.h。
当然,如果只想打印错误信息,可以直接使用perror函数,比如以上程序就可以把printf("malloc: %s\n", strerror(errno));
换成perror("malloc");
。各位可以自行验证,以上2句代码是完全等价的。
总结
- strstr函数可以在一个字符串中查找子串,如果找到,就返回第一次出现的位置;如果找不到返回NULL指针。
- strtok函数可以分割一个字符串。如果“正常”调用,即第一个参数不为NULL,就会去找分隔符第一次出现的位置;如果第一个参数为NULL,就会从上一次找到的位置开始向后找。
- strerror可以把错误码转换成错误信息。当库函数调用出现错误时,编译器会把错误码保存到errno这个全局变量中,而strerror可以把errno对应的错误码转换成错误信息。
感谢大家的阅读!