文章目录
- 1.字符函数
- 1.1 字符分类函数
- 1.1.1 islower
- 1.2 字符转换函数
- 1.2.1 tolower
- 2.字符串函数
- 2.1 strlen
- 2.2 strcpy和strncpy
- 2.3 strcat和strncat
- 2.4 strcmp和strncmp
- 2.5 strstr
- 2.6 strtok
- 2.7 strerror
- 希望读者们多多三连支持
- 小编会继续更新
- 你们的鼓励就是我前进的动力!
字符函数和字符串函数是C语言中经常用到的两类函数,它们主要用于处理字符数据和字符串数据,本篇 vlog 涉及的函数比较多,注意区分和辨别参数,返回值,类型,适用场景,相信通过这一篇对字符及字符串的处理会有更深入的理解
1.字符函数
字符函数通常是针对单个字符进行操作的函数,它们接受一个字符作为参数,并返回与该字符相关的某种属性或经过特定处理后的结果
1.1 字符分类函数
此类函数主要用于字符的分类,需要包含头文件 #include <ctype.h>
以下介绍一个常用的字符分类函数
1.1.1 islower
islower 用于检查字符是否为小写字母, isupper 作用与其相反
传送门:islower-C++参考
参数:要检查的参数,即大小写字母
返回值:如果 c 确实是小写字母,则该值不为零(即 true),否则为 0(即 false)
举个例子:将字符串中的小写字母都转成大写字母,其他字符不变
#include <stdio.h>
#include <ctype.h>
int main()
{
int i = 0;
char str[] = "Test String.\n";
char c;
while (str[i])
{
c = str[i];
if (islower(c))
c -= 32;
putchar(c);
i++;
}
return 0;
}
1.2 字符转换函数
此类函数主要用于字符的转换,需要包含头文件 #include <ctype.h>
以下介绍一个常用的字符转换函数
1.2.1 tolower
tolower 用于将参数传进去的大写字母转小写,与 islower 不同的是,islower 只是判断,tolower是直接转换。toupper 用于将参数传进去的小写字母转大写,与 tolower 同理
传送门:tolower-C++参考
参数:要检查的参数,即大小写字母
还是和上面相同的例子
int main()
{
int i = 0;
char str[] = "Test String.\n";
char c;
while (str[i])
{
c = str[i];
if (islower(c))
c = toupper(c);
putchar(c);
i++;
}
return 0;
}
用 c = toupper( c ) 把 c -= 32 替代了,省去了记 ASC|| 值的麻烦,以后修改值直接使用转换字符函数就行了
2.字符串函数
字符串函数则是对字符串(由零个或多个字符组成的序列)进行各种操作的函数,比如获取字符串长度、查找子字符串、替换字符串内容等
2.1 strlen
看过我往期 vlog 的同学,该函数相信大家已经烂熟于心了,这里就不再过多赘述
传送门:strlen-C++参考
2.2 strcpy和strncpy
strcpy 用于将一个字符串复制到另一个字符串中,即 copy
需要包含头文件 #include <string.h>
传送门:strcpy-C++参考
参数:destination-指向要复制内容的目标数组的指针,source-要复制的 C 字符串(注意原字符串不可修改)
返回值:destination 的起始地址
值得注意的是:源字符串必须以 ‘\0’ 结束,拷贝会将源字符串中的 ‘\0’ 拷贝到目标空间,且目标空间必须足够大,以确保能存放源字符串,目标空间必须可修改
strcpy 的模拟实现:
char* my_strcpy(char* dest, const char* src)
{
char* ret = dest;
assert(dest != NULL);
assert(src != NULL);
while ((*dest++ = *src++))
{
;
}
return ret;
}
将 dest 的起始地址存储到变量 ret,以便返回值返回,对两个形参进行断言操作,避免空指针的使用 while 循环里的两个变量先各自++,然后从右向左赋值,直到 src 遇到 \0 循环才停止
和 strcpy 相像的是 strncpy
传送门:strncpy-C++参考
唯一与 strcpy 不同的是它可以固定复制的个数,不只是以 \0 为标准停下来
值得注意的是:在指定的连接字符个数中是不包括\0的,拷贝num个字符从源字符串到目标空间,如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个
2.3 strcat和strncat
strcat 用于将一个字符串连接到另一个字符串的末尾,即 concatenate,需要包含头文件 #include <string.h>
传送门:strcat-C++参考
参数:destination-指向要复制内容的目标数组的指针,source-要复制的 C 字符串(注意 destination 和 source 不能重合)
返回值:destination 的起始地址
值得注意的是:源字符串必须以 ‘\0’ 结束,目标字符串中也得有 \0 ,否则没办法知道追加从哪里开始,目标空间必须有足够的大,能容纳下源字符串的内容,目标空间必须可修改,追加过程中是会覆盖掉目标字符串末尾的 \0 的
如果自己给自己追加呢?
#include <stdio.h>
#include <string.h>
int main() {
char str[20] = "Hello";
strcat(str, str);
printf("Result: %s\n", str);
return 0;
}
原字符串str初始化为 “Hello”,它所占用的内存空间是按照初始化时设定的长度来分配的
• 理论上:追加过程中是会覆盖掉目标字符串末尾的 \0 的,但是不会把原字符串的 \0 复制过去,而是复制完后编译器自动在末尾加上一个 \0
• 实际上:自己给自己追加这个操作是无法让编译器到达添加 \0 这一步的,所以 “Hello” 会一直追加,无限循环下去,直到数组栈溢出报错为止
strcat 的模拟实现:
char* my_strcat(char* dest, const char* src)
{
char* ret = dest;
assert(dest != NULL);
assert(src != NULL);
while (*dest)
{
dest++;
}
while ((*dest++ = *src++))
{
;
}
return ret;
}
其实就是在 strcpy 模拟实现的的基础上加了个循环,让指针指向目标字符串的末尾再开始
和 strcat 相像的是 strncat
传送门:strncat-C++参考
唯一与 strcat 不同的是它可以固定追加的个数,不只是以 \0 为标准停下来
值得注意的是:在指定的连接字符个数中是不包括\0的,将 source 指向字符串的前 num 个字符追加到 destination 指向的字符串末尾,再追加⼀个 \0 字符,如果 source 指向的字符串的长度小于 num 的时候,只会将字符串中到 \0 的内容追加到 destination 指向的字符串末尾
2.4 strcmp和strncmp
strcmp 用于比较两个字符串的函数,即 compare,需要包含头文件 #include <string.h>
传送门:strcmp-C++参考
参数:str1、str2-要比较的字符串
返回值规定:
• 第一个字符串大于第二个字符串,则返回大于 0 的数字
• 第一个字符串等于第二个字符串,则返回 0
• 第一个字符串小于第二个字符串,则返回小于 0 的数字
如何判断两个字符串?
比较两个字符串中对应位置上字符ASCII码值的大小
strcmp 的模拟实现:
int my_strcmp(const char* str1, const char* str2)
{
int ret = 0;
assert(str1 != NULL);
assert(str2 != NULL);
while (*str1 == *str2)
{
if (*str1 == '\0')
return 0;
str1++;
str2++;
}
return *str1 - *str2;
}
str1 和 str2分别逐个向后一个一个比较,直到遇到第一个大小不同的字符,立马停下,后面都不比较了,无论这个字符串多长,都只看第一个遇到的不同的字符谁大谁小,以ASC|| 的差值作返回值
和 strcmp 相像的是 strnccmp
传送门:strncmp-C++参考
唯一与 strcmp 不同的是它可以固定比较的个数
值得注意的是:比较 str1 和 str2 的前 num 个字符,如果相等就继续往后比较,最多比较 num 个字母,如果提前发现不⼀样,就提前结束,大的字符所在的字符串大于另外一个,如果 num 个字符都相等,就是相等返回 0
2.5 strstr
strstr 用于查找在一个字符串中查找另一个指定字符串(子字符串)的首次出现位置
需要包含头文件 #include <string.h>
传送门:strstr-C++参考
参数:str1-要扫描的字符串,str2-包含要匹配的字符序列
返回值:指向 str2 中指定的整个字符序列在 str1 中第一次出现的指针,如果 str1 中不存在序列,则为空指针
strstr 的模拟实现:
char* strstr(const char* str1, const char* str2)
{
char* cp = (char*)str1;
char* s1, * s2;
if (!*str2)
return((char*)str1);
while (*cp)
{
s1 = cp;
s2 = (char*)str2;
while (*s1 && *s2 && !(*s1 - *s2))
s1++, s2++;
if (!*s2)
return(cp);
cp++;
}
return(NULL);
}
外层循环遍历 str1 字符串,内层循环在每个可能的起始位置上对 str2 进行逐个字符比对
2.6 strtok
strtok 是用于字符串分割的函数,需要包含头文件 #include <string.h>
传送门:strtok-C++参考
参数:str-是要进行分割操作的字符串,可以是字符数组形式存在的字符串,delimiters-是用于指定分割字符的字符串,即按照 delim 中包含的字符来对 str 进行分割
返回值:返回一个指向被分割出的下一个子字符串的指针或空指针
值得注意的是:sep 参数指向一个字符串,定义了用作分隔符的字符集合,第⼀个参数指定⼀个字符串,它包含了 0 个或者多个由 sep 字符串中⼀个或者多个分隔符分割的标记 strtok 函数找到 str 中的下⼀个标记,并将其用 \0 结尾,返回⼀个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以被strtok函数切分的字符串⼀般都是临时拷贝的内容并且可修改),strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok 函数将保存它在字符串中的位置,strtok 函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记,如果字符串中不存在更多的标记,则返回 NULL 指针
这个函数有点难理解,举个例子:
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "192.168.6.111";
char* sep = ".";
char* str = NULL;
for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
{
printf("%s\n", str);
}
return 0;
}
这段 C 语言代码的主要目的是使用strtok函数对一个表示 IP 地址的字符串进行分割,并逐个输出分割后的子字符串,也就是将 IP 地址中的每个数字部分单独提取并打印出来
2.7 strerror
strerror 用于将一个错误码(由 errno 表示)转换为对应的、人类可读的错误描述字符串
需要包含头文件 #include <string.h>
传送门:strerror-C++参考
参数:errnum-错误码
在不同的系统和C语言标准库的实现中都规定了一些错误码,一般是放在 errno.h 这个头文件中说明的,C语言程序启动的时候就会使用一个全局的变量 errno 来记录程序的当前错误码,只不过程序启动的时候 errno 是0,表示没有错误,当我们在使用标准库中的函数的时候发生了某种错误,就会将对应的错误码,存放在 errno 中,而⼀个错误码的数字是整数很难理解是什么意思,所以每一个错误码都是有对应的错误信息的,strerror 函数就可以将错误对应的错误信息字符串的地址返回
返回值:向描述 errnum 的错误字符串的指针
比如我们打印⼀下0~10这些错误码对应的信息
#include <errno.h>
#include <string.h>
#include <stdio.h>
int main()
{
int i = 0;
for (i = 0; i <= 10; i++) {
printf("%s\n", strerror(i));
}
return 0;
}
可以看到每个数字都有对应的错误信息
和 strerror 相像的是 perror
printf ("Error opening file unexist.ent: %s\n", strerror(errno))
perror("Error opening file unexist.ent")
这两段代码是等价的,perror函数打印完参数部分的字符串后,再打印一个冒号和一个空格,再打印错误信息
本篇到这就结束了,涉及的函数很多,及时理解总结才能更好的掌握本篇的知识哦😋