前言:今天给大家深入理解一下字符函数 和 字符串函数。通过使用 和 模拟实现 带大家加深理解,让大家灵活使用。
字符函数
在C语言中,有一系列函数是专门做字符分类的,也就是一个字符属于什么类型的字符。
这些函数的使用都要包含一个头文件 ctype.h
上面的字符函数使用方法很类似 。
使用代码演示一下:将小写字母转换成大写,其他字母不变。
#include <ctype.h>
#include <stdio.h>
int main()
{
char arr[20] = "I am a Student.";
int i = 0;
while (arr[i])
{
if (islower(arr[i]))
{
arr[i] -= 32;
//arr[i] = toupper(arr[i]);
}
i++;
}
printf("%s\n", arr);
return 0;
}
因为每个字符都有自己的ASCII码值,比如A的值65,小写a的值97。所以大小写相差32,通过加减32,就可以相互转换。
第二种是使用字符函数toupper将小写转换成大写。
总的来说:
字符函数的使用非常简单,大家可以自己查看文档去使用:字符函数的查看
字符串函数
要使用字符串函数需要包含头文件<string.h>。比如之前的字符串比较,用的就是strcmp进行比较,接下来详细讲解。
1.strlen函数
这个函数大家应该很熟悉,这是求字符串长度的,strlen函数返回的是在字符串中‘\0’前面出现的字符个数。
#include <string.h>
int main()
{
char arr[] = "abcdef";
size_t len = strlen(arr);
printf("%zd\n", len);
return 0;
}
• 参数指向的字符串必须要以 '\0' 结束。
• 注意函数的返回值为 size_t,是⽆符号的( 易错 )
#include <string.h>
int main()
{
char arr1[] = "abcdef";
char arr2[] = "ab";
//strlen返回的是无符号,所以不是负的
if (strlen(arr2) - strlen(arr1) > 0)
{
printf(">\n");
}
else
printf("<=\n");
return 0;
}
大家认为结果是什么呢?大家是不是会认为是<= ?
其实和大家想的想反。这是因为strlen的返回值其实是size_t为无符号的,这样相减是作法是不正确的。如果想要比较,要这样 if (strlen(arr2) > strlen(arr1))。这才是正确的写法。
strlen的模拟实现
方法一:使用计数器的方法
#include <stdio.h>
#include <string.h>
#include <assert.h>
size_t my_strlen(const char* p)
{
size_t count = 0;
assert(p != NULL);
while (*p)
{
count++;
p++;
}
return count;
}
int main()
{
char arr[] = "abcdef";
size_t len = my_strlen(arr);
printf("%zd\n", len);
return 0;
}
方法二:指针-指针=元素个数
#include <stdio.h>
#include <string.h>
#include <assert.h>
size_t my_strlen(const char* p)
{
char* start = p;
assert(p != NULL);
while (*p)
{
p++;
}
return p - start;
}
int main()
{
char arr[] = "abcdef";
size_t len = my_strlen(arr);
printf("%zd\n", len);
return 0;
}
把arr的地址传给my_strlen的字符指针变量p接收,再创建一个字符指针变量start接收arr的初始地址,再让p地址往后走,这样子指针相减就可以得到字符串个数。
方法三: 递归的写法
#include <stdio.h>
#include <string.h>
#include <assert.h>
size_t my_strlen(const char* p)
{
if (*p == '\0')
return 0;
else
return 1 + my_strlen(p + 1);
}
int main()
{
char arr[] = "abcdef";
size_t len = my_strlen(arr);
printf("%zd\n", len);
return 0;
}
首先,大家要知道写递归需要有限制条件。每次调用都要接近限制条件。为什么要写成1 + my_strlen(p + 1);呢?因为地址加1就跳过一个元素,所以就抽出了一个元素 + my_strlen(p + 1)。直到遇到\0,就返回答案。
如果不清楚递归函数,参考:了解函数递归
2.strcpy 的使⽤和模拟实现
strcpy的语法 :这是用来拷贝字符串的。
• 源字符串必须以 '\0' 结束。
• 会将源字符串中的 '\0' 拷⻉到⽬标空间。
• ⽬标空间必须⾜够⼤,以确保能存放源字符串。
• ⽬标空间必须可修改。
strcpy的使用
#include <string.h>
int main()
{
char arr1[] = "abcdef";
char arr2[30] = { 0 };
//数组名是地址,而地址是常量的值
//arr2 = arr1; error
//就像3 = 5,那是不行的
//拷贝arr1的内容到arr2
strcpy(arr2, arr1);
printf("arr2 = %s\n", arr2);
return 0;
}
strcpy的模拟实现
#include <stdio.h>
#include <assert.h>
char* my_strcpy(char* dest,const char* sour)
{
assert(dest != NULL);
assert(sour != NULL);
char* ret = dest;
while (*sour)
{
*dest++ = *sour++;
}
*dest = *sour;
return ret;
}
int main()
{
char arr1[] = "abcdef";
char arr2[20] = "xxxxxxxxxxxxxxx";
char* ret = my_strcpy(arr2, arr1);
printf("%s\n", ret);
return 0;
}
当*sour不等于\0时,进入循环,把sour里面的值传给dest。当等于0时,跳出循环。最后一条语句把\0给dest。这样就符合了strcpy的条件。
打印的时候只打印到\0,所以只打印了abcdef,后面的xxxxx就没有了。
3. strcat 的使⽤和模拟实现
使用代码演示一下:
#include <string.h>
int main()
{
char arr1[20] = "hello ";
strcat(arr1,"world");
printf("%s\n", arr1);
return 0;
}
• 源字符串必须以 '\0' 结束。
• ⽬标字符串中也得有 \0 ,否则没办法知道追加从哪⾥开始。
• ⽬标空间必须有⾜够的⼤,能容纳下源字符串的内容。
• ⽬标空间必须可修改。
strcat的模拟实现
#include <stdio.h>
#include <assert.h>
char* my_strcat(char* dest, const char* sour)
{
char* ret = dest;
assert(dest && sour);
while (*dest != '\0')
{
dest++;
}
while (*dest++ = *sour++)
{
;
}
return ret;
}
int main()
{
char arr1[20] = "hello ";
char* ret = my_strcat(arr1, "world");
printf("%s\n", ret);
return 0;
}
首先,把dest的地址存储在ret上,然后dest往后走找到\0,在把hello放在后面,最后返回ret存储的初始地址。
4.strcmp 的使⽤和模拟实现
• 标准规定:
◦ 第⼀个字符串⼤于第⼆个字符串,则返回⼤于0的数字
◦ 第⼀个字符串等于第⼆个字符串,则返回0
◦ 第⼀个字符串⼩于第⼆个字符串,则返回⼩于0的数字
◦ 那么如何判断两个字符串? ⽐较两个字符串中对应位置上字符ASCII码值的⼤⼩。
#include <string.h>
int main()
{
char arr1[] = "abcdef";
char arr2[] = "abc";
int ret = strcmp(arr1, arr2);
//printf("%d\n", ret);
if (ret > 0)
{
printf("arr1 > arr2\n");
}
else if (ret < 0)
{
printf("arr1 < arr2\n");
}
else
printf("arr1 = arr2\n");
return 0;
}
大家要知道\0的ASCII码值为0,当d和\0比较时,d大于0,所以返回arr1 > arr2。
strcmp模拟实现
#include <stdio.h>
#include <assert.h>
int my_strcmp(const char* arr1, const char* arr2)
{
while (*arr1 == *arr2)
{
if (*arr1 == '\0')
return 0;
arr1++;
arr2++;
}
return *arr1 - *arr2;
}
int main()
{
char arr1[] = "abcdef";
char arr2[] = "abcq";
int ret = my_strcmp(arr1, arr2);
if (ret > 0)
printf(">\n");
else if (ret < 0)
printf("<\n");
else
printf("=\n");
return 0;
}
因为strcmp比较字符串是返回整数类型,当俩个相同的时候,地址往后走,第一种情况,全部都相等,那就使用if判断是否为\0;第二种,不相等那就解引用相减得值。
5. strncpy 函数的使⽤
strncpy指的n是长度受限的字符串函数,追加完字符串后,也是字符串,得有\0。
• 拷⻉num个字符从源字符串到⽬标空间。
• 如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。
#include <string.h>
int main()
{
char arr1[] = "abcdef";
char arr2[20] = { 0 };
strncpy(arr2, arr1, 5);
printf("%s\n", arr2);
return 0;
}
通过结果,我们知道那个n指的是拷贝多少个字符 。
6.strncat 函数的使⽤
#include <string.h>
int main()
{
char arr1[20] = "abcd\0yyyyyyy";
char arr2[] = "xxx";
strncat(arr1, arr2, 3);
printf("%s\n", arr1);
return 0;
}
其实,strncat 和strcat没什么区别,只是它多了个n指的是追加的个数。它也是源字符串必须以\0结尾。目标字符串也得有\0,不然不知道追加从哪里开始。
7.strstr 的使⽤和模拟实现
- 函数返回字符串str2在字符串str1中第⼀次出现的位置
- 字符串的⽐较匹配不包含 \0 字符,以 \0 作为结束标志
#include <string.h>
int main()
{
char arr1[] = "abcdefgdef";
char arr2[] = "def";
char* ret = strstr(arr1, arr2);
if (ret == NULL)
printf("找不到\n");
else
printf("找到了,ret = %s\n", ret);
return 0;
}
strstr的模拟实现
#include <stdio.h>
#include <assert.h>
const char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
const char* s1 = str1;
const char* s2 = str2;
const char* cur = str1;
while (*cur)
{
s1 = cur;
s2 = str2;
while (*s1 && *s2 && *s1 == *s2)
{
s1++;
s2++;
}
if (*s2 == '\0')
return cur;
cur++;
}
return NULL;
}
int main()
{
char arr1[] = "abbbbcesji";
char arr2[] = "bbc";
char* ret =my_strstr(arr1, arr2);
if (ret == NULL)
printf("找不到\n");
else
printf("找到了,ret = %s\n", ret);
return 0;
}
首先s1,s2记录下str1,str2的初始地址,而cur指针记录开始匹配的位置,使用s1,s2往后走,当有相同的字符的时候,进行匹配,当匹配不上的时候,cur加1,在进行匹配,知道匹配成功。
8.strtok 函数的使⽤
• sep参数指向⼀个字符串,定义了⽤作分隔符的字符集合
• 第⼀个参数指定⼀个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标 记。
• strtok函数找到str中的下⼀个标记,并将其⽤ \0 结尾,返回⼀个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以被strtok函数切分的字符串⼀般都是临时拷⻉的内容并且 可修改。)
#include <stdio.h>
#include <string.h>
#include <assert.h>
int main()
{
char arr1[] = "zhangpeng@yeah.net";
char sep[] = "@.";
char copy[30] = { 0 };
strcpy(copy, arr1);
char* p = NULL;
for (p = strtok(copy, sep); p != NULL; p = strtok(NULL, sep))
{
printf("%s\n", p);
}
return 0;
}
9. strerror 函数的使⽤
strerror 函数可以把参数部分错误码对应的错误信息的字符串地址返回来。
在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码,⼀般是放在 errno.h 这个头⽂件中说明 的,C语⾔程序启动的时候就会使⽤⼀个全局的变量errno来记录程序的当前错误码。
#include <errno.h>
int main()
{
//打开文件 -- 如果文件存在,就打开失败
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("文件打来失败,原因是:");
printf("%s\n", strerror(errno));
return 1;//错误返回
}
//打开成功了
//....
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
当我们深入了解这些函数之后,其实别的字符串函数跟这些没有什么区别,大家可以根据文档去实现一下功能,以后需要使用的时候,就会非常简单。
参考:字符串的函数