深入了解字符函数和字符串函数

前言：今天给大家深入理解一下字符函数和字符串函数。通过使用和模拟实现 带大家加深理解，让大家灵活使用。

字符函数

在C语言中，有一系列函数是专门做字符分类的，也就是一个字符属于什么类型的字符。

这些函数的使用都要包含一个头文件 ctype.h

上面的字符函数使用方法很类似。

使用代码演示一下：将小写字母转换成大写，其他字母不变。

#include <ctype.h>
#include <stdio.h>
int main()
{
	char arr[20] = "I am a Student.";
	int i = 0;
	while (arr[i])
	{
		if (islower(arr[i]))
		{
			arr[i] -= 32;
			//arr[i] = toupper(arr[i]);
		}
		i++;
	}
	printf("%s\n", arr);

	return 0;
}

因为每个字符都有自己的ASCII码值，比如A的值65，小写a的值97。所以大小写相差32，通过加减32，就可以相互转换。

第二种是使用字符函数toupper将小写转换成大写。

总的来说：

字符函数的使用非常简单，大家可以自己查看文档去使用：字符函数的查看

字符串函数

要使用字符串函数需要包含头文件<string.h>。比如之前的字符串比较，用的就是strcmp进行比较，接下来详细讲解。

1.strlen函数

这个函数大家应该很熟悉，这是求字符串长度的，strlen函数返回的是在字符串中‘\0’前面出现的字符个数。

#include <string.h>
int main()
{
	char arr[] = "abcdef";
	size_t len = strlen(arr);

	printf("%zd\n", len);


	return 0;
}

• 参数指向的字符串必须要以 '\0' 结束。

• 注意函数的返回值为 size_t，是⽆符号的（易错）

#include <string.h>
int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "ab";
	//strlen返回的是无符号，所以不是负的
	if (strlen(arr2) - strlen(arr1) > 0)
	{
		printf(">\n");
	}
	else
		printf("<=\n");

	return 0;
}

大家认为结果是什么呢？大家是不是会认为是<= ?

其实和大家想的想反。这是因为strlen的返回值其实是size_t为无符号的，这样相减是作法是不正确的。如果想要比较，要这样 if (strlen(arr2) > strlen(arr1))。这才是正确的写法。

strlen的模拟实现

方法一：使用计数器的方法

#include <stdio.h>
#include <string.h>
#include <assert.h>
size_t my_strlen(const char* p)
{
	size_t count = 0;
	assert(p != NULL);
	while (*p)
	{
		count++;
		p++;
	}
	return count;
	
}

int main()
{
	char arr[] = "abcdef";
	size_t len = my_strlen(arr);
	printf("%zd\n", len);

	return 0;
}

方法二：指针-指针=元素个数

#include <stdio.h>
#include <string.h>
#include <assert.h>
size_t my_strlen(const char* p)
{
	char* start = p;
	assert(p != NULL);
	while (*p)
	{
		p++;
	}
	return p - start;

}

int main()
{
	char arr[] = "abcdef";
	size_t len = my_strlen(arr);
	printf("%zd\n", len);

	return 0;
}

把arr的地址传给my_strlen的字符指针变量p接收，再创建一个字符指针变量start接收arr的初始地址，再让p地址往后走，这样子指针相减就可以得到字符串个数。

方法三：递归的写法

#include <stdio.h>
#include <string.h>
#include <assert.h>
size_t my_strlen(const char* p)
{
	if (*p == '\0')
		return 0;
	else
		return 1 + my_strlen(p + 1);
}
int main()
{
	char arr[] = "abcdef";
	size_t len = my_strlen(arr);
	printf("%zd\n", len);

	return 0;
}

首先，大家要知道写递归需要有限制条件。每次调用都要接近限制条件。为什么要写成1 + my_strlen(p + 1);呢？因为地址加1就跳过一个元素，所以就抽出了一个元素 + my_strlen(p + 1)。直到遇到\0,就返回答案。

如果不清楚递归函数，参考：了解函数递归

2.strcpy 的使⽤和模拟实现

strcpy的语法：这是用来拷贝字符串的。

• 源字符串必须以 '\0' 结束。

• 会将源字符串中的 '\0' 拷⻉到⽬标空间。

• ⽬标空间必须⾜够⼤，以确保能存放源字符串。

• ⽬标空间必须可修改。

strcpy的使用

#include <string.h>
int main()
{
	char arr1[] = "abcdef";
	char arr2[30] = { 0 };

	//数组名是地址，而地址是常量的值
	//arr2 = arr1; error
	//就像3 = 5，那是不行的

	//拷贝arr1的内容到arr2
	strcpy(arr2, arr1);
	printf("arr2 = %s\n", arr2);


	return 0;
}

strcpy的模拟实现

#include <stdio.h>
#include <assert.h>
char* my_strcpy(char* dest,const char* sour)
{

	assert(dest != NULL);
	assert(sour != NULL);
	char* ret = dest;
	while (*sour)
	{
		*dest++ = *sour++;
	}
    *dest = *sour;
	return ret;
}

int main()
{
	char arr1[] = "abcdef";
	char arr2[20] = "xxxxxxxxxxxxxxx";
	char* ret = my_strcpy(arr2, arr1);
	printf("%s\n", ret);
	return 0;
}

当*sour不等于\0时，进入循环，把sour里面的值传给dest。当等于0时，跳出循环。最后一条语句把\0给dest。这样就符合了strcpy的条件。

打印的时候只打印到\0，所以只打印了abcdef，后面的xxxxx就没有了。

3. strcat 的使⽤和模拟实现

使用代码演示一下：

#include <string.h>
int main()
{
	char arr1[20] = "hello ";
	strcat(arr1,"world");
	printf("%s\n", arr1);


	return 0;
}

• 源字符串必须以 '\0' 结束。

• ⽬标字符串中也得有 \0 ，否则没办法知道追加从哪⾥开始。

• ⽬标空间必须有⾜够的⼤，能容纳下源字符串的内容。

• ⽬标空间必须可修改。

strcat的模拟实现

#include <stdio.h>
#include <assert.h>
char* my_strcat(char* dest, const char* sour)
{
	char* ret = dest;
	assert(dest && sour);
	while (*dest != '\0')
	{
		dest++;
	}
	while (*dest++ = *sour++)
	{
		;
	}
	return ret;
}

int main()
{
	char arr1[20] = "hello ";
	char* ret = my_strcat(arr1, "world");
	printf("%s\n", ret);

	return 0;
}

首先，把dest的地址存储在ret上，然后dest往后走找到\0，在把hello放在后面，最后返回ret存储的初始地址。

4.strcmp 的使⽤和模拟实现

• 标准规定：

◦ 第⼀个字符串⼤于第⼆个字符串，则返回⼤于0的数字

◦ 第⼀个字符串等于第⼆个字符串，则返回0

◦ 第⼀个字符串⼩于第⼆个字符串，则返回⼩于0的数字

◦ 那么如何判断两个字符串？⽐较两个字符串中对应位置上字符ASCII码值的⼤⼩。

#include <string.h>
int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "abc";
	int ret = strcmp(arr1, arr2);
	//printf("%d\n", ret);
	if (ret > 0)
	{
		printf("arr1 > arr2\n");
	}
	else if (ret < 0)
	{
		printf("arr1 < arr2\n");

	}
	else
		printf("arr1 = arr2\n");
	return 0;
}

大家要知道\0的ASCII码值为0，当d和\0比较时，d大于0，所以返回arr1 > arr2。

strcmp模拟实现

#include <stdio.h>
#include <assert.h>
int my_strcmp(const char* arr1, const char* arr2)
{
	while (*arr1 == *arr2)
	{
		if (*arr1 == '\0')
			return 0;
		arr1++;
		arr2++;
	}
	return *arr1 - *arr2;
}
int main()
{

	char arr1[] = "abcdef";
	char arr2[] = "abcq";
	int ret = my_strcmp(arr1, arr2);
	if (ret > 0)
		printf(">\n");
	else if (ret < 0)
		printf("<\n");
	else
		printf("=\n");
	return 0;
}

因为strcmp比较字符串是返回整数类型，当俩个相同的时候，地址往后走，第一种情况，全部都相等，那就使用if判断是否为\0;第二种，不相等那就解引用相减得值。

5. strncpy 函数的使⽤

strncpy指的n是长度受限的字符串函数，追加完字符串后，也是字符串，得有\0。

• 拷⻉num个字符从源字符串到⽬标空间。

• 如果源字符串的⻓度⼩于num，则拷⻉完源字符串之后，在⽬标的后边追加0，直到num个。

#include <string.h>
int main()
{
	char arr1[] = "abcdef";
	char arr2[20] = { 0 };
	strncpy(arr2, arr1, 5);
	printf("%s\n", arr2);

	return 0;
}

通过结果，我们知道那个n指的是拷贝多少个字符。

6.strncat 函数的使⽤

#include <string.h>
int main()
{
	char arr1[20] = "abcd\0yyyyyyy";
	char arr2[] = "xxx";
	strncat(arr1, arr2, 3);
	printf("%s\n", arr1);

	return 0;
}

其实，strncat 和strcat没什么区别，只是它多了个n指的是追加的个数。它也是源字符串必须以\0结尾。目标字符串也得有\0，不然不知道追加从哪里开始。

7.strstr 的使⽤和模拟实现

函数返回字符串str2在字符串str1中第⼀次出现的位置
字符串的⽐较匹配不包含 \0 字符，以 \0 作为结束标志

#include <string.h>
int main()
{
	char arr1[] = "abcdefgdef";
	char arr2[] = "def";
	char* ret = strstr(arr1, arr2);
	if (ret == NULL)
		printf("找不到\n");
	else
		printf("找到了，ret = %s\n", ret);

	return 0;
}

strstr的模拟实现

#include <stdio.h>
#include <assert.h>
const char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 && str2);
	const char* s1 = str1;
	const char* s2 = str2;

	const char* cur = str1;
	while (*cur)
	{
		s1 = cur;
		s2 = str2;
		while (*s1 && *s2 && *s1 == *s2)
		{
			
			s1++;
			s2++;
		}
		if (*s2 == '\0')
			return cur;
		cur++;

	}
	return NULL;

}

int main()
{
	char arr1[] = "abbbbcesji";
	char arr2[] = "bbc";
	char* ret =my_strstr(arr1, arr2);
	if (ret == NULL)
		printf("找不到\n");
	else
		printf("找到了，ret = %s\n", ret);

	return 0;
}

首先s1，s2记录下str1，str2的初始地址，而cur指针记录开始匹配的位置，使用s1，s2往后走，当有相同的字符的时候，进行匹配，当匹配不上的时候，cur加1，在进行匹配，知道匹配成功。

8.strtok 函数的使⽤

• sep参数指向⼀个字符串，定义了⽤作分隔符的字符集合

• 第⼀个参数指定⼀个字符串，它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记。

• strtok函数找到str中的下⼀个标记，并将其⽤ \0 结尾，返回⼀个指向这个标记的指针。（注： strtok函数会改变被操作的字符串，所以被strtok函数切分的字符串⼀般都是临时拷⻉的内容并且可修改。）

#include <stdio.h>
#include <string.h>
#include <assert.h>
int main()
{
	char arr1[] = "zhangpeng@yeah.net";
	char sep[] = "@.";
	char copy[30] = { 0 };

	strcpy(copy, arr1);
	char* p = NULL;
	for (p = strtok(copy, sep); p != NULL; p = strtok(NULL, sep))
	{
		printf("%s\n", p);
	}

	return 0;
}

9. strerror 函数的使⽤

strerror 函数可以把参数部分错误码对应的错误信息的字符串地址返回来。

在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码，⼀般是放在 errno.h 这个头⽂件中说明的，C语⾔程序启动的时候就会使⽤⼀个全局的变量errno来记录程序的当前错误码。

#include <errno.h>

int main()
{
	//打开文件 -- 如果文件存在，就打开失败
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		printf("文件打来失败，原因是:");
		printf("%s\n", strerror(errno));
		return 1;//错误返回
	}
	//打开成功了
	//....
	
	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}