文章目录
- 目录
- 1. 前言
- 2. 函数介绍
- 2.1 strlen
- 2.2 strcpy
- 2.3 strcat
- 2.4 strcmp
- 2.5 strncpy
- 2.6 strncat
- 2.7 strncmp
- 2.8 strstr
- 2.9 strtok
- 2.10 strerror
- 2.11 字符分类函数
- 2.12 字符转换函数
目录
- 求字符串长度函数
- 长度不受限制的字符串函数
- 长度受限制的字符串函数
- 字符串查找函数
- 错误信息报告函数
- 字符操作函数
- 内存操作函数
1. 前言
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串或者字符数组中;字符串常量适用于那些对它不做修改的字符串函数。
2. 函数介绍
2.1 strlen
size_t strlen(const char* str);
- 字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’)。
- 参数指向的字符串必须要以 ‘\0’ 结束。
- 注意函数的返回值为size_t,是无符号的。(易错)
#include <stdio.h>
#include <string.h>
int main()
{
if (strlen("abc") - strlen("abcdef") > 0)
{
printf("大于\n");
}
else
{
printf("小于等于\n");
}
return 0;
}
以上代码的结果是大于,这就是因为strlen返回的是无符号的整型,所以应该这样写:
#include <stdio.h>
#include <string.h>
int main()
{
if ((int)strlen("abc") - (int)strlen("abcdef") > 0)
{
printf("大于\n");
}
else
{
printf("小于等于\n");
}
return 0;
}
#include <stdio.h>
#include <string.h>
int main()
{
if (strlen("abc") > strlen("abcdef"))
{
printf("大于\n");
}
else
{
printf("小于等于\n");
}
return 0;
}
以上两个代码的结果就是小于等于。
我们再来复习一下strlen函数的模拟实现:
#include <stdio.h>
//1. 计数器
size_t my_strlen(const char* str)
{
int count = 0;
while (*str != '\0')
{
count++;
str++;
}
return count;
}
//2. 指针-指针
//3. 递归的方法
int main()
{
size_t sz = my_strlen("abc");
printf("%u\n", sz);//3
return 0;
}
另外两种方法如果不清楚,可以看之前的指针初阶(1)。
2.2 strcpy
char* strcpy(char* destination, const char* source);
- Copies the C string pointed by source into the array pointed by destination, including the terminating null character (and stopping at that point).
- 源字符串必须以 ‘\0’ 结束。
- 会将源字符串中的 ‘\0’ 拷贝到目标空间。
- 目标空间必须足够大,以确保能存放源字符串。
- 目标空间必须可变。
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = { 0 };
//char* arr1 = "xxxxxxxxxx";//err 常量字符串不能被修改
//char arr2[] = "hello bit";
char arr2[6] = { 'a', 'b', 'c', 'd', 'e', '\0' };
strcpy(arr1, arr2);
printf("%s\n", arr1);//abcde
return 0;
}
我们再来看一下strcpy函数的模拟实现:
#include <stdio.h>
#include <assert.h>
//char* my_strcpy(char* dest, const char* src)
//{
// char* ret = dest;
// assert(dest != NULL);
// assert(src != NULL);
//
// while (*src != '\0')
// {
// *dest = *src;
// dest++;
// src++;
// }
//
// *dest = *src;//\0
//
// return ret;
//}
char* my_strcpy(char* dest, const char* src)
{
char* ret = dest;
assert(dest != NULL);
assert(src != NULL);
while (*dest++ = *src++)
{
;
}
return ret;
}
int main()
{
char arr1[20] = "hello world";
char arr2[] = "xxxxx";
//printf("%s\n", my_strcpy(arr1, arr2));
my_strcpy(arr1 + 6, arr2);
printf("%s\n", arr1);//hello xxxxx
return 0;
}
2.3 strcat
char* strcat(char* destination, const char* source);
- Appends a copy of the source string to the destination string. The terminating null character in destination is overwritten by the first character of source, and a null-character is included at the end of the new string formed by the concatenation of both in destination.
- 源字符串必须以 ‘\0’ 结束。
- 目标字符串也必须以 ‘\0’ 结束。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "hello";
char arr2[] = "world";
strcat(arr1, arr2);
printf("%s\n", arr1);//helloworld
return 0;
}
以下是对strcat函数的模拟实现:
#include <stdio.h>
#include <assert.h>
char* my_strcat(char* dest, const char* src)
{
assert(dest && src);
char* ret = dest;
//1. 找目标空间中的\0
while (*dest)
{
dest++;
}
while (*dest++ = *src++)
{
;
}
return ret;
}
int main()
{
char arr1[20] = "hello ";
char arr2[] = "world";
my_strcat(arr1, arr2);
printf("%s\n", arr1);//hello world
return 0;
}
我们思考一个问题:字符串能自己给自己追加吗?
答:strcat 最好不要自己给自己追加!
#include <stdio.h>
#include <assert.h>
char* my_strcat(char* dest, const char* src)
{
assert(dest && src);
char* ret = dest;
//1. 找目标空间中的\0
while (*dest)
{
dest++;
}
while (*dest++ = *src++)
{
;
}
return ret;
}
int main()
{
char arr1[20] = "hello";
my_strcat(arr1, arr1);
printf("%s\n", arr1);
return 0;
}
dest 和 src 中一开始存的都是 ‘h’ 的地址,之后 dest 会找到 ‘\0’ 的地址,接着通过 *dest = *src,把 ‘\0’ 替换成 ‘h’,但是这样之后 src 就找不到 ‘\0’ 了,就会进入死循环。因此,strcat 最好不要自己给自己追加!
2.4 strcmp
int strcmp(const char* str1, const char* str2);
- This function starts comparing the first character of each string. If they are equal to each other, it continues with the following pairs until the characters differ or until a terminating null-character is reached.
- 标准规定:
- 第一个字符串大于第二个字符串,则返回大于0的数字
- 第一个字符串等于第二个字符串,则返回0
- 第一个字符串小于第二个字符串,则返回小于0的数字
//VS
//> 1
//= 0
//< -1
#include <stdio.h>
#include <string.h>
int main()
{
int ret = strcmp("abcdef", "abq");
printf("%d\n", ret);//-1
return 0;
}
strcmp的模拟实现:
#include <stdio.h>
#include <assert.h>
//int my_strcmp(const char* str1, const char* str2)
//{
// assert(str1 && str2);
//
// while (*str1 == *str2)
// {
// if ('\0' == *str1)
// {
// return 0;
// }
//
// str1++;
// str2++;
// }
//
// if (*str1 > *str2)
// {
// return 1;
// }
// else
// {
// return -1;
// }
//
//}
int my_strcmp(const char* str1, const char* str2)
{
assert(str1 && str2);
while (*str1 == *str2)
{
if ('\0' == *str1)
{
return 0;
}
str1++;
str2++;
}
return (*str1 - *str2);
}
int main()
{
int ret = my_strcmp("bbq", "bcq");
if (ret > 0)
{
printf(">\n");
}
printf("%d\n", ret);//-1
return 0;
}
2.5 strncpy
char* strncpy(char* destination, const char* source, size_t num);
- Copies the first num characters of source to destination. If the end of the source C string (which is signaled by a null-character) is found before num characters have been copied,destination is padded with zeros until a total of num characters have been written to it.
- 拷贝num个字符从源字符串到目标空间。
- 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "abcdef";
//char arr2[] = "xxxxxxxxxxxxx";
//strncpy(arr1, arr2, 3);
//printf("%s\n", arr1);//xxxdef
char arr2[] = "xxx";
strncpy(arr1, arr2, 5);
printf("%s\n", arr1);//xxx
return 0;
}
2.6 strncat
char* strncat(char* destination, const char* source, size_t num);
- Appends the first num characters of source to destination, plus a terminating null-character.
- If the length of the C string in source is less than num, only the content up to the terminating null-character is copied.
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "abcdef\0yyyyyyyyyyy";
char arr2[] = "xxx";
strncat(arr1, arr2, 5);
return 0;
}
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "abcdef\0yyyyyyyyyyy";
char arr2[] = "xxxxxxxxx";
strncat(arr1, arr2, 3);
return 0;
}
2.7 strncmp
int strncmp(const char* str1, const char* str2, size_t num);
- 比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[] = "abcqwertyuiop";
char arr2[] = "abcdef";
printf("%d\n", strncmp(arr1, arr2, 3));//0
return 0;
}
2.8 strstr
char* strstr(const char* str1, const char* str2);
- Returns a pointer to the first occurrence of str2 in str1, or a null pointer if str2 is not part of str1.
//strstr - 字符串中找子字符串
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[] = "abcdefabcdef";
char arr2[] = "def";
char* ret = strstr(arr1, arr2);
if (ret != NULL)
{
printf("%s\n", ret);//defabcdef
}
else
{
printf("找不到\n");
}
return 0;
}
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[] = "abcdefabcdef";
char arr2[] = "deq";
char* ret = strstr(arr1, arr2);
if (ret != NULL)
{
printf("%s\n", ret);
}
else
{
printf("找不到\n");
}
//找不到对应的字符串,返回的是NULL,所以打印找不到
return 0;
}
strstr函数的模拟实现:
#include <stdio.h>
char* my_strstr(const char* str1, const char* str2)
{
char* cp = str1;
char* s1 = cp;
char* s2 = str2;
while (*cp)
{
//开始匹配
s1 = cp;
s2 = str2;
while (*s1 && *s2 && *s1 == *s2)
{
s1++;
s2++;
}
if ('\0' == *s2)
{
return cp;
}
cp++;
}
return NULL;
}
int main()
{
char arr1[] = "abbbcdef";
char arr2[] = "bbc";
char* ret = my_strstr(arr1, arr2);
if (ret != NULL)
{
printf("%s\n", ret);//bbcdef
}
else
{
printf("找不到\n");
}
return 0;
}
2.9 strtok
char* strtok(char* str, const char* sep);
- sep参数是个字符串,定义了用作分隔符的字符集合。
- 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
- strtok函数找到str中的下一个标记,并将其用 ‘\0’ 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
- strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
- strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "zhangsan@yeah.net";
char copy[20];
strcpy(copy, arr);
char sep[] = "@.";
char* ret = strtok(copy, sep);
printf("%s\n", ret);//zhangsan
ret = strtok(NULL, sep);
printf("%s\n", ret);//yeah
ret = strtok(NULL, sep);
printf("%s\n", ret);//net
return 0;
}
但是如果我们不知道它被分成了几段,那么我们应该怎么把它们全部打印出来呢?
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "zhangsan@yeah.net@666#777";
char copy[30];
strcpy(copy, arr);
char sep[] = "@.#";
char* ret = NULL;
for (ret = strtok(copy, sep); ret != NULL; ret = strtok(NULL, sep))
{
printf("%s\n", ret);
}
return 0;
}
2.10 strerror
char* strerror(int errnum);
- 返回错误码所对应的错误信息。
- 库函数在执行的时候,发生了错误,会将一个错误码存放在errno这个变量中,errno是C语言提供的一个全局变量
#include <stdio.h>
#include <string.h>
int main()
{
int i = 0;
for (i = 0; i < 10; i++)
{
printf("%d: %s\n", i, strerror(i));
}
return 0;
}
举个具体的例子:
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
//C语言中可以操作文件
//操作文件的步骤
//1. 打开文件
//2. 读/写文件
//3. 关闭文件
FILE* pf = fopen("data.txt", "r");//打开data.txt这个文件,而且是为了读来打开这个文件,这个函数返回的是一个FILE*的指针,打开失败返回的是空指针
if (NULL == pf)
{
printf("%s\n", strerror(errno));
//如果当前路径底下没有data.txt这个文件,就会打印No such file or directory
return 1;//和ruturn 0做个区分,这是失败返回的
}
//读文件
//...
//关闭文件
fclose(pf);
return 0;
}
还有一个函数可以直接就把错误信息打印出来:
#include <stdio.h>
int main()
{
//C语言中可以操作文件
//操作文件的步骤
//1. 打开文件
//2. 读/写文件
//3. 关闭文件
FILE* pf = fopen("data.txt", "r");
if (NULL == pf)
{
perror("fopen");//如果当前路径底下没有data.txt这个文件,就会打印fopen: No such file or directory
//先打印fopen: ,然后再打印错误信息
//perror里面的内容可以自定义
return 1;
}
//读文件
//...
//关闭文件
fclose(pf);
return 0;
}
2.11 字符分类函数
注:
ASCII码表中0~31是不可打印字符,其他是可打印字符。
#include <stdio.h>
#include <ctype.h>
int main()
{
//isupper
//大写返回非0
//其他返回0
printf("%d\n", isupper('A'));//1
printf("%d\n", isupper('a'));//0
printf("%d\n", isdigit('2'));//4
printf("%d\n", isdigit('X'));//0
return 0;
}
2.12 字符转换函数
int tolower(int c);
int toupper(int c);
#include <stdio.h>
#include <ctype.h>
int main()
{
printf("%c\n", tolower('A'));//a
printf("%c\n", tolower('s'));//s
return 0;
}
最后,我们来看一道题目:
//将字符串中的内容全部改成小写
#include <stdio.h>
#include <ctype.h>
int main()
{
char arr[20] = { 0 };
gets(arr);//遇到空格继续读
//比如输入:I am a Good Student
char* p = arr;
while (*p)
{
if (isupper(*p))
{
*p = tolower(*p);
}
p++;
}
printf("%s\n", arr);//i am a good student
return 0;
}