目录
求字符串长度
strlen
常规实现
递归实现
指针-指针实现
长度不受限制的字符串函数
strcpy
模拟实现strcpy
strcat
模拟实现strcat
strcmp
模拟实现strcmp
长度受限制的字符串函数
strncpy
strncat
strncmp
求字符串长度
strlen
size_t strlen ( const char * str );
字符串已经 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数(不包
含 '\0' )。
参数指向的字符串必须要以 '\0' 结束。
注意函数的返回值为size_t,是无符号的( 易错 )。
学会strlen函数的模拟实现:
常规实现
int my_strlen(const char* str)
{
assert(str!=NULL);
int count = 0;
while (*str != 0)
{
count++;
str++;
}
return count;
}
递归实现
int my_strlen(const char* str)
{
assert(str != NULL);
if (*str != '\0')
return 1 + my_strlen(str + 1);
else
return 0;
}
指针-指针实现
int my_strlen(const char* str)
{
const char* start = str;
assert(str != NULL);
while (*str)
{
str++;
}
return str - start;
}
在strlen的文档中,返回类型是size_t
size_t strlen( const char *string );
为什么是size_t?这是因为strlen是求字符长度的,求出的长度是不可能为负数的,而size_t其实就是unsigned int即无符号整型。
但是注意size_t有它的坏处,见下:
int main()
{
if (strlen("abc") - strlen("abcdef") > 0)
printf(">");
else
printf("<");
return 0;
}
执行这段代码,结果竟然是>。这是因为3-6虽然是-3,但由于是无符号整型,它就被当成正数了。
长度不受限制的字符串函数
strcpy
char* strcpy(char * destination, const char * source );
Copies the C string pointed by source into the array pointed by destination, including the
terminating null character (and stopping at that point).
源字符串必须以\0结束。
会将源字符串中的\0拷贝到目标空间。
目标空间必须足够大,以确保能存放源字符串。
目标空间必须可变。
为什么源字符串必须以\0结束?如果不以\0结束,编译器就会在内存中持续往后读取字符,直到遇到\0,比如:
int main()
{
char arr1[100] = {0};
char arr2[] = { 'h','e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd' };
strcpy(arr1, arr2);
printf("%s", arr1);
return 0;
}
并没有成功返回0。
那什么是会将源字符串中的\0拷贝到目标空间?
int main()
{
char arr1[100] = {0};
char arr2[] = { 'h','e', 'l', 'l', '\0', ' ', 'w', 'o', 'r', 'l', 'd' };
char arr3[] = "hello\0world";
strcpy(arr1, arr2);
printf("%s\n", arr1);
strcpy(arr1, arr3);
printf("%s\n", arr1);
return 0;
}
目标空间不够大会怎样?
int main()
{
char arr1[5] = { 0 };
char arr2[] = "hello world";
strcpy(arr1, arr2);
printf("%s\n", arr1);
return 0;
}
虽然成功打印了,但会报错。
什么是目标空间必须可变?
int main()
{
char* p = "abcdefghijklm";
char arr[] = "hello world";
strcpy(p, arr);
printf("%s\n", p);
return 0;
}
可以看到程序崩溃了。这是因为abcdefghijklm是常量字符串,而不是变量。所以要用数组来存放字符串。
模拟实现strcpy
char* my_strcpy(char* dest,const char* src)
{
char* ret = dest;
assert(dest&&src);
while (*dest++ = *src++)
{
;
}
return ret;
}
int main()
{
char arr1[30] = "";
char arr2[] = "hello world";
my_strcpy(arr1, arr2);
printf("%s\n", arr1);
return 0;
}
strcat
请看strcat的文档
Append a string.
char *strcat( char *strDestination, const char *strSource );
Return Value
Each of these functions returns the destination string (strDestination). No return value is reserved to indicate an error.
Parameters
strDestination
Null-terminated destination string
strSource
Null-terminated source string
可以看到函数原型和strcpy的原型几乎一样。
但作用不同,strcat的作用是Append a string即在目标字符串后追加源字符串。
目标空间要有\0,源字符串必须以\0结束。
为什么?假设我要把world追加到hello后边……
编译器先去目标空间中找到\0,从源字符串中,从w开始\0覆盖掉,然后依次把字符传到目标空间,直到遇到\0结束。
不论是目标字符串还是源字符串,都是遇到\0结束。
目标空间必须有足够的大,能容纳下源字符串的内容。
目标空间必须可修改。道理同strcpy。
先来模拟实现下strcat。
模拟实现strcat
char* my_strcat(char* dest, const char* src)
{
assert(dest && src);
char* ret = dest;
//1. 找目标空间的\0
while (*dest)
{
dest++;
}
//2. 追加
while (*dest++ = *src++)
{
;
}
return ret;
}
字符串自己给自己追加,如何?可能会有问题。
当字符串给自己追加时……比如要将"abcdef"追加给"abcdef",dest会在while循环中找到\0。
之后\0被a覆盖。接着在a后边追加bcdef直到*dest被赋值成\0停止循环。
可是在这里\0已经被覆盖掉了,怎么遇到\0?这就是问题所在
strcmp
在MSDN中查阅strcmp的文档:
Remarks
The strcmp function compares string1 and string2 lexicographically and returns a value indicating their relationship.
Return Value
The return value for each of these functions indicates the lexicographic relation of string1 to string2.
Value Relationship of string1 to string2 < 0 string1 less than string2 0 string1 identical to string2 > 0 string1 greater than string2
可以发现strcmp是按字典序对两个字符串比较大小,当string1小于string2时返回值小于0,当string1等于string2时返回值等于0,当string1大于string2时返回值大于0。
在Visual Studio环境下,是小于的情况返回-1,是等于的情况返回0,是大于的情况返回1。但这并不意味着在所有IDE或编译器下都返回-1、0、1。
现在对abc和abcdef进行比较:
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[] = "abq";
char arr2[] = "abcdef";
int ret = strcmp(arr1,arr2);
printf("%d", ret);
return 0;
}
在ASCII码中,q的值大于c,所以返回值为1:
模拟实现strcmp
#include <assert.h>
int my_strcmp(const char* str1, const char* str2)
{
assert(str1 && str2);
while (*str1 == *str2)
{
if (*str1 == '\0')
return 0;
str1++;
str2++;
}
if (*str1 > *str2)
return 1;
else
return -1;
}
有一种情况是str1和str1大小一样时返回0,所以在进入while循环后就要判断*str1是不是等于\0,如果是就说明两个字符串大小相等,就返回0。
当遇到不同的字符时,while循环会结束,如果*str1大于*str2就返回1,否则,也就是*str小于*str2时返回-1。
刚刚提到:
不意味着在所有IDE或编译器下都返回-1、0、1。
那就来模拟下不是返回-1、0、1的情况:
#include <assert.h>
int my_strcmp(const char* str1, const char* str2)
{
assert(str1 && str2);
while (*str1 == *str2)
{
if (*str1 == '\0')
return 0;
str1++;
str2++;
}
return *str1 - *str2;
}
注意看最后,return *str1-str2;就是直接返回两个字母的ASCII值的差。
虽然C语言有它的标准,但标准并没有具体规定大于和小于的情况返回多少,只规定返回的值是大于0还是小于0。
像strcpy、strcat、strcmp这些函数都是长度不受限制的字符串函数。不受限制也就意味着相对来说不安全,比如刚才演示的strcat,让字符串自己给自己追加,如果没有遇到\0就会陷入死循环。如果限制了长度们就不会陷入死循环。
长度受限制的字符串函数
为了尽可能地提高安全性,后来C语言又引入了一些新的函数,这些函数是长度受限制的字符串函数。这里仅作简单介绍,会用即可~
strncpy
它的函数原型是:
char *strncpy( char *strDest, const char *strSource, size_t count );
作用是:
拷贝num个字符从源字符串到目标空间。
如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
调试以下代码:
#include <string.h>
#include <stdio.h>
int main()
{
char arr1[20] = "xxxxxxxxxx";
strncpy(arr1, "abcdef", 3);
printf("%s", arr1);
return 0;
}
对arr1进行监视,会发现strncpy不会在拷贝后给字符串加上\0。
当拷贝10个字符时:
#include <string.h>
#include <stdio.h>
int main()
{
char arr1[20] = "xxxxxxxxxx";
strncpy(arr1, "abcdef", 10);
printf("%s", arr1);
return 0;
}
这印证了刚才提到的
如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
strncat
它的函数原型是:
char *strncat( char *strDest, const char *strSource, size_t count );
查阅strncat的文档可得知
Appends the first num characters of source to destination, plus a terminating null-character.
If the length of the C string in source is less than num, only the content up to the terminating
null-character is copied.
可知在追加后会加上\0。此外如果源字符串的长度小于第三个参数的值,那么只会对源字符的\0之前的字符进行拷贝。
下面调试以下代码:
#include <string.h>
#include <stdio.h>
int main()
{
char arr1[20] = "abc";
strncat(arr1, "abcdef", 4);
printf("%s", arr1);
return 0;
}
可以发现abcdef的长度明显大于4,那么只会拷贝前四个字符。
再来调试以下代码:
#include <string.h>
#include <stdio.h>
int main()
{
char arr1[20] = "abc\0xxxxxx";
strncat(arr1, "abcdef", 4);
printf("%s", arr1);
return 0;
}
可以看到,是从目标字符串的\0开始追加字符,追加四个字符,到最后添加\0。
在追加后如果打印此字符串,最后的xx就不会被打印了。
strncmp
它的函数原型是:
int strncmp( const char *string1, const char *string2, size_t count );
与strcmp一样,都是按字典序对两个字符串比较大小,当string1小于string2时返回值小于0,当string1等于string2时返回值等于0,当string1大于string2时返回值大于0。
调试以下代码:
#include <string.h>
#include <stdio.h>
int main()
{
char* p1 = "abcdef";
char* p2 = "abcqwer";
int ret = strncmp(p1, p2, 3);
printf("%s", ret);
return 0;
}
这是只比较前三个字符,输出结果为:
如果比较前四个字符,调试下边的代码:
#include <string.h>
#include <stdio.h>
int main()
{
char* p1 = "abcdef";
char* p2 = "abcqwer";
int ret = strncmp(p1, p2, 4);
printf("%s", ret);
return 0;
}
输出结果为:
这是因为在ASCII中,q的值大于d,所以返回-1。