带你玩转字符串
1.strlen函数不一样的细节
1.1模拟实现strlen函数
2.strcpy函数的巧妙
2.2strcpy的模拟实现
3.strcmp函数的巧妙
3.2strcmp的模拟实现
详解strlen的细节
首先了解strlen 函数的参数
size_t strlen ( const char * str );
size_t 是什么东西呢?
看下面的操作:
这里介绍一个快捷键,输入size_t后,按住ctrl + 鼠标左键,即可转到定义,或者右击鼠标,点击转到定义即可
所以 size_t == unsigned int ,strlen 的返回类型是无符号类型
注意这里,这是无符号整型!下面的介绍大有用处
下面介绍strlen 的用法:
strlen是一个库函数,它会顺着你 传过来的地址,一直往下找,直到找到\0为止,返回的是无符号整型
输出结果为6
再看下面的代码:
结果还是6吗,不再是6了,而是一个随机值。字符串这样放在数组里,没有\0,所以strlen会顺着arr不断往下找,什么时候找到\0,我们不得而知。
这证实strlen是顺着地址往下找的。
模拟实现strlen
int my_strlen(const char* str)
{ //const修饰的内容无法更改
int count = 0;
assert(str != NULL);
while (*str)
{
count++;
str++;
}
return count;
}
int main()
{
int len = my_strlen("abcdef");
printf("%d\n", len);
return 0;
}
打印出来的结果仍然是6,这里要讲的重点不是如何实现strlen函数。
细心的你会发现:
strlen 函数的返回值不应该是size_t 吗,为什么上面写的是 my_strlen 是 int 类型呢?
是因为: 其实这两种写法都可以,各有利弊:
先看下面的一段代码:
int main()
{
if (strlen("abc") - strlen("abcdef") > 0)
注意这里是库函数的strlen
{
printf("hehe\n");
}
else
{
printf("haha\n");
}
return 0;
}
请说出上面代码的输出结果:
没注意到细节,一定会说出会打印haha,运行出真知:
为什么呢?
回到上面的strlen的返回类型,size_t,是 unsigned int ,无符号整型,abc的长度是3,abcdef长度是6,那么3-6 == -3 ,-3作为 unsigned int 类型,是一个大于0的数,
打印结果如下图:
是一个大于0的数,所以会打印hehe,
假如是用自己的my_strlen 函数,结果如下:
这就很符合我们的认知, 3 - 6 == -3 <0,走else 语句。
不过,这两种写法,各有各的好处,假如你想跟着标准走的话,写size_t是绝对没有问题的,因为计算长度是不可能有负数的。
但是写 int 类型,也没有什么问题,单独计算一个字符串的长度时,返回值也是一个大于0的数,当3 - 6 == -3时,的确是会走if 语句,更符合我们的理解,不容易产生歧义。
所以两种写法各有利弊。
注意事项:
2.strcpy函数的巧妙讲解
先看库函数的声明:
char * strcpy ( char * destination, const char * source );
目的地 源头
需要两个地址,一个是目的地地址,一个是源头地址
举个例子:
int main()
{
char arr1[] = "abcdef";
char arr2[] = "hello";
strcpy(arr1, arr2);
将arr2字符串拷贝到arr1
printf("%s\n", arr1);
}
运行结果如下:
下面来模拟实现:
模拟实现strcpy函数:
char* my_strcpy(char* dest, char* src)
{
assert(dest && src);
char* ret = dest;
while (*src!='\0')
{
*dest = *src;
dest++;
src++;
}
*dest = *src;
//循环结束后,src指向了\0的位置,所以将\0也赋值给dest;
return ret;
}
int main()
{
char arr1[] = "abcdef";
char arr2[] = "hello";
char *ret = my_strcpy(arr1, arr2);
printf("%s\n", ret);
}
特殊位置已注释讲解 ,但是你会发现,模拟代码还可以精简化
char* my_strcpy(char* dest, const char* src)
目标空间必须可变,源头空间不可变
{
assert(dest && src); 判断指针的有效性
char* ret = dest;
while (*dest++ = *src++);
return ret ;
}
每次src对应的字符赋值给dest后,再++,dest也++,然后进行判断,如果为\0 , \0的ascii码值为0,while为0,退出循环
这样的代码才是,满分代码
strcpy注意事项:
char arr1[] = { 'a','b','c','d','e','f' };
错误代码:字符串无\0
char arr1 = "abcdef";
错误代码:常量字符串无法更改
请注意第三点:目标空间必须足够大。
这是因为strcpy这个函数,它只管拷贝,只管找到\0才停止,它才不管你的空间够不够,这就是strcpy函数的脾气,所以必须充分了解。
strcmp函数详解
首先了解函数的声明:
int strcmp ( const char * str1, const char * str2 );
strcmp的参数是两个不可更改的char*的指针
返回值:当第一个字符串大于第二个时,返回一个大于0的数,当第一个字符串小于第二个时,返回小于0的数,等于时,返回0
测试一下结果:
但是这里,在visual studio环境下,返回值只是-1,0,1,是不是说这个strcmp函数有问题呢?其实并不是,当我们模拟实现的时候就能够发现。
下面来模拟实现strcmp函数:
模拟实现strcmp
int my_strcmp(const char* str1, const char* str2)
{
assert(str1 && str2);
while (*str1 == *str2)
{
if (*str1 == '\0')
{
return 0;//相等的情况
}
str1++;
str2++;
}
return (*str1 - *str2);//不相等的情况
}
int main()
{
char* p1 = "abcdef";
char* p2 = "sqwer";
int ret = my_strcmp(p1,p2);
printf("%d", ret);
return 0;
}
可以看到,a和s相比,相差了18,a的ascii码值是97,s的ascii码值是115,两者相减,结果就是-18,所以p1 小于 p2
strcat函数剖析
这是一个追加函数,意思是在原字符串的末尾,继续追加其他字符串。
char * strcat ( char * destination, const char * source );
该函数的声明如上:
参数是两个指针,一个是目的地指针,一个是源头指针。
返回类型是目的地起始地址。
int main()
{
char arr1[30] = "hello";
char arr2[] = "world";
strcat(arr1, arr2);
printf("%s\n", arr1);
来看一下strcat函数的实现过程,
在arr1之后追加了arr2.
但是会不会连world末尾的\0也追加上去呢?
答案是会的:
可知,world后面连\0也追加上去了;
那么能不能自己追加自己?
可以看到,程序崩溃了
原因究竟是什么?
调试之后我们发现,arr1没有\0了!,hello未被追加时,后面还有一个\0,但是追加之后,arr2是从\0开始追加的,所以当我们追加之后,\0已经被覆盖了。所以它会无限追加下去。所以这个程序就崩溃了。
模拟实现strcat函数:
char* my_strcat(char* dest, const char* src)
{
assert(dest && src);
char* ret = dest;
//1.找到目的字符串的\0位置
while (*dest!='\0')
{
dest++;
}
//2.追加的过程其实就是拷贝的过程
while (*dest++ = *src++)
{
;
}
return ret;
}
int main()
{
char arr1[30] = "hello";
char arr2[] = "world";
my_strcat(arr1, arr2);
printf("%s\n", arr1);
}
重点部分已经作了注释:
不过有几点要注意一下:
与strlen相似,如果源字符串后无\0,这就像自己追加自己,导致程序崩溃
如下图:
arr1的只有6个大小的空间,如果强制追加arr2上去,就会导致程序崩溃。
当源头字符串后面没有\0时,会出现:
追加过去之后,但是后面没有\0,就没有\0追加,无结束标志,程序会崩溃。
如果对你有帮助的话,就关注一下吧!