字符串函数剖析(1)

446 阅读6分钟

带你玩转字符串
1.strlen函数不一样的细节

1.1模拟实现strlen函数

2.strcpy函数的巧妙

2.2strcpy的模拟实现

3.strcmp函数的巧妙

3.2strcmp的模拟实现

详解strlen的细节

首先了解strlen 函数的参数

size_t strlen ( const char * str );

size_t 是什么东西呢? 看下面的操作: 在这里插入图片描述 这里介绍一个快捷键,输入size_t后,按住ctrl + 鼠标左键,即可转到定义,或者右击鼠标,点击转到定义即可 所以 size_t == unsigned int ,strlen 的返回类型是无符号类型

注意这里,这是无符号整型!下面的介绍大有用处

下面介绍strlen 的用法: strlen是一个库函数,它会顺着你 传过来的地址,一直往下找,直到找到\0为止,返回的是无符号整型

在这里插入图片描述

输出结果为6

再看下面的代码: 在这里插入图片描述 结果还是6吗,不再是6了,而是一个随机值。字符串这样放在数组里,没有\0,所以strlen会顺着arr不断往下找,什么时候找到\0,我们不得而知。

这证实strlen是顺着地址往下找的。

模拟实现strlen
int my_strlen(const char* str)
{			//const修饰的内容无法更改
	int count = 0;
	assert(str != NULL);
	while (*str) 
	{
		count++;
		str++;
	}
	return count;
}

int main()
{
	int len = my_strlen("abcdef");
	printf("%d\n", len);
	return 0;
}

打印出来的结果仍然是6,这里要讲的重点不是如何实现strlen函数。 细心的你会发现: strlen 函数的返回值不应该是size_t 吗,为什么上面写的是 my_strlen 是 int 类型呢?

是因为: 其实这两种写法都可以,各有利弊: 先看下面的一段代码:

int main()
{
	if (strlen("abc") - strlen("abcdef") > 0)
		注意这里是库函数的strlen
	{
		printf("hehe\n");
	}
	else
	{
		printf("haha\n");
	}
	return 0;
}

请说出上面代码的输出结果: 没注意到细节,一定会说出会打印haha,运行出真知: 在这里插入图片描述 为什么呢? 回到上面的strlen的返回类型,size_t,是 unsigned int ,无符号整型,abc的长度是3,abcdef长度是6,那么3-6 == -3 ,-3作为 unsigned int 类型,是一个大于0的数, 打印结果如下图: 在这里插入图片描述 是一个大于0的数,所以会打印hehe, 假如是用自己的my_strlen 函数,结果如下:

在这里插入图片描述 这就很符合我们的认知, 3 - 6 == -3 <0,走else 语句。 不过,这两种写法,各有各的好处,假如你想跟着标准走的话,写size_t是绝对没有问题的,因为计算长度是不可能有负数的。 但是写 int 类型,也没有什么问题,单独计算一个字符串的长度时,返回值也是一个大于0的数,当3 - 6 == -3时,的确是会走if 语句,更符合我们的理解,不容易产生歧义。 所以两种写法各有利弊。 注意事项: 在这里插入图片描述

2.strcpy函数的巧妙讲解

先看库函数的声明:

char * strcpy ( char * destination, const char * source );
						目的地					源头

需要两个地址,一个是目的地地址,一个是源头地址

举个例子:

int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "hello";
	strcpy(arr1, arr2);
	     将arr2字符串拷贝到arr1
	printf("%s\n", arr1);
	
}

运行结果如下:

在这里插入图片描述

下面来模拟实现:

模拟实现strcpy函数:
char* my_strcpy(char* dest,  char* src)
{
	assert(dest && src);
	char* ret = dest;
	while (*src!='\0')
	{
		*dest = *src;
		 dest++;
		 src++;
	}
	*dest = *src;
	//循环结束后,src指向了\0的位置,所以将\0也赋值给dest;
	return ret;
}

int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "hello";
	char *ret = my_strcpy(arr1, arr2);
	printf("%s\n", ret);
}

特殊位置已注释讲解 ,但是你会发现,模拟代码还可以精简化

char* my_strcpy(char* dest, const char* src)
				目标空间必须可变,源头空间不可变
{
	assert(dest && src); 判断指针的有效性
	char* ret = dest;
	while (*dest++ = *src++);
	return ret ;
}

每次src对应的字符赋值给dest后,再++,dest也++,然后进行判断,如果为\0 , \0的ascii码值为0,while为0,退出循环

这样的代码才是,满分代码
strcpy注意事项: 在这里插入图片描述

	char arr1[] = { 'a','b','c','d','e','f' };
	错误代码:字符串无\0
	char arr1 = "abcdef";
	错误代码:常量字符串无法更改

在这里插入图片描述 请注意第三点:目标空间必须足够大。 这是因为strcpy这个函数,它只管拷贝,只管找到\0才停止,它才不管你的空间够不够,这就是strcpy函数的脾气,所以必须充分了解。

strcmp函数详解

首先了解函数的声明:

int strcmp ( const char * str1, const char * str2 );

strcmp的参数是两个不可更改的char*的指针

返回值:当第一个字符串大于第二个时,返回一个大于0的数,当第一个字符串小于第二个时,返回小于0的数,等于时,返回0

在这里插入图片描述 测试一下结果: 在这里插入图片描述 但是这里,在visual studio环境下,返回值只是-1,0,1,是不是说这个strcmp函数有问题呢?其实并不是,当我们模拟实现的时候就能够发现。 下面来模拟实现strcmp函数:

模拟实现strcmp
int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);
	while (*str1 == *str2)
	{
		if (*str1 == '\0')
		{
			return 0;//相等的情况
		}
		str1++;
		str2++;
	}
	return (*str1 - *str2);//不相等的情况
}

int main()
{
	char* p1 = "abcdef";
	char* p2 = "sqwer";
	int ret = my_strcmp(p1,p2);
	printf("%d", ret);
	return 0;
}

可以看到,a和s相比,相差了18,a的ascii码值是97,s的ascii码值是115,两者相减,结果就是-18,所以p1 小于 p2 在这里插入图片描述

strcat函数剖析

这是一个追加函数,意思是在原字符串的末尾,继续追加其他字符串。

char * strcat ( char * destination, const char * source );

该函数的声明如上: 参数是两个指针,一个是目的地指针,一个是源头指针。 返回类型是目的地起始地址。

int main()
{
	char arr1[30] = "hello";
	char arr2[] = "world";
	strcat(arr1, arr2);
	printf("%s\n", arr1);

来看一下strcat函数的实现过程,在这里插入图片描述

在arr1之后追加了arr2. 但是会不会连world末尾的\0也追加上去呢? 答案是会的: 在这里插入图片描述 可知,world后面连\0也追加上去了;

那么能不能自己追加自己?

可以看到,程序崩溃了 在这里插入图片描述

原因究竟是什么? 在这里插入图片描述 调试之后我们发现,arr1没有\0了!,hello未被追加时,后面还有一个\0,但是追加之后,arr2是从\0开始追加的,所以当我们追加之后,\0已经被覆盖了。所以它会无限追加下去。所以这个程序就崩溃了。

模拟实现strcat函数:
char* my_strcat(char* dest, const char* src)
{
	assert(dest && src);
	char* ret = dest;
	//1.找到目的字符串的\0位置
	while (*dest!='\0')
	{
		dest++;
	}
	//2.追加的过程其实就是拷贝的过程
	while (*dest++ = *src++)
	{
		;
	}
	return ret;
}
int main()
{
	char arr1[30] = "hello";
	char arr2[] = "world";
	my_strcat(arr1, arr2);
	printf("%s\n", arr1);
}

重点部分已经作了注释:

不过有几点要注意一下:

在这里插入图片描述

与strlen相似,如果源字符串后无\0,这就像自己追加自己,导致程序崩溃 如下图: 在这里插入图片描述 arr1的只有6个大小的空间,如果强制追加arr2上去,就会导致程序崩溃。 当源头字符串后面没有\0时,会出现: 在这里插入图片描述 追加过去之后,但是后面没有\0,就没有\0追加,无结束标志,程序会崩溃。

如果对你有帮助的话,就关注一下吧!