持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第26天,点击查看活动详情
前言
本文就来分享一波作者对可变参数列表的学习心得与见解。
笔者水平有限,难免存在纰漏,欢迎指正交流。
建议学习了函数栈帧后再学习如下内容,关于函数栈帧可移步至:[深入浅出C语言]深入函数栈帧 - 掘金 (juejin.cn)
可变参数列表
可变参数列表主要由四个宏来控制,分别是va_list,va_start,va_arg,va_end,我们从例子入手,由浅入深讲解一下。
引例:求最大值
对于两个数据取最大值是很简单的,直接比较两个数据不就ok了嘛。
#include <stdio.h>
int FindMax(int x, int y)
{
if (x > y)
{
return x;
}
return y;
}
int main()
{
int x = 0;
int y = 0;
printf("Please Eneter Two Data# ");
scanf("%d %d", &x, &y);
int max = FindMax(x, y);
printf("max = %d\n", max);
return 0;
}
那如果要求任意多个数据中的最大值,又不能使用数组传参,该怎么办呢?
因为目前参数个数不确定,那么函数编写的时候,参数个数也无法确定,换句话说,函数好像也就没法编写呀。
不过,C提供了满足该场景的解决方案:可变参数列表。
说明与铺垫
可变参数列表的参数数目是可以根据情况而改变的,适用于函数传入参数个数有多个且不确定具体数目,比如我们日常一直在用的printf()和scanf()的参数用的就是可变参数列表,比如:
printf("%d %d %d %lf", a, b, c, d, e);或printf("%d", a);。
只要你的转换说明写对了,并且转换说明的个数和参数个数对应了,那么传多少个参数都可以。
转到printf函数的定义处可以看到:
后面的…就是在使用可变参数列表。那能不能把上面printf函数的_Format参数也给省去变成只有...呢?
不能,可变参数列表至少要有一个有效元素。
铺垫:
1.在C中,如果函数没有形参,仍可以给函数传递参数。
2.在C中,只要发生了函数调用并且传递了参数就必定形成临时拷贝。
3.所谓的临时拷贝本质就是在函数栈帧内部形成的,并且是从右向左依次形成的。
4.临时拷贝是要入栈的,根据函数栈帧文章中所学,可知入栈参数之间位置关系是固定的。
示例与分析
例1
#include <stdio.h>
//num:表示传入参数的个数
int FindMax(int num, ...)
{
va_list arg; //定义可以访问可变参数部分的变量,其实是一个char*类型
va_start(arg, num); //使arg指向可变参数部分
int max = va_arg(arg, int); //根据arg提供的地址和传入的类型(这里是int),依次获取可变参数列表中的数据
for (int i = 0; i < num - 1; i++)
{
//获取并比较其他的
int curr = va_arg(arg, int);
if (max < curr)
{
max = curr;
}
}
va_end(arg); //arg使用完毕,收尾工作。本质就是将arg的值置为NULL
return max;
}
int main()
{
int max = FindMax(5,0x11,0x21,0x31,0x41,0x51);
printf("max = %d\n", max);
return 0;
}
例2
如果将参数改成char类型,求char类型变量中的最大值,会得到什么结果?
#include <stdio.h>
//num:表示传入参数的个数
int FindMax(int num, ...)
{
va_list arg; //定义可以访问可变参数部分的变量,其实是一个char*类型
va_start(arg, num); //使arg指向可变参数部分
int max = va_arg(arg, int); //根据类型,获取可变参数列表中的第一个数据
for (int i = 0; i < num - 1; i++)
{
//获取并比较其他的
int curr = va_arg(arg, int);
if (max < curr)
{
max = curr;
}
}
va_end(arg); //arg使用完毕,收尾工作。本质就是讲arg指向NULL
return max;
}
int main()
{
char a = '1'; //ascii值: 49
char b = '2'; //ascii值: 50
char c = '3'; //ascii值: 51
char d = '4'; //ascii值: 52
char e = '5'; //ascii值: 53
int max = FindMax(5, a, b, c, d, e);
printf("max = %d\n", max);
return 0;
}
可以运行并得到正确结果。
实际上,char类型参数传入压栈时会进行符号扩展,也就是整型提升成为int类型,所以可以va_arg(arg, int)这样用,而不能va_arg(arg, char)这样用。
通过查看汇编,我们看到,在可变参数场景下:
-
实际传入的参数如果是char,short,float,编译器在编译的时候,会自动进行提升(通过查看汇编,我们都能看到)
-
函数内部使用的时候,根据类型提取数据,更多的是通过int或者double来进行
比如上一个例子中
注意事项
可变参数必须从头到尾逐个访问。如果你在访问了几个可变参数之后想半途终止,这是可以的,但是,如果你想一开始就访问参数列表中间的参数,那是不行的。
参数列表中至少有一个命名参数。如果连一个命名参数都没有,就无法使用 va_start 。
这些宏是无法直接判断实际存在参数的数量。
这些宏无法判断每个参数的类型。
如果在 va_arg 中指定了错误的类型,那么其后果是不可预测的。
深析原理
几个宏的剖析
先看看这几个宏的含义:
va_list其实就是char*,方便后续按照1字节单位进行指针移动。
#define va_start _crt_va_start
#define va_arg _crt_va_arg
#define va_end _crt_va_end
我们一个一个来看:
#define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) )
#define _ADDRESSOF(v) ( &(v) ) //取参数的地址
#define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
难点是 _INTSIZEOF(n),不太好理解,暂时理解为4字节对齐(向上取整),也就是说如果是小于4字节的,统一提升为4字节,而如果大于4小于8的统一提升为8字节,以此类推,对齐到4的倍数。
拿前面提过的例子来看的话,可以得出ap = (char*)(&(v)) + 4也就是arg = (char*)(&num) + 4。
而关于#define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )还是用前面的例子来分析:
这个设计特别巧妙,先让ap指向下个元素,然后使用相对位置-偏移量,访问当前元素。
访问了当前数据的同时,还让ap指向了后续元素,一举两得。
#define _crt_va_end(ap) ( ap = (va_list)0 ) 意为将ap指针设置为NULL,防止出现野指针
深入理解_INTSIZEOF(n)
#define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
_INTSIZEOF(n)的意思:计算一个最小数字x,满足 x>=sizeof(n) && x%4==0,就是求出能整除4的最小整数。
我们先做一个规定:下面的分析都用n来表示sizeof(n),char对应1,short对应2,int对应4。
为什么要有4字节对齐
因为参数压栈时会发生类型提升,形成的临时拷贝要么4字节要么8字节,所以在取出使用的时候也要按4字节或8字节。
第一步理解:4的倍数
既然是4的最小整数倍取整,那么本质是:x=4*m,m是具体几倍。比如对7来讲,m就是2,对齐的结果就是8。
而m具体是多少,取决于n是多少
如果n能整除4,那么m就是n/4
如果n不能整除4,那么m就是n/4+1
上面是两种情况,如何合并成为一种写法呢?
常见做法是 ( n+sizeof(int)-1) )/sizeof(int) -> (n+4-1)/4
简略证明:
如果n能整除4,那么m就是(n+4-1)/4->(n+3)/4, +3的值无意义,会因取整自动消除,等价于 n/4,比如4能整除4得1,+3后变成7,除4还是得1。
如果n不能整除4,那么n=最大能整除4部分+r,1<=r<4 那么m就是 (n+4-1)/4->(能整除4部分+r+3)/4,其中
4<=r+3<7 -> 能整除4部分/4 + (r+3)/4 -> n/4+1
第二步理解:最小4字节对齐数
搞清楚了满足条件最小是几倍问题,那么,计算一个最小数字x,满足 x>=n && x%4==0,就变成了
((n+sizeof(int)-1)/sizeof(int))[最小几倍] * sizeof(int)[单位大小] -> ((n+4-1)/4)*4
这样就能求出来4字节对齐的数据了,其实上面的写法,在功能上,已经和源代码中的宏等价了。
第三步理解:理解源代码中的宏
((n+4-1)/4)* 4,设w=n+4-1,那么表达式可以变化成为 (w/4)4,而4就是2^2,w/4,不就相当于右移两位吗?再次4不就相当左移两位吗?先右移两位,在左移两位,最终结果就是,最后2个比特位被清空为0。
需要这么费劲吗?
直接w & ~3 不香吗?
所以,简洁版:(n+4-1) & ~(4-1)
原码版:( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) ),无需先/再*