C语言结构体&枚举&联合

157 阅读8分钟

结构体&枚举&联合

结构体

结构体的声明

struct tag//结构体标签名
{
    member-list;//成员列表
}variable-list;//变量列表

可以在声明结构体的时候同时 定义变量, 此时为全局变量

struct Stu
{
    char name[20];//名字
    int age;//年龄
    char sex[5];//性别
    char id[20];//学号
}student; 

使用这个结构体Stu在别的地方定义变量时,需要把struct关键字带上

struct Stu student = {‘小明’,25,'男',10001};//按成员列表顺序进行初始化

匿名结构体: 只能使用一次, 用于临时创建变量

//匿名结构体类型
struct
{
    int a;
    char b;
    float c;
}x;

更通常的写法是:

typedef struct 
{
    char name[20];//名字
    int age;//年龄
    char sex[5];//性别
    char id[20];//学号
}Stu;

直接使用typedef 将 Struct自定义类型重命名为自己创建的类型名,创建变量就不用带struct关键字了

· 注意: 结构体的成员变量不可以是自己本身的类型, 只能通过指针去引用, 否则类型大小是未定义的

typedef struct
{
    int data;
    struct Node* next;//此处还不可以直接写作Node* 因为结构体类型还未重命名
}Node;

结构体变量的赋值

除了上面的按顺序赋值, 还可以不按顺序而通过指定成员赋值

typedef struct{
    int x;
    int y;
}Point;

Point p = {.x=200,.y=100};//通过.+成员变量指定赋值

结构体内存对齐(重点)

规则:
  1. 第一个成员在与结构体变量偏移量为0的地址处。
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。 Linux中没有默认对齐数,对齐数就是成员自身的大小
  3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整 体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

注意: 每个成员都有一个对齐数,最大对齐数:所有成员对齐数中最大的值

struct S1
{
    char c1; //1
    int i; //4
    char c2; //1
};
1+3+4+1+3 = 12字节

struct S2
{
    char c1;//1
    char c2;//1
    int i;//4
};
1+1+2+4 = 8字节

struct S3
{
    double d; //8
    char c; //1
    int i; //4
};
8+1+3+4 = 16字节

struct S4
{
    char c1; //1
    struct S3 s3; //最大对齐数为8 那必须为8的整数倍地址处
    double d; /8
};
1+7+16+8 = 32字节
内存对齐的作用
  1. 平台原因: 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
  2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
    (可能会出现读一个类型, 先要读一半的字节, 还要在下一次读另一半的字节)

设计结构体同时满足对齐和最小化空间: 尽量让占用空间小的成员集中在一起,空间浪费会少很多

struct S1
{
    char c1; //1
    int i; //4
    char c2; //1
};
1+3+4+1+3 = 12字节
struct S2
{
    char c1;
    char c2;
    int i;
};
1+1+2+4 = 8字节
offsetof宏的实现
  • offsetof(struct,c1) 宏可以计算结构体成员相较于结构体地址的偏移量

偏移量: 相对于其实地址的位置, 此处我们只需要这个相对位置,不需要将变量取出进行计算

此处我们有类型,有变量的字段名,那我们可以得到c1的绝对位置,但是我们没有创建struct类型的变量, 因此,此处我们可以将struct的地址设为0x00000000,这样得到的绝对位置就是相对位置

写法:

#include <stdio.h>
#define offsetof(type,field) (size_t)&(((type*)0)->field)

typedef struct
{
    int age;
    char gender;
    double price;
}S1;


int main()
{
    printf("%zu",offsetof(S1,gender));
    return 0;
}

其中 (type*)0 即将结构体指针设为0x00000000处 ,->field取出相对应的结构体成员 再用&取得这个成员的地址, 因为此时其实地址为0x00000000,那么相对地址(偏移量)与绝对地址是相同的, 最后再强制转换为size_t类型即可返回整型的偏移量

结构体传参

首选用结构体指针进行传参, 将结构体指针传入函数当中, 在函数当中用->来访问成员变量

原因: 函数传参的时候需要压栈, 会有时间和空间上的系统开销, 如果传递的结构体对象太大, 会导致时间效率下降

位段

位段的声明和结构是类似的,有两个不同:

1.位段的成员必须是 int,unsigned int,char

2.位段的成员名后边有一个冒号和一个数字。

struct A
{
    int _a:2;
    int _b:5;
    int _c:10;
    int _d:30;//这里的数字是以比特为单位,代表该成员占用多少比特位
};
位段的内存分配
  1. 如果存不下去会截取原数据低位
  2. 内存从低位开始开辟 往高位段方向拓展
  3. 如果当前字节已经不满足位段所需的比特位大小, 那么就会开辟一个新的字节(看具体类型 如果是int就会开辟新的四个字节)

以上面的位段A为例:

int类型的成员 所以先开辟4个比特位的空间, 发现不够, 再开辟4个比特位的空间, 然后存入

最后, 该位段占用了4+4 = 8字节

//一个例子
struct S
{
    char a:3;
    char b:4;
    char c:5;
    char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;

截屏2024-08-15 09.44.48.png

截屏2024-08-15 09.43.31.png

位段的缺点
  1. int 位段被当成有符号数还是无符号数是不确定的。
  2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机 器会出问题。
  3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
  4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是 舍弃剩余的位还是利用,这是不确定的。
位段的应用: IP数据报

网络底层IP数据包的格式 用位段实现 可以规定好每个字段的位数 大大节省了空间 不用以字节为单位开辟

枚举

枚举: 一一列举, 将可能的取值全部列出

enum Day//星期
{
    Mon,
    Tues,
    Wed,
    Thur,
    Fri,
    Sat,
    Sun
};

这些可能取值都是有值的,默认从0开始,依次递增1,当然在声明枚举类型的时候也可以赋初值 只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。

enum Day day = Mon;

枚举的优点

  1. 增加代码的可读性和可维护性
  2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
  3. 便于调试
  4. 使用方便,一次可以定义多个常量

联合(共用体)

特点: 成员变量共用一块内存空间, 类型大小就是最大成员的大小(因为联合至少得有能力保存最大的那个成员),但也要对齐到最大对齐数到整数倍(如果是数组就看为一个个元素)

同一时间成员只能用一个, 因为会相互干扰

union Un
{
    int i;
    char c;
};
union Un un;
// 下面输出的结果是一样的吗? 一样,因为共用一块空间
printf("%d\n", &(un.i));
printf("%d\n", &(un.c));
//下面输出的结果是什么? 0x55223344
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);

可以理解为 如果我现在拿c 那么就会将整个空间看为char类型, char类型只有一个字节 也就是空间中地址最低的一位

判断机器是大端还是小端存储

那么,根据上面程序的结果, 我们可以改进判断机器采用大端法存储数据还是小端法存储数据的题目

使用联合体,一个char类型,一个int类型,此时我们取char类型都是取低位字节,我们先用int类型将值设置为0x00000001

如果是大端法,含1的字节块将会在高位, 如果是小端法,含1的字节块在低位, 而我们取联合体中的char类型变量都是取低位字节, 那么此时如果为1就是小端法,如果为0就是大端法

#include <stdio.h>

typedef union {
    int i;
    char c;
}un;

int main()
{
    un a;
    a.i = 0x00000001;
    if(a.c) printf("小端法\n");
    else printf("大端法\n");
    return 0;
}