C 程序的内存布局

114 阅读4分钟

C 程序的典型内存表示由以下部分组成。

  • 文本段
  • 初始化数据段
  • 未初始化的数据段

image.png

1.文本段: 文本段,也称为代码段或简称为文本,是目标文件或内存中的程序段之一,其中包含可执行指令。
作为内存区域,可以将文本段放置在堆或堆栈下方,以防止堆和堆栈溢出覆盖它。通常,文本段是可共享的,因此对于频繁执行的程序(例如文本编辑器、C 编译器、shell 等),只需要在内存中保存一个副本。此外,文本段通常是只读的,以防止程序意外修改其指令。

2、初始化数据段: 初始化数据段,通常简称为数据段。数据段是程序虚拟地址空间的一部分,其中包含由程序员初始化的全局变量和静态变量。
请注意,数据段不是只读的,因为变量的值可以在运行时更改。
该段可以进一步分为初始化只读区和初始化读写区。
例如,由 C 中的 char s[] = “hello world” 定义的全局字符串和 main 之外的诸如 int debug=1 的 C 语句(即全局)将存储在初始化的读写区域中。而像 const char* string = “hello world” 这样的全局 C 语句使字符串文字“hello world”存储在初始化的只读区域中,而字符指针变量 string 则存储在初始化的读写区域中。
例如:静态 int i = 10 将存储在数据段中,全局 int i = 10 也将存储在数据段中

3. 未初始化的数据段: 未初始化的数据段通常称为“ bss ”段,以一个古老的汇编运算符命名,代表“由符号开始的块”。该段中的数据在程序开始执行之前由内核初始化为算术 0,未初始化的数据从数据段的末尾开始,包含所有初始化为零或源代码中没有显式初始化的全局变量和静态变量。
例如,一个声明为 static int i 的变量;将包含在 BSS 段中。 
例如,声明为 int j 的全局变量;将包含在 BSS 段中。

4、栈: 栈区域传统上与堆区域相邻,并以相反的方向增长;当堆栈指针遇到堆指针时,可用内存已耗尽。(使用现代的大地址空间和虚拟内存技术,它们几乎可以放置在任何地方,但它们通常仍以相反
的方向增长。)堆栈区域包含程序堆栈,这是一种 LIFO 结构,通常位于内存的较高部分。在标准 PC x86 计算机体系结构上,它向零地址增长;在其他一些架构上,它的增长方向相反。“堆栈指针”寄存器跟踪堆栈的顶部;每次将值“推入”堆栈时都会对其进行调整。为一个函数调用推送的一组值称为“堆栈帧”;堆栈帧至少包含一个返回地址。
堆栈,其中存储自动变量,以及每次调用函数时保存的信息。每次调用函数时,返回的地址和调用者环境的某些信息,例如一些机器寄存器,都保存在堆栈中。然后新调用的函数在堆栈上为其自动变量分配空间。这就是 C 中递归函数的工作方式。每次递归函数调用自身时,都会使用一个新的堆栈帧,因此一组变量不会干扰来自另一个函数实例的变量。

5. 堆: 堆是通常发生动态内存分配的段。
堆区域从 BSS 段的末尾开始,并从那里增长到更大的地址。Heap area 由 malloc、realloc、free 管理,可以使用 brk 和 sbrk 系统调用来调整其大小(注意使用 brk/sbrk 和单个“heap area”不是必须履行的契约malloc/realloc/free;它们也可以使用 mmap 来实现,以将虚拟内存的潜在不连续区域保留到进程的虚拟地址空间中)。堆区域由进程中的所有共享库和动态加载的模块共享。