C语言篇:内联函数

12 阅读8分钟

重要提醒,本文涉及许多C语言的高级概念,比如声明、定义、链接类型等。如果你不了解这些概念,可以先阅读我的另外一篇文章《C语言篇:语法进阶》。

内联替换

内联替换是一种常见的编译时优化方法,通过把函数调用原地替换为对应函数的代码,来避免函数调用产生的上下文切换开销,从而加快程序的运行速度。虽然内联替换省去了上下文切换的指令,但是每个替换处都会生成一份函数指令的副本。一般来说,如果函数指令较多且多次被内联替换,会显著增加可执行文件的体积,这是一种用空间换时间的优化策略。

C语言在 C99 标准引入了 inline 关键字,用来指示一个函数需要被内联替换。这个关键字是从 C++ 抄过来的,但二者的语法和机制有很大不同,下文会详细说明。

内联函数跟带参数的宏在作用机制上很像,都是用代码替换来避免函数调用,但是宏替换发生在预处理阶段,只是简单的文本处理,没有语法信息,而内联替换发生在编译阶段,可以享受到函数的所有好处,比如类型检查、参数传递等。

抽丝剥茧

基础认识

虽然原理很简单,但是考虑到C语言的语法交互以及C语言编译器的特性,内联函数绝不是只在函数前面加个 inline 就完事了。

首先,内联替换是在编译阶段完成的,而C语言的编译以单个源文件为单位,也就是说,内联函数的定义与使用必须在同一个源文件内。这点与 static 函数非常像,于是理所当然地可以在任何 static 函数前面加上 inline 使其变成内联函数(不过后面我会告诉你这样做毫无意义)。

但是 inline 只是一个建议,而不是必须执行的命令,因为有些函数无法或很难被内联替换,只有在编译时才能知道一个函数能不能被内联替换,我们在编码时是不能确定的,所以必须做两手准备,内联函数必须既可以作为普通函数提供函数调用,也可以被直接替换。

困境

对于 static inline 函数来说,这两个方面互不冲突。如果不能内联替换,它就是个普通的 static 函数;如果可以内联替换,它就是一个替换模板。

但是 static 函数只能用在源文件内部,如果我们写了一个库,向外提供了一个函数,并且希望它能享受到内联替换的速度优势,该怎么做呢?

最简单的做法就是把 static inline 函数的定义放在头文件里,这样它就会成为每个包含它的源文件的内部函数,并且可以被内联替换。但是这样做有一个严重的问题,如果这个函数最终没有被内联替换,那么就相当于往所有这些源文件里都塞了一个相同 static 函数,与使用单个外部函数(外部链接的函数)比起来,这增大了可执行文件的体积并且减慢了编译速度。

于是人们试图寻找一种方法,对于跨源文件的内联函数,当它无法被内联替换时,让它变成普通的外部函数。

但是这跟我们前面的要求产生了冲突。作为替换模板,它必须在每个源文件中被定义;但作为提供函数调用的外部函数,它无法被重复定义。所以必须对现有语法进行修改才能满足我们的要求。

解决方案

C++ 的方式非常简单直接,允许外部链接的内联函数被重复定义,在编译时它们互不影响,在链接时被合并成一个外部函数。因此在 C++ 里,你可以直接给一个外部函数加上 inline ,然后放在头文件里。

C语言则选择了一个非常蹩脚的方案,后面会详细介绍。它没有链接时的内联函数合并,而是要求程序员显式提供一个外部定义(外部链接的函数的定义)。

深入理解

事实上,一个函数是否可以或是否应该被内联替换,完全取决于编译器。编译器基本上会完全忽略 inline 的内联语义,一个函数即使没加 inline 也会在合适的情况下被内联替换,即使加了 inline 编译器也可以选择不内联替换。因此给 static 函数加 inline 是没有任何意义的,加或不加生成的汇编代码完全一样。

不过 inline 并没有像 register 那样一无是处。不管编译器多么牛逼,只要它还是按单个源文件进行编译的,就必须要看到函数定义才能进行内联替换,而这样就会遇到前面提过的重复定义的问题,就需要手动利用 inline 来解决。可以看出,虽然 inline 的目的是实现内联函数,但它的直接语义早已不是建议内联替换,而是允许重复定义。

语法

由于给 static 函数加 inline 是没有意义的,所以下文只介绍外部链接的内联函数。

首先,为了进行内联替换,如果一个函数的声明带有 inline ,则这个函数必须在此源文件内定义。

为了解决重复定义的问题,C语言标准专门发明一个概念叫做 “内联定义”内联定义不是外部定义,所以可以在不同的源文件内重复定义,因为它们代表不同的函数。当一个内联函数被调用时,编译器既可以选择用它的内联定义进行内联替换,也可以选择用它的外部定义生成一个函数调用。

因为内联定义不是外部定义,所以必须为内联函数提供一个专门的外部定义,否则会遇到链接错误。

示例如下:

// main.c

#include <stdio.h>

// inline definition
inline int fn() {
    return 1;
}

int main() {
    printf("%d\n", fn());
    return 0;
}
// fn.c

// external definition
int fn() {
    return 1;
}

有趣(迷惑)的是,虽然 main.c 中的 fn() 是个内联定义,但它声明了一个外部链接的函数,所以才能在 main() 函数中使用它(C语言中的标识符必须先声明再使用)。也就是说,这个标识符能代表两个函数(内联定义或外部定义),具体代表哪个由编译器说了算。

如果用 gcc -S (生成汇编代码,默认不开优化,即没有内联替换)编译 main.c,你会发现在 main.s 文件中根本没有函数 fn 的代码(因为内联定义不提供函数调用,只在编译时作为替换模板,编译结束后就没用了,直接删掉以减小体积),但 main 函数中有一条 fncall 指令。如果没有编译链接 fn.c ,就会因为找不到 fn 的定义而链接错误。

如果用 gcc -S -O1 (开启优化,包括内联替换)编译,你会发现 fncall 指令没了,被立即数替代。

为了保证内联定义和外部定义具有完全相同的行为,C语言标准禁止在外部链接的内联函数中创建静态生存期的变量(使用 static ),也禁止使用内部链接的标识符(还是用 static )。

比如:

extern void ex_fn();
static void st_fn();

extern int ex_var;
static int st_var;

inline void in_fn() {
    int in_var;           // valid
    static int in_st_var; // invalid
    in_var = ex_var;      // valid
    in_var = st_var;      // invalid
    ex_fn();              // valid
    st_fn();              // invalid
}

最初的示例有一个巨大的缺陷,为了实现跨源文件的内联函数,我必须在一个单独的源文件中维护一个外部定义。如果我修改了内联定义(一般放在头文件中,所有调用者同步),但忘记同步修改外部定义,那么是否进行内联替换就会产生不同的行为。

为了解决需要维护两份函数定义的问题,C语言标准又加入了新的规则。在一个源文件内,如果一个函数的所有文件作用域(为了加快处理速度)的声明都带 inline 并且都不带 extern ,它才是一个内联定义。也就是说,在已经有内联定义的情况下,我只需要再写一个声明,把 inline 去掉,或者加个 extern (或者都搞一下),就可以把这个内联定义变成外部定义。

最佳实践

在头文件中定义内联函数,除了 inline 以外什么都不加。

// sum.h

#pragma once

inline int sum(int l, int r) {
    return l + r;
}

在对应的源文件中包含该头文件,再写一个带 extern 的函数声明,这样就把头文件中的内联定义转换为了外部定义。既提供了外部定义,又不需要维护另一个函数。我选择加 extern 而不是删掉 inline ,因为一个普通的函数声明无法引起程序员的注意,可能以为没用就删了,需要 inline 来提示代码意图。

尽管如此还是非常地反直觉,因为 extern 本来表示声明一个在其他源文件中被定义的函数,但在这里却表示一个内联函数的外部定义在此源文件内。

// sum.c

#include "sum.h"

extern inline int sum(int l, int r);

其他源文件直接包含该头文件并使用内联函数。

// main.c

#include <stdio.h>

#include "sum.h"

int main() {
    printf("%d\n", sum(1, 2));
    return 0;
}