编译优化| 青训营笔记

110 阅读3分钟

这是我参与「第五届青训营」伴学笔记创作活动的第 11 天

下面相关内容仅供本人回顾使用。如有错误,烦请评论反馈,感激不尽!!!

技术前瞻:

image.png

  • 重要的系统软件

    • 识别符合语法和非法的程序
    • 生成正确且高效的代码
  • 分析部分:(前端 front end)

    • 词法分析:生成词素(lexeme)
    • 语法分析:生成语法树
    • 语义分析:收集类型信息,进行语义检查
    • 中间代码生成:生成intermediate representation(IR)
  • 综合部分:(后端 back end)

    • 代码优化:机器无关代码,生成优化后的IR
    • 代码生成:生成目标代码

静态分析

控制流和数据流

静态分析 :不执行程序代码,推导程序的行为,分析程序的性质。

常见的两种分析

  • 控制流:程序执行的流程
  • 数据流:数据在控制流上的传递

控制流图示:

image.png

通过分析控制流和数据流,我们可以知道更多关于程序的性质(properties) ,根据这些性质优化代码。

过程内分析和过程间分析

过程内分析:仅在函数内部进行分析

过程间分析:考虑过程调用时参数传递和返回值的数据流和控制流

过程间分析的难点:

  • 需要通过数据流分析得知i的具体类型,才能知道i.foo()调用的是哪个foo()
  • 根据i的具体类型,产生了新的控制流A.foo(),分析继续
  • 过程间分析需要同时分析控制流和数据流——联合求解,比较复杂

Go编译器优化

编译优化的思路:

  • 场景:面向后端长期执行任务

  • Tradeoff:用编译时间换取更高效的机器码 Beast mode:

  • 函数内联

  • 逃逸分析

  • 默认栈大小调整

  • 边界检查消除

  • 循环展开,等

函数内联 inlining

内联的定义:将被调用函数的函数体(callee)的副本替换到调用位置(caller)上,同时重写代码以反映参数的绑定

优点

  • 清除函数调用开销,例如传递参数、保存寄存器等
  • 将过程间分析转化为过程内分析,帮助其他优化,例如逃逸分析

逃逸分析解释:分析代码中指针的动态作用域:指针在何处可以被访问

// 一个使用micro-benchmark的性能测试
func BenchmarkInline(b *testing.B) {
    x := genInteger()
    y := genInteger()
    for i := 0; i < n.N; i++ {
        addInline(x, y)
    }
}

func addInline(a, b int) int {
    return a + b
}

func BenchmarkInlineDisabled(b *testing.B) {
	x := genInteger()
    y := genInteger()
    for i := 0; i < n.N; i++ {
        addNoInline(x, y)
    }
}

// go:noinline
func addNoInline(a, b int) int {
    return a + b
}
// 大约可以提升4.58倍的性能

缺点

  • 函数体变大,instruction cache不友好(大概就是会占用很多的意思)
  • 编译生成的Go镜像变大(时间换空间的感觉)

函数内联在大多数情况下是正向优化

Beast Mode

  • Go函数内联受到的限制较多
    • 语言特性,例如interface,defer等,限制了函数内联
    • 内联策略非常保守
  • Beast mode:调整函数内联的策略,使更多函数被内联
    • 降低函数调用的开销
    • 增加了其他优化机会:逃逸分析
  • 开销:
    • Go镜像增加约10%
    • 编译时间增加 相当于是一个折中的方法。

该种方法下的逃逸分析大致思路: