性能优化指南|青训营笔记

84 阅读4分钟

``这是我参与「第五届青训营 」伴学笔记创作活动的第 15 天

一、本堂课重点内容:

  • 高质量编程

二、详细知识点介绍:

  • 高质量编程

1.3 性能优化建议

简介

  • 性能优化的前提是满足正确可靠、简洁清晰等质量因素
  • 性能优化是综合评估,有时候时间效率和空间效率可能对立
  • 针对Go语言特性,介绍Go相关的性能优化建议

1.3.1 性能优化建议——Benchmark

如何使用

  • 性能表现需要实际数据衡量
  • Go语言提供了支持基准性能测试的benchmark工具

例子:

image.png

运行

go test -bench=,-benchmem

结果说明

image.png

  • BenchmarkFib10-8:BenchmarkFib10是测试函数名,-8表示GOMAXPROCS的值为8
  • 1855870:表示一共执行1855870次,即b.N的值
  • 602.5ns/op:每次执行花费602.5ns
  • 0 B/op:每次执行申请多大的内存
  • 0 allocs/op:每次执行申请几次内存

GOMAXPROCS 1.5版本后,默认值为CPU核数

1.3.2 性能优化建议——Slice

slice预分配内存

  • 尽可能在使用make()初始化切片时提供容量信息

例子:

func NoPreAlloc(size int){
    data := make([]int, 0)
    for k := 0; k < size; k++ {
        data = append(data, k)
    }
}
func PreAlloc(size int){
    data := make([]int, 0, size)
    for k := 0; k < size; k++ {
        data = append(data, k)
    }
}

测试结果:

image.png

image.png

ueokande.github.io/go-slice-tr…

如上图所示,slice容量足够时会将b直接放入slice,而若容量不够会先有一次扩容的操作,造成一定程度上的时间损耗。

  • 切片本质是一个数组片段的描述

包括数组指针、片段的长度、片段的容量(不改变内存分配情况下的最大长度)

image.png

  • 切片操作并不复制切片指向的元素
  • 创建一个新的切片会复用原来切片的底层数组

另一个陷阱:大内存未释放

  • 在已有切片的基础上创建切片,不会创建新的底层数组
  • 场景:

原切片较大,代码在原切片基础上新建小切片。

此时原底层数组在内存中有引用,得不到释放。

  • 解决方案:可使用copy替代re-slice

例子:

image.png

测试函数:

image.png

运行

go test -run=.-v

结果:

image.png

1.3.3 性能优化建议——Map

map预分配内存

例子:

image.png

image.png

测试结果:

image.png

分析:

  • 不断向map中添加元素的操作会触发map的扩容
  • 提前分配好空间可以减少内存拷贝和Rehash的消耗
  • 建议根据实际需求提前预估好需要的空间

1.3.4 性能优化建议——字符串处理

使用strings.Builder

  • 常见的字符串拼接方式

image.png

image.png

image.png

测试结果:

image.png

  • 使用 + 拼接性能最差,strings.Builder,bytes.Buffer 相近,strings.Builder更快
  • 分析:字符串在Go语言中是不可变类型,占用内存大小是固定的,使用+每次都会重新分配内存。而strings.Builder, bytes.Buffer底层都是[]byte数组,内存扩容策略,不需要每次拼接重新分配内存。
  • 为什么strings.Builder比bytes.Buffer更快?

image.png

image.png

  • bytes.Buffer转化为字符串时重新申请了一块空间
  • strings.Builder直接将底层的[]bytes转换成了字符串类型返回

使用预分配能进一步提高字符串拼接的效率

例子:

image.png

image.png

测试结果:

image.png

1.3.5 性能优化建议——空结构体

使用空结构体节省内存

  • 空结构体struct{}实例不占据任何的内存空间
  • 可作为各种场景下的占位符使用。 ①:节省资源 ②:空结构体本身具备很强的语义,即这里不需要任何值,仅作为占位符

image.png

测试结果:

image.png

  • 实现Set,可以考虑用map来代替
  • 对于这个场景,只需要用到map的键,而不需要值
  • 即使是将map的值设置成bool类型,也会多占据1字节空间

一个开源实现:github.com/deckarep/go…

1.3.6 性能优化建议-atomic包

如何使用atomic包

例子: image.png

image.png

测试结果: image.png

可以看到,使用Atomic包的时间性能比加锁好很多。

  • 锁的实现是通过操作系统实现,属于系统调用
  • atomic操作是通过硬件实现,效率比锁高
  • sync.Mutex应该用来保护一段逻辑,不仅仅用于保护一个变量
  • 对于非数值操作,可以使用atomic.Value,能承载一个interface{}

小结

  • 避免常见的性能陷阱可以保证大部分程序的性能
  • 普通应用代码不要一味地追求程序的性能
  • 越高级的性能优化手段越容易出现问题
  • 在满足正确可靠、简洁清晰的质量要求前提下提高程序性能

三、引用参考: