这是我参与「第五届青训营 」伴学笔记创作活动的第 10 天
课堂笔记
本堂课重点内容
- 如何检测性能
- 性能优化的方式
详细知识点介绍
简介
- 性能优化的前提是满足正确可靠、简洁清晰等质量因素
- 性能优化是综合评估,有时候时间效率和空间效率可能对立
- 针对Go语言特性,介绍Go相关的性能优化建议
Benchmark
如何使用
- 性能表现需要实际数据衡量
- Go语言提供了支持基准性能测试的benchmark工具
go test -bench=. -benchmem
结果说明
BenchmarkFib是测试函数名
-8表示GOMAXPROCS的值为8
- 在1.5版本后默认为cpu的核数
- 1855870表示执行次数,即b.N
- 602.5 ns/op 每次执行花费602.5ns
- 0 B/op 每次申请多大的内存
- 0 allcocs/op 每次执行申请几次内存
Slice 预分配内存
- 尽可能在使用make()初始化切片时提供容量信息
func NoPreAlloc(size int) { data := make([]int, 0) for k := 0; k < size; k++ { data = append(data, k) } }
- 331.1ns/op
- 2040B/op
func PreAlloc(size int) { data:=make([]int,0, size) for k := 0; k < size; k++ { data = append(data, k) } }
- 107.1 ns/op
- 896 B/op
大内存未释放
在已有切片基础上创建切片,不会创建新的底层数组
场景
- 原切片较大,代码在原切片基础上新建小切片
- 原底层数组在内存中有引用,得不到释放
可使用copy替代re-slice
func GetLastByslice(origin []int) []int { return origin[len(origin)-2:] } func GetLastByCopy(origin []int) []int { result := make([]int, 2) copy(result, origin[len(origin)-2:]) return result }
map
map预分配内存
func NoPreAlloc(size int) { data := make(map[int]int) for i := 0; i < size; i++ { data[i] = i } } func PreAlloc(size int) { data := make(map[int]int, size) for i := 0; i < size; i++ { data[i] = i } } 分析
- 不断向map中添加元素的操作会触发map的扩容
- 提前分配好空间可以减少内存拷贝和Rehash的消耗
- 建议根据实际需求提前预估好需要的空间
字符串处理
string.Builder
func Plus(n int,str string)string{
s:=""
for i := 0; i < n; i++{
s+=str
}
return s
}
func StrBuilder(n int ,str string)string{
var builder strings.Builder
for i:=0;i < n; i++{
builder.WriteString(str)
}
return builder.String()
}
结论
- 使用+拼接性能最差,strings.Builder,.bytes.Buffer相近,strings.Buffer更快
分析
- 字符串在Go语言中是不可变类型,占用内存大小是固定的
- 使用+每次都会重新分配内存
- strings.Builder,.bytes.Buffer底层都是[]byte数组
- 内存扩容策略,不需要每次拼接重新分配内存
空结构体
空结构体struct{}实例不占据任何的内存空间
可作为各种场景下的占位符使用
- 节省资源
- 空结构体本身具备很强的语义,即这里不需要任何值,仅作为占位符
func EmptyStructMap(n int) {
m := make(map[int]struct{})
for i := 00; i < n; i++ {
m[i] = struct{}{}
}
}
func BoolMap(n int) {
m := make(map[int]bool)
for i := 0; i < n; i++ {
m[i] = false
}
}
atomic包
- 锁的实现是通过操作系统来实现,属于系统调用
- atomic操作是通过硬件实现,效率比锁高
- sync.Mutex应该用来保护一段逻辑,不仅仅用于保护一个变量
- 对于非数值操作,可以使用atomic.Value,能承载一个interface{}
总结
- 避免常见的性能陷阱可以保证大部分程序的性能
- 普通应用代码,不要一味地追求程序的性能
- 越高级的性能优化手段越容易出现问题
- 在满足正确可靠、简洁清晰的质量要求的前提下提高程序性能
实践练习例子
课后个人总结
- 进行性能判断
- 进行性能优化的方式