这是我参与「第五届青训营 」伴学笔记创作活动的第4天,今天主要学习了go语言开发中的规范,以及代码性能提升和错误排查的技术。
高质量编程
编码规范
代码格式
使用gofmt自动格式化代码
注释
注释应该做到
- 解释代码的作用
- 解释代码的逻辑
- 解释代码实现的原因
- 解释代码出错的情况
命名规范
- 简洁胜于冗长
- 缩略词全大写,但当其位于变量开头且不需要导出时,使用全小写
- 例如使用ServeHTTP而不是ServeHttp
- 使用XMLHTTPRequest或者xmIHTTPRequest
- 变量距离其被使用的地方越远,则需要携带越多的.上下文信息
- 全局变量在其名字中需要更多的_上下文信息,使得在不同地方可以轻易辨认出其含义
控制流程
- 避免嵌套,保持正常流程清晰,例如去掉不必要的
else - 尽量保持正常代码路径为最小缩进,能对称就对称
- 故障问题的大多出现在复杂的条件语句和循环语句中,尽量化简
错误和异常处理
-
简单错误:指仅出现一次的错误,且在其他地方不需要捕获该错误
-
优先使用
errors.New来创建匿名变量来直接表示简单错误 -
如果有格式化需求,请使用
fmt.Errorf-
// 一个例子 func defaultCheckRedirect(req *Request, via []*Request) error { if len(via) >= 10 { // 使用errors.New return errors.New("stopped after 10 redirects.") } return nil // 去掉不必要的else } 复制代码 -
错误的
Wrap与Unnwrap:- 错误的
Wrap实际上是提供了一个error嵌套另一个error的能力,从而生成一个error跟踪链 - 在
fmt.Errorf中使用%w关键字来将一个错误关联至错误链中 -
// 一个例子 list, _, err := c.GetBytes(cache.Subkey(a.actionID, "srcfiles")) if err != nil { return fmt.Errorf("reading srcfiles list: %w", err) } 复制代码
- 错误的
-
错误判定:
-
判定一个错误是否为特定错误,用
errors.ls,不同于使用==,该方法可以判定错误链上的所有错误是否含有特定的错误// 一个例子 data, err = lockedfile.Read(targ) if errors.Is(err, fs.ErrNotExist) { return []byte{}, nil } return data, err 复制代码 -
在错误链上获取特定种类的错误,使用
errors.As// 一个例子 if _, err := os.Open("non-existing"); err != nil { var pathError *fs.PathError if errors.As(err, &pathError) { fmt.Println("Failed at path:", pathError.Path) } else { fmt.Println(err) } }
-
-
panic:比错误更严重,表示程序无法正常工作,在业务代码中不建议使用,故不展开介绍。
-
recover:与panic对应,如果需要更多的上下文信息可以在recover后在log中记录当前的调用栈
生效条件:
- 只能在被defer的函数中使
- 嵌套无法生效
- 只在当前goroutine生效
- 注意defer是一个栈
-
性能优化建议
简介:
- 性能优化的前提是满足正确可靠、简洁清晰等质量因素
- 性能优化是综合评估,有时候时间效率和空间效率可能对立,所谓时间换空间空间换时间
Benchmark
性能表现需要实际数量来衡量,Go语言提供了支持基准性能测试的benchmark工具
// 一个例子
// from fib.go
func Fib(n int) int {
if n < 2 {
return n
}
return Fib(n - 1) + Fib(n - 2)
}
// from fib_test.go
func BenchmarkFib10(b *testing.B) {
// run the Fib funciton b.N times
for n := 0; n < b.N; n++ {
Fib(10
}
}
通过go test -bench=. -benchmen来进行测试
运行结果说明:
Slice预分配内存
尽可能在使用make()初始化切片的时候就提供容量信息,执行时间会差很多
究其原因是因为
- 切片本质是一个数组片段的描述包括数字指针、片段的长度以及片段的容量
- 切片操作并不复制切片指向的元素
- 创建一个新的切片会复用原来切片的底层数组
另一个陷阱:大内存未释放
有一种情况,原切片由大量元素构成,但是我们在原切片的基础上切片,虽然只使用了很小一段,但底层数组在内存中仍然占据了大量的空间,得不到释放。
这个时候我们可以用copy代替re-slice
Map预分配内存
与Slice相似地,如果初始化size也可以很大程度上优化性能,分析如下:
- 不断向map中添加元素会触发map的扩容
- 提前分配好空间可以减少内存拷贝和Rehash的消耗
strings.Builder
在字符串拼接的过程中,使用strings.Builder往往比直接+要快,分析如下:
- 字符串在Go语言中是不可变类型,占用内存大小是固定的
- 使用
+每次都会重新分配内存 strings.Builder, bytes.Buffer底层都是[]byte数组- 内存扩容策略,不需要每次拼接重新分配内存
// 一个strings.Builder例子
func StrBuilder(n int, str string) string {
var builder strings.Builder
for i := 0; i < n; i++ {
builder.WriteString(str)
}
return builder.String()
}
空结构体
使用空结构体节省内存,分析如下:
-
空结构体
struct{}实例不占据任何的内存空间 -
可作为各种场景下的占位符使用
- 节省资源
- 空结构体本身具备很强的语义,不需要任何值,仅作为占位符
// 一个例子
func EmptyStructMap(n int) {
m := make(map[int]struct{})
for i := 0; i < n; i++ {
m[i] = struct{}{}
}
}
func BoolMap(n int){
m := make(map[int]bool)
for i := 0; i < n; i++ {
m[i] = false
}
}
// 比较性能即可
atomic包
即原子变量与原子操作;
- atomic提供的原子操作能够确保任意时刻只有一个goroutine对变量进行操作
- 善用atomic能够避免程序中出现大量的锁操作
- 锁的实现是通过操作系统来实现,属于系统调用
- atomic操作是通过硬件实现,效率显然高
atomic的常见操作:
- 增减
- 载入 read
- cas
- 交换
- 存储 write
// 一个例子
var x int32 = 100
// atomic内部是一个compare ans swap, 简称cas, 会在加减操作之前先比较old new两个值再进行操作
// 而sync.Mutex应该用于保护一段逻辑,而不是仅仅一个变量
func f_add() {
atomic.AddInt32(&x, 1)
}
func f_sub() {
atomic.AddInt32(&x, -1)
}
func main() {
for i := 0; i < 100; i++ {
f_add()
f_sub()
}
fmt.Printf("x: %v\n", x)
}
// 对于非数值操作,可以使用atomic.Value,能承载一个interface{}
性能调优
pprof
- 希望知道应用在什么地方耗费了多少CPU、Memory
- pprof是用于可视化和性能分析数据的工具
排查实战
在浏览器中打开http://localhost:6060/debug/pprof, 这就是我们刚刚引|入的net/http/pprof注入的入口了。 页面上展示了可用的程序运行采样数据,下面也有简单说明, 分别是:
- allocs:内存分配情况
- blocks:阻塞操作情况
- cmdline:程序启动命令集
- goroutine:当前所有goroutine的堆栈信息
- heap:堆上内存使用情况(同alloc)
- mutex:锁竞争操作情况
- profile: CPU占用情况
- threadcreate: 当前所有创建的系统线程的堆栈信息
- trace:程序运行跟踪信息
CPU
命令行输入go tool pprof "http://localhost:6060/debug/pprof/profile?seconds=10"进入pprof编辑模式
首先,输入
top,查看CPU占用最高的函数,这五列从左到右分别是:
- Flat:当前函数的占用
- Flat%: Flat占总量的比例
- Sum%:上面所有行的Flat%总和
- Cum (Cumulative) :当前函数加上其调用函数的总占用
- Cum%: Cum占总量的比例
然后使用list命令,后面接top排查出来的高占有率的名称,进行代码定位
Heap-堆内存
命令行输入go tool pprof -http=:8080 "http://localhost: 6060/debug/pprof/heap"打开pprof自带的web UI,可以更加直观的观看性能分布。
左上角view选项可以切换视图,更加直观的显示问题所在。
在堆内存采样中,默认展示的是inuse——space视图,只展示当前持有的内存,但如果有的内存已经被释放,这是inuse采样就不会展示了。我们切换到alloc——space指标。后续分析alloc的内存问题。(用于排除一直申请但又马上释放的代码)
goroutine
命令行输入go tool pprof -http=:8080 "http://localhost: 6060/debug/pprof/goroutine"
mutex
命令行输入go tool pprof -http=:8080 "http://localhost: 6060/debug/pprof/mutex"
block
命令行输入go tool pprof -http=:8080 "http://localhost: 6060/debug/pprof/block"
原理
了解即可,就没有过多深入