Go切片作为函数参数时的一些思考

330 阅读4分钟

本文主要围绕切片在传参是是传递引用还是传递值,许多人会认为切片作为函数参数时传递的是引用,其实这是不正确的。

一句话总结:Go语言中的函数传参方式全部都是值传递,不存在引用传递

原理

Go语言中的切片事实上就是是一个结构体,其运行时结构如下:

 type slice struct {
     array unsafe.Pointer
     len   int
     cap   int
 }

这一点非常重要,这也就意味着,将切片作为函数参数时,其传递机制与结构体传递机制一样,都是值传递,也即传递的是原切片的拷贝。

另外一个非常重要的点就是,切片结构体中的array是一个指针,意味着array的值是底层数组的地址,通过函数传参后,这个值依然没有改变。

因此可以看到,当把切片作为函数参数传递时,在函数中对切片进行某些修改操作,会影响到函数外的原始切片。

看个栗子

先看一段代码:

 func main() {
     var arr = []int{1, 2, 3, 4, 5}
     fmt.Printf("arr pointer: %p\n", &arr)
     test(arr)
     fmt.Printf("arr: %v\n", arr)
 }
 ​
 ​
 func test(data []int) {
     fmt.Printf("data pointer: %p\n", &data)
     data[0] = 100
 }

问题:

  1. 请问上述代码中arr pointer:data pointer:的输出是相同的吗?
  2. 请问上述代码中arr:打印的结果是多少?也即函数中对切片的修改会不会影响到函数外的原切片?

答案:

  1. 输出中arr pointer:data pointer:的值不相同,这很好理解,这是因为切片是值传递,传递给函数的时候,重新创建了一个新的切片结构体,那么二者的地址当然不一样了。
  2. 打印的结果是arr: [100 2 3 4 5],也就证明了对切片的修改会影响到原切片。也正是这个原因导致很多人误以为切片作为函数参数时是引用传递,其实这种理解是错误的。

再看个栗子

这个栗子我们使用unsafe.Sizeof()函数直接打印各个变量所占空间的大小

 func main() {
     s1 := []int{1, 2, 3, 4, 5}
     a1 := [5]int{1, 2, 3, 4, 5}
     p1 := Person{}
     p2 := &Person{}
     p3 := new(Person)
     m1 := make(map[string]int)
     m2 := map[string]int{
         "a": 1,
         "b": 2,
         "c": 3,
     }
     fmt.Println(unsafe.Sizeof(s1)) // 24 = 3 * 8
     fmt.Println(unsafe.Sizeof(a1)) // 40
     fmt.Println(unsafe.Sizeof(p1)) // 32 = 4 * 8
     fmt.Println(unsafe.Sizeof(p2)) // 8
     fmt.Println(unsafe.Sizeof(p3)) // 8
     fmt.Println(unsafe.Sizeof(m1)) // 8
     fmt.Println(unsafe.Sizeof(m2)) // 8
 }
 
 
type Person struct{
	attr1 int
	attr2 int
	attr3 int
	attr4 int
}

由于在64位系统上,uintptrint都是占用8字节,所以在这个例子中,p2、p3这两个指针所占空间都是8字节。

而结构体遍历会根据其所包含的属性来确定所占空间大小,因此,p1占32个字节(4*8)。

再看s1这个切片,它占24个字节(3 * 8),正好印证了前文所说的切片的底层结构是由三个成员属性组成的结构体这个说法。

最后看一下 m1 和 m2 这两个map,它们占用都是8字节,也就是说,它们其实是指针,所以map传参时,虽然也是值传递,但这个传递的值是指针,也就是地址值,在函数体中操作map会影响到函数外的map,所以看上去像是“引用传递”,其实究其根源,还是值传递。

所以,切片在传参时,是使用与结构体相同的传参方式,即传值方式。而且,Go语言中也只有值传递,没有引用传递。

最后

最后,我想说的是,如果你确定编写的函数需要将切片的修改影响到函数外的原始切片,那么你的函数参数应该使用指针。

希望现在你可以清楚地回答下面的问题了

 // 代码一
 func main() {
     var arr = []int{1, 2, 3, 4, 5}
     fmt.Printf("arr pointer: %p\n", &arr)
     test(&arr)
     fmt.Printf("arr: %v\n", arr)
 }
 ​
 func test(data *[]int) {
     fmt.Printf("data pointer: %p\n", data)
     (*data)[0] = 100
 }
 // 代码二
 func main() {
     var arr = []int{1, 2, 3, 4, 5}
     fmt.Printf("arr pointer: %p\n", &arr)
     test(&arr)
     fmt.Printf("arr: %v\n", arr)
 }
 ​
 func test(data *[]int) {
     fmt.Printf("data pointer: %p\n", data)
     *data = append(*data, 100)
     (*data)[0] = 100
 }

问题:

  1. 请问上述代码中arr pointer:data pointer:的输出是相同的吗?
  2. 请问上述代码中arr:打印的结果是多少?

彩蛋

附属小问题:

 var arr = []int{1, 2, 3, 4, 5}
 fmt.Printf("arr pointer: %p\n", arr)
 fmt.Printf("arr pointer: %p\n", &arr)

上面👆🏻代码中两行输出语句的区别是什么?

答案:对于切片来说,使用%p格式化输出时,如果前面不加取地址符,那么打印的是切片中第一个元素的地址;如果前面加上取地址符&,那么打印的是该切片的地址。