Go - slice 实现原理

Slice依托数组实现，底层数组对用户屏蔽，在底层数组容量不足时可以实现自动重分配并生成新的Slice。接下来按照实际使用场景分别介绍其实现机制。

一、slice的数据结构

源码包中 src/runtime/slice.go:slice 定义了Slice的数据结构：

type slice struct   {
    array   unsafe.Pointer
    len         int
    cap         int                     
}

从数据结构看Slice很清晰:

array指针指向底层数组
len表示切片长度
cap表示底层数组容量。

二、使用make创建Slice

使用make来创建Slice时，可以同时指定长度和容量，创建时底层会分配一个数组，数组的长度即容量。

例如：语句 slice := make([]int, 5, 10) 所创建的Slice

结构如下图所示：

该Slice长度为5，即可以使用下标slice[0] ~ slice[4]来操作里面的元素，capacity为10

表示后续向 slice添加新的元素时可以不必重新分配内存，直接使用预留内存即可。

三、使用数组创建Slice

使用数组来创建Slice时，Slice将与原数组共用一部分内存。

例如，语句 slice := array[5:7] 所创建的Slice

结构如下图所示：

切片从数组array[5]开始，到数组array[7]结束（不含array[7]），即切片长度为2

数组后面的内容都作为切片的预留内存，即capacity为5。

数组和切片操作可能作用于同一块内存，这也是使用过程中需要注意的地方。

四、Slice扩容

使用append向Slice追加元素时，如果Slice空间不足，将会触发Slice扩容。扩容实际上重新一配一块更大的内存，将原Slice数据拷贝进新Slice，然后返回新Slice 扩容后再将数据追加进去。

例如，当向一个capacity为5，且length也为5的Slice再次追加1个元素时，就会发生扩容

如下图所示：

扩容操作只关心容量，会把原Slice数据拷贝到新Slice，追加数据由append在扩容结束后完成。

上图可见，扩容后新的Slice长度仍然是5，但容量由5提升到了10，原Slice的数据也都拷贝到了新Slice指向的数组中。

扩容容量的选择遵循以下规则：

如果原Slice容量小于1024，则新Slice容量将扩大为原来的2倍；
如果原Slice容量大于等于1024，则新Slice容量将扩大为原来的1.25倍；

使用append()向Slice添加一个元素的实现步骤如下：

假如Slice容量够用，则将新元素追加进去，Slice.len++，返回原Slice
原Slice容量不够，则将Slice先扩容，扩容后得到新Slice
将新元素追加进新Slice，Slice.len++，返回新的Slice。

五、Slice Copy

使用copy()内置函数拷贝两个切片时，会将源切片的数据逐个拷贝到目的切片指向的数组中，拷贝数量取两个切片长度的最小值。

例如长度为10的切片拷贝到长度为5的切片时，将会拷贝5个元素，也就是说copy过程中不会发生扩容。

六、特殊切片

跟据数组或切片生成新的切片一般使用 slice := array[start:end]方式，这种新生成的切片并没有指定切片的容量，实际上新切片的容量是从start开始直至array的结束。

比如下面两个切片，长度和容量都是一致的，使用共同的内存地址：

    sliceA  :=  make([]int, 5,  10)
    sliceB  :=  sliceA[0:5]

根据数组或切片生成切片还有另一种写法，即切片同时也指定容量，即slice[start:end :cap]

其中cap即为新切片的容量，当然容量不能超过原切片实际值，如下所示：

                
sliceA  :=  make([]int, 5,  10) //length=5; capacity=10
sliceB  :=  sliceA[0:5]         //length=5; capacity=10                     
sliceC  :=  sliceA[0:5:5]       //length=5; capacity=5

七、编程Tips

创建切片时可跟据实际需要预分配容量，尽量避免追加过程中扩容操作，有利于提升性能；
切片拷贝时需要判断实际拷贝的元素个数
谨慎使用多个切片操作同一个数组，以防读写冲突