數組類型的值(以下簡稱數組)的長度是固定的,而切片類型的值(以下簡稱切片)是可變長的。
數組的長度在聲明它的時候就必須給定,并且之后不會再改變
。可以說,數組的長度是其類型的一部分。比如,[1]string和[2]string就是兩個不同的數組類型。
切片的類型字面量中只有元素的類型,而沒有長度
。切片的長度可以自動地隨著其中元素數量給的增長而增長,但不會隨著元素數量的減少而減小。
我們其實可以把切片看做是對數組的一層簡單的封裝,因為在每個切片的底層數據結構中,一定會包含一個數組。數組可以被叫做切片的底層數組,而切片也可以被看作是對數組的某個連續片段的引用。
也正因為如此,Go 語言的切片類型屬于引用類型,同屬引用類型的還有字典類型、通道類型、函數類型等;而 Go 語言的數組類型則屬于值類型,同屬值類型的有基礎數據類型以及結構體類型。
注意,Go 語言里不存在像 Java 等編程語言中令人困惑的“傳值或傳引用”問題。在 Go 語言中,我們判斷所謂的“傳值”或者“傳引用”只要看被傳遞的值的類型就好了。
如果傳遞的值是引用類型的,那么就是“傳引用”。如果傳遞的值是值類型的,那么就是“傳值”。
從傳遞成本的角度講,引用類型的值往往要比值類型的值低很多
。我們在數組和切片之上都可以應用索引表達式,得到的都會是某個元素。我們在它們之上也都可以應用切片表達式,也都會得到一個新的切片。
我們通過調用內建函數len
,得到數組和切片的長度。通過調用內建函數cap
,我們可以得到它們的容量。
數組的容量永遠等于其長度,都是不可變的。切片的容量卻不是這樣,并且它的變化是有規律可尋的。
怎樣正確估算切片的長度和容量?
package mainimport "fmt"func main() {
// 示例 1。s1 := make([]int, 5)fmt.Printf("The length of s1: %d\n", len(s1))fmt.Printf("The capacity of s1: %d\n", cap(s1))fmt.Printf("The value of s1: %d\n", s1)s2 := make([]int, 5, 8)fmt.Printf("The length of s2: %d\n", len(s2))fmt.Printf("The capacity of s2: %d\n", cap(s2))fmt.Printf("The value of s2: %d\n", s2)
}
首先,我用內建函數make聲明了一個[]int類型的變量s1。我傳給make函數的第二個參數是5,從而指明了該切片的長度。我用幾乎同樣的方式聲明了切片s2,只不過多傳入了一個參數8以指明該切片的容量。
那切片s1和s2的容量都是多少?
答案:切片s1和s2的容量分別是5和8。
問題解析
s1的容量為什么是5呢?
因為我在聲明s1的時候把它的長度設置成了5。當我們用make函數初始化切片時,如果不指明其容量,那么它就會和長度一致。如果在初始化時指明了容量,那么切片的實際容量也就是它了。這也正是s2的容量是8的原因。
上述內容提到過,可以把切片看做是對數組的一層簡單的封裝,因為在每個切片的底層數據結構中,一定會包含一個數組。數組可以被叫做切片的底層數組,而切片也可以被看做是對數組的某個連續片段的引用。
在這種情況下,切片的容量實際上代表了它的底層數組的長度,這里是8。
可以這樣想:有一個窗口,你可以通過這個窗口看到一個數組,但是不一定能看到該數組中的所有元素,有時候只能看到連續的一部分元素。
現在,這個數組就是切片s2的底層數組,而這個窗口就是切片s2本身。s2的長度實際上指明的就是這個窗口的寬度,決定了你透過s2,可以看到其底層數組中的哪幾個連續的元素。
由于s2的長度是5,所以你可以看到底層數組中的第 1 個元素到第 5 個元素,對應的底層數組的索引范圍是 [0, 4]。
切片代表的窗口也會被劃分成一個一個的小格子,就像我們家里的窗戶那樣。每個小格子都對應著其底層數組中的某一個元素。
我們繼續拿s2為例,這個窗口最左邊的那個小格子對應的正好是其底層數組中的第一個元素,即索引為0的那個元素。因此可以說,s2中的索引從0到4所指向的元素恰恰就是其底層數組中索引從0到4代表的那 5 個元素。
請記住,當我們用make函數或切片值字面量(比如[]int{1, 2, 3})初始化一個切片時,該窗口最左邊的那個小格子總是會對應其底層數組中的第 1 個元素。
但是當我們通過切片表達式基于某個數組或切片生成新切片的時候,情況就變得復雜起來了。
s3 := []int{1, 2, 3, 4, 5, 6, 7, 8}
s4 := s3[3:6]
fmt.Printf("The length of s4: %d\n", len(s4))
fmt.Printf("The capacity of s4: %d\n", cap(s4))
fmt.Printf("The value of s4: %d\n", s4)
切片s3中有 8 個元素,分別是從1到8的整數。s3的長度和容量都是8。然后,我用切片表達式s3[3:6]初始化了切片s4。問題是,這個s4的長度和容量分別是多少?
這并不難,用減法就可以搞定。首先你要知道,切片表達式中的方括號里的那兩個整數都代表什么。我換一種表達方式你也許就清楚了,即:[3, 6)。
這是數學中的區間表示法,常用于表示取值范圍。由此可知,[3:6]要表達的就是透過新窗口能看到的s3中元素的索引范圍是從3到5(注意,不包括6)。
這里的3可被稱為起始索引,6可被稱為結束索引。那么s4的長度就是6減去3,即3。因此可以說,s4中的索引從0到2指向的元素對應的是s3及其底層數組中索引從3到5的那 3 個元素。
前面提到過,切片的容量代表了它的底層數組的長度,但這僅限于使用make函數或者切片值字面量初始化切片的情況。
更通用的規則是:一個切片的容量可以被看作是透過這個窗口最多可以看到的底層數組中元素的個數。
由于s4是通過在s3上施加切片操作得來的,所以s3的底層數組就是s4的底層數組。
又因為,在底層數組不變的情況下,切片代表的窗口可以向右擴展,直至其底層數組的末尾。
所以,s4的容量就是其底層數組的長度8,減去上述切片表達式中的那個起始索引3,即5。
注意,切片代表的窗口是無法向左擴展的。也就是說,我們永遠無法透過s4看到s3中最左邊的那3個元素。
最后,順便提一下把切片的窗口向右擴展到最大的方法。對于s4來說,切片表達式s4[0:cap(s4)]就可以做到。我想你應該能看懂。該表達式的結果值(即一個新的切片)會是[]int{4, 5, 6, 7, 8},其長度和容量都是5。
怎樣估算切片容量的增長?
一旦一個切片無法容納更多的元素,Go 語言就會想辦法擴容。但它并不會改變原來的切片,而是會生成一個容量更大的切片,然后將把原有的元素和新元素一并拷貝到新切片中。在一般的情況下,你可以簡單地認為新切片的容量(以下簡稱新容量)將會是原切片容量(以下簡稱原容量)的 2 倍
。
但是,當原切片的長度(以下簡稱原長度)大于或等于1024時,Go 語言將會以原容量的1.25倍作為新容量的基準(以下新容量基準)
。新容量基準會被調整(不斷地與1.25相乘),直到結果不小于原長度與要追加的元素數量之和(以下簡稱新長度)。最終,新容量往往會比新長度大一些,當然,相等也是可能的。
另外,如果我們一次追加的元素過多,以至于使新長度比原容量的 2 倍還要大,那么新容量就會以新長度為基準。
注意,與前面那種情況一樣,最終的新容量在很多時候都要比新容量基準更大一些。更多細節可參見runtime包中 slice.go 文件里的growslice及相關函數的具體實現。
切片的底層數組什么時候會被替換?
確切地說,一個切片的底層數組永遠不會被替換。為什么?雖然在擴容的時候 Go 語言一定會生成新的底層數組,但是它也同時生成了新的切片。
它只是把新的切片作為了新底層數組的窗口,而沒有對原切片,及其底層數組做任何改動。
請記住,在無需擴容時,append函數返回的是指向原底層數組的新切片,而在需要擴容時,append函數返回的是指向新底層數組的新切片。所以,嚴格來講,“擴容”這個詞用在這里雖然形象但并不合適。不過鑒于這種稱呼已經用得很廣泛了,我們也沒必要另找新詞了。
只要新長度不會超過切片的原容量,那么使用append函數對其追加元素的時候就不會引起擴容。這只會使緊鄰切片窗口右邊的(底層數組中的)元素被新的元素替換掉。
文章學習自郝林老師的《Go語言36講》